KZ | RU | EN
Қазақ тілінің ұлттық корпусы сайтына қош келдіңіз! Корпус сайтында қазақ тілінің электронды мәтіндік қоры жинақталған. Корпустағы мәтін көлемі – 40 миллион. Мәтіндер қазақ тілінің 5 стиль түрінен (көркем стиль, ғылыми стиль, публицистикалық стиль, ісқағаз стилі, сөйлеу стилі) жинақталған. Корпустан сөз, сөзформа (сөз түрленімі) бойынша іздеу жүргізіп, іздеген сөзіңіз қолданылған сөйлемдердің тізімін және олардың дереккөзін көре аласыз. Табылған сөз/сөзформа немесе мысалдардағы кез келген сөз туралы тілдің барлық деңгейіне қатысты ақпарат беріледі. Корпусты қазақ тілінде сөйлеушілер мен қазақ тілін үйренушілер қолдана алады.


ЖАҢАЛЫҚТАР



7.04.2026 – «ЖТН BR21882227 «Мәдениетаралық коммуникация құралы ретіндегі Қазақ тілінің ұлттық корпусын (ҚТҰК) жетілдіру және оның ішкорпустарын кеңейту» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы» аясында Интернет мәтіндері корпусы әзірленді (көлемі - 100 миллион сөзқолданыс).

17.03.2025 – Ағылшынтілділерге қазақ тілін үйретуге арналған интерактивті оқу ішкорпусы – Learner’s Corpusтың интерфейсі әзірленді. (ЖТН BR24993244 «Қазақ тілі ұлттық корпусын Smart-мәтіндер мегажобасы және қазақтілді жасанды интеллект негізі ретінде жетілдіру, ішкорпустарын әзірлеу» атты (2024-2026) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

09.12.2024 – Бір мәтіннің қазақ, ағылшын, түрік, өзбек, ұйғыр, әзербайжан тілдеріндегі нұсқаларын қатар көрсететін дерекқор жинақталған Алты тілді параллель ішкорпус әзірленді. (ЖТН BR24993244 «Қазақ тілі ұлттық корпусын Smart-мәтіндер мегажобасы және қазақтілді жасанды интеллект негізі ретінде жетілдіру, ішкорпустарын әзірлеу» атты (2024-2026) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

18.11.2024 – Әртүрлі жазба жұмыстарынан (диктант, эссе, мазмұндама, емтихан жауаптары, оқулық, газет, әлеуметтік желі) қателер жинақталды. Қате түрлері (орфографиялық, пунктуациялық, грамматикалық, стилистикалық, лексикалық, техникалық, когнитивтік) бойынша сұрыпталып, негіздемелері жасалып, ҚТҰК сайтына жеке ішкорпус (Қателер ішкорпусы) ретінде орналастырылды. (ЖТН BR24993244 «Қазақ тілі ұлттық корпусын Smart-мәтіндер мегажобасы және қазақтілді жасанды интеллект негізі ретінде жетілдіру, ішкорпустарын әзірлеу» атты (2024-2026) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

16.10.2024 – Терминологиялық ішкорпус мәтіндері жинақталып, ҚТҰК базасына енгізілді. (ЖТН BR21882249 «Мәдениетаралық коммуникация құралы ретіндегі Қазақ тілінің ұлттық корпусын (ҚТҰҚ) жетілдіру және оның ішкорпустарын кеңейту» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

8.10.2024 – Оқу ішкорпусының бастапқы нұсқасы іске қосылды. (ЖТН BR18574183 «Қазақ мәтінін автоматты тану: лингвистикалық модульдер мен IT-шешімдер әзірлемесі» (2023-2024) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

2.10.2024. – Заманауи поэтикалық ішкорпус әзірленді. (ЖТН BR21882249 «Мәдениетаралық коммуникация құралы ретіндегі Қазақ тілінің ұлттық корпусын (ҚТҰҚ) жетілдіру және оның ішкорпустарын кеңейту» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

2.10.2024 - Мақал-мәтелдер ішкорпусына тақырыптық-семантикалық топтар бойынша іздеу ұяшығы қосылды. (ЖТН BR21882227 «Жаңа Қазақстан контекстінде тілдік сананы жаңғыртудың лингвистикалық құралдары мен әзірлемелерін жасау» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

25.09.2024 – Ономастикалық корпус базасы жаңартылды. (ЖТН BR21882249 «Мәдениетаралық коммуникация құралы ретіндегі Қазақ тілінің ұлттық корпусын (ҚТҰҚ) жетілдіру және оның ішкорпустарын кеңейту» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

12.09.2024 – Тарихи-поэтикалық ішкорпус дайындалып, корпус базасына қосылды. (ЖТН BR21882249 «Мәдениетаралық коммуникация құралы ретіндегі Қазақ тілінің ұлттық корпусын (ҚТҰҚ) жетілдіру және оның ішкорпустарын кеңейту» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

6.09.2024 – Қазақ тілінің ұлттық корпусы сайты жаңа дизайнға ауыстырылып, интерфейсі жетілдірілді.

22.08.2024 - Қысқартырылған өлке атауларының толық атауы беріліп, Диалектологиялық ішкорпус базасы жаңартылды.

10.05.2024 – Фразеологизмдер ішкорпусы әзірленді. (ЖТН BR21882227 «Жаңа Қазақстан контекстінде тілдік сананы жаңғыртудың лингвистикалық құралдары мен әзірлемелерін жасау» (2023-2025) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

05.02.2024 - Параллель ішкорпусқа іскери стиль бойынша теңестірілген мәтіндер енгізілді.

19.01.2024 – Жазушылар ішкорпусы ҚТҰК базасына енгізілді. (ЖТН BR21882249 «Мәдениетаралық коммуникация құралы ретіндегі Қазақ тілінің ұлттық корпусын (ҚТҰҚ) жетілдіру және оның ішкорпустарын кеңейту» атты (2023-2025) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды).

15.05.2023 – А.Байтұрсынұлы еңбектері бойынша ішкорпус әзірленді.

20.05.2023 – Жарнама мәтіндерінің ішкорпусы Қазақ тілінің ұлттық корпусы базасына енгізілді. (ЖТН BR18574132 «Мәдени-репрезентативті және жарнама мәтіндерінің ішкорпустарын әзірлеу» (2023-2024) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды.

29.05.2023 - Мәдени-семантикалық белгіленімдер Лингвомәдени корпус мәтіндеріне енгізілді, бейнежазбалар енгізу қызметі іске қосылды.

28.05.2023 - Лингвомәдени ішкорпус жасалып, онлайн қызметі іске асырылды. (ЖТН BR18574132 «Мәдени-репрезентативті және жарнама мәтіндерінің ішкорпустарын әзірлеу» (2023-2024) атты бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды.

20.05.2023 - Мақал-мәтелдер ішкорпусы жасалып, іске қосылды.

18.05.2023 - Ономастикалық корпустың бастапқы әзірлеме сайты жасалып, Ұлттық корпус базасына қосылды.

2.05.2023 - Ауызша корпус сайты жасалып, Қазақ тілінің ұлттық корпус құрамына енгізілді. Ауызша сөз мәтіндеріне просодикалық белгіленімдер жасалды. (ЖТН BR11765619 «Мемлекеттік тілдің ақпараттық-инновациялық базасы ретіндегі қазақ тілінің ұлттық корпусын әзірлеу: ғылыми-зерттеу және оқыту интернет-ресурсы» атты (2022-2023) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды.

10.10.2022 - Тарихи ішкорпус мәтіндері корпус базасына енгізілді. (ЖТН BR11765619 «Мемлекеттік тілдің ақпараттық-инновациялық базасы ретіндегі қазақ тілінің ұлттық корпусын әзірлеу: ғылыми-зерттеу және оқыту интернет-ресурсы» атты (2022-2023) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды.

5.05.2022 - Параллель ішкорпус жасалып, көркем әдебиет стилі бойынша корпус базасына енгізілді. (ЖТН BR11765619 «Мемлекеттік тілдің ақпараттық-инновациялық базасы ретіндегі қазақ тілінің ұлттық корпусын әзірлеу: ғылыми-зерттеу және оқыту интернет-ресурсы» атты (2022-2023) бағдарламалық-нысаналы қаржыландыру жобасы бойынша орындалды.

1.02.2022 - Диалектологиялық ішкорпус жасалып, іске қосылды.

12.11.2021 – Қазақ тілінің 5 стилі бойынша жіктелген ішкорпустар біріктіріліп, Негізгі корпусқа салынды.

15.11.2021 - Қазақ тілінің ұлттық корпусы сайтының дизайны қолданушыларға тиімді интерфейске ауыстырылып, жаңартылды.

5.10.2021 - Корпус мәтіндерінің сөзформаларының реестр тізімі және реестр сөздер бойынша іздеу (Поиск) жасалды.

28.09.2021 - Қазақ тілінің түрленім формалары бойынша Іздеу (Поиск) жасалды.

26.11.2020 - Корпусты жетілдіру мақсатында жасалып жатқан ағымдағы жұмыстар жаңалықтар ұяшығына жаңа бет болып енгізілді.

26.11.2020 - Пайдаланушыға қажетті сөзді іздеу бойынша мәтінді көшірудің программалық жолдары туралы нұсқаулыққа қосымша ақпарат енгізілді.

25.08.2020 - Корпустық лингвистика ұғымдарын сипаттайтын Глоссарий беті енгізілді.

25.08.2020 - Ізделген сөз бойынша табылған деректер статистикасын шығару мүмкіндігі қамтамасыз етілді.

19.08.2020 - Компьютерлік бағдарламаның түбір сөздерді ғана емес, олардың түрленген формалары бойынша да мысал табу мүмкіндігі қарастырылып, «Сөзформадан іздеу» ұяшығы қосылды.

16.08.2020 - Әрбір ішкорпустан метабелгіленімдер бойынша іздеу жүйесі жетілдірілді.

15.08.2020 - Корпус базасына жинақталған қазақ тілінің бес стилі мәтіндері жеке дара ішкорпустарға жіктеліп берілді және әрбір ішкорпус бойынша іздеу мүмкіндігі жүзеге асырылды.

15.08.2020 - Корпустың орысша және ағылшынша интерфейсі іске қосылды.

1.08.2020 - Тіл білімі институтының директоры А.М.Фазылжанованың басшылығымен корпус сайтының дизайны мен интерфейсі жаңартылып, www.qazcorpus.kz домен атауымен қалың көпшілік пайдалануына ұсынылды.