KZ | RU | EN
Добро пожаловать на сайт Национального корпуса казахского языка! На сайте корпуса собран электронный текстовый фонд казахского языка. Объём текстов корпуса составляет 40 миллионов. Тексты собраны из пяти стилевых разновидностей казахского языка (художественный стиль, научный стиль, публицистический стиль, официально-деловой стиль, разговорный стиль). В корпусе можно выполнять поиск по слову и словоформе (форме слова) и просматривать список предложений, в которых употребляется искомое слово, а также их источники. По найденному слову/словоформе или по любому слову в примерах предоставляется информация, относящаяся ко всем уровням языка. Корпусом могут пользоваться носители казахского языка и изучающие казахский язык.


НОВОСТИ



7.04.2026 – В рамках проекта программно-целевого финансирования «ИРН BR21882227 «Совершенствование Национального корпуса казахского языка (НККЯ) как средства межкультурной коммуникации и расширение его подкорпусов» (2023–2025) разработан корпус интернет-текстов (объем – 100 миллионов словоупотреблений).

17.03.2025 – Разработан интерфейс интерактивного учебного внутреннего корпуса Learner’s Corpus, предназначенного для обучения казахскому языку англоязычных учащихся. Работа выполнена в рамках программно-целевого финансирования (2024–2026) по проекту ИРН BR24993244 «Совершенствование Национального корпуса казахского языка как основы мегапроекта Smart-текстов и казахоязычного искусственного интеллекта, разработка его подкорпусов».

09.12.2024 – Создан шестиязычный параллельный внутренний корпус, содержащий базу данных, где варианты одного и того же текста представлены на казахском, английском, турецком, узбекском, уйгурском и азербайджанском языках. Работа выполнена в рамках программно-целевого финансирования (2024–2026) по проекту ИРН BR24993244 «Совершенствование Национального корпуса казахского языка как основы мегапроекта Smart-текстов и казахоязычного искусственного интеллекта, разработка его внутренних корпусов».

18.11.2024 – Собраны ошибки из различных письменных работ (диктант, эссе, изложение, экзаменационные ответы, учебник, газета, социальные сети). Они были классифицированы по типам ошибок (орфографические, пунктуационные, грамматические, стилистические, лексические, технические, когнитивные), снабжены обоснованием и размещены на сайте НККЯ как отдельный подкорпус (Корпус ошибок). Работа выполнена в рамках программно-целевого финансирования (2024–2026) по проекту ИРН BR24993244 «Совершенствование Национального корпуса казахского языка как основы мегапроекта Smart-текстов и казахоязычного искусственного интеллекта, разработка его внутренних корпусов».

16.10.2024 – Собраны и включены в базу данных НККЯ терминологические тексты. (ИРН BR21882249 выполнено по проекту программно-целевого финансирования «Совершенствование и расширение подкорпусов Национального корпуса казахского языка (НККЯ) как средства межкультурной коммуникации» (2023-2025).

8.10.2024 – Запущена оригинальная версия Учебного подкорпуса. (ИРН BR18574183 выполнено по проекту программно-целевого финансирования «Автоматическое распознавание казахского текста: разработка лингвистических модулей и IT-решений» (2023-2024).

2.10.2024. – Современный поэтический подкорпус разработан (выполнено по проекту ИРН BR21882249 "Совершенствование и расширение подкорпусов Национального корпуса казахского языка (НККЯ) как средства межкультурной коммуникации" (2023–2025).

2.10.2024 - В корпус поговорок и пословиц добавлено поисковое поле по тематико-семантическим группам (выполнено по проекту ИРН BR21882227 "Лингвистические средства и разработки модернизации языкового сознания в контексте нового Казахстана" (2023–2025).

25.09.2024 – База ономастического корпуса обновлена (выполнено по проекту ИРН BR21882249 "Совершенствование и расширение подкорпусов Национального корпуса казахского языка (НККЯ) как средства межкультурной коммуникации" (2023–2025).

12.09.2024 – Историко-поэтический корпус подготовлен и включён в базу (выполнено по проекту ИРН BR21882249 «Совершенствование и расширение подкорпусов Национального корпуса казахского языка (НККЯ) как средства межкультурной коммуникации » (2023–2025).

6.09.2024 – Сайт Национального корпуса казахского языка переведён на новый дизайн, улучшен интерфейс.

22.08.2024 - Полные названия сокращённых названий регионов приведены, база Диалектного подкорпуса обновлена.

10.05.2024 – Корпус фразеологизмов разработан (выполнено по проекту ИРН BR21882227 "Лингвистические средства и разработки модернизации языкового сознания в контексте нового Казахстана" (2023–2025).

05.02.2024 - В параллельныйподкорпус введены сопоставленные тексты в деловом стиле.

19.01.2024 – Корпус текстов писателей включён в базу Национального корпуса казахского языка (выполнено по проекту ИРН BR21882249 « Совершенствование и расширение подкорпусов Национального корпуса казахского языка (НККЯ) как средства межкультурной коммуникации" (2023–2025).

15.05.2023 – Создан корпус по произведениям А. Байтұрсынұлы.

20.05.2023 – Корпус рекламных текстов включён в базу Национального корпуса казахского языка (выполнено по проекту ИРН BR18574132 «Разработка культурно-репрезентативного и рекламных корпусов текстов» (2023–2024).

29.05.2023 - Культурно-семантическая маркировка внедрена в тексты лингвокультурного корпуса, запущена функция загрузки видеозаписей.

28.05.2023 - Создан и запущен онлайн Лингвокультурный подкорпус (выполнено по проекту ИРН BR18574132 "Разработка подкорпуса культурно-репрезентативного подкорпуса и подкорпуса рекламных текстов» (2023–2024).

20.05.2023 - Корпус поговорок и пословиц создан и запущен.

18.05.2023 - Создана пробная версия сайта Ономастического подкорпуса, включён в базу Национального корпуса.

2.05.2023 - Сайт устного корпуса создан и включён в состав Национального корпуса казахского языка. К устным текстам добавлена просодическая разметка (выполнено по проекту ИРН BR11765619 «Разработка Национального корпуса казахского языка как информационно-инновационной базы государственного языка: научно-исследовательский и образовательный интернет-ресурс» (2022–2023).

10.10.2022 - Тексты историческогопод корпуса включены в базу (выполнено по проекту ИРН BR11765619 «Разработка Национального корпуса казахского языка как информационно-инновационной базы государственного языка: научно-исследовательский и образовательный интернет-ресурс» (2022–2023).

5.05.2022 - Параллельный подкорпус создан и включён в базу по художественному стилю (выполнено по проекту ИРН BR11765619 «Разработка Национального корпуса казахского языка как информационно-инновационной базы государственного языка: научно-исследовательский и образовательный интернет-ресурс» (2022–2023).

1.02.2022 - Диалектологический корпус создан и запущен.

12.11.2021 – Подкорпуса, классифицированнные по 5 стилям казахского языка, объединены и включены в Основной корпус.

15.11.2021 - Дизайн сайта Национального корпуса казахского языка обновлён, интерфейс усовершенствован для удобства пользователей.

5.10.2021 - Создан реестр словоформ текстов Корпуса с возможностью поиска слов по реестру.

28.09.2021 - Реализован поиск по формам словоизменения казахского языка.

26.11.2020 - Текущие работы по усовершенствованию Корпуса отражены на новой странице раздела новостей.

26.11.2020 - В руководство по программным способам копирования текста при поиске пользователем нужного слова добавлена дополнительная информация.

25.08.2020 - Введена страница Глоссария, описывающая понятия корпусной лингвистики.

25.08.2020 - Обеспечена возможность вывода статистики найденных данных по искомому слову.

19.08.2020 - Программное обеспечение предусматривает поиск примеров не только по корневым словам, но и по их изменённым формам – добавлено поле «Поиск по словоформе».

16.08.2020 - По каждому подкорпусу была усоврешенствованан поисковая система по метаразметке.

15.08.2020 - Тексты казахского языка, собранные в общей базе, распределены по отдельным подкорпусам в зависимости от 5 стилей, и для каждого реализована возможность поиска.

15.08.2020 - Запущен интерфейс корпуса на русском и английском языках.

1.08.2020 - Под руководством директора Института языкознания А.М. Фазылжановой дизайн и интерфейс сайта Корпуса обновлены и представлены для широкого использования под доменом www.qazcorpus.kz.