KZ | RU | EN
Добро пожаловать на сайт Основного корпуса казахского языка! Основной корпус – это электронное собрание текстов, взятых из пяти стилевых разновидностей казахского языка (художественный стиль, научный стиль, публицистический стиль, официально-деловой стиль, разговорный стиль), является IT-ресурсом для научных исследований и обучения. Цель Основного корпуса – служить источником текстов, охватывающих все стилистические уровни казахского языка и представляющих его целостную картину. Общий объем корпуса – 31 105 900 словоупотреблений. Основной корпус оснащен поисковой системой, позволяющей выполнять поиск по словам и словоформам (грамматическим формам слов). В корпусе работают различные виды разметки: Морфологическая разметка автоматически анализирует слово или словоформу, разделяя их на основу и аффиксы (лемматизация), определяет часть речи основы (леммы) и дает грамматическое описание аффиксов. Лексическая разметка показывает все значения слова согласно толковому словарю. Фонетическая разметка включает орфоэпическое представление слова, автоматически делит его на слоги и описывает их типы. Фонологическая разметка предоставляет фонематическое описание звуков, входящих в состав слова. Каждый текст, включенный в Основной корпус, сопровождается метаразметкой (источником данных). Окно метаразметки автоматически открывается на второй странице при наведении курсора на автора. Пользователи Корпуса могут выполнять поиск по метаразметке, включая такие параметры, как автор текста, название текста, пол автора, стиль текста, аудитория, тип распространения, дата, тема, полный источник.


Loading...

×

Word data will appear here

×

Word data will appear here