НАЦИОНАЛЬНЫЙ КОРПУС КАЗАХСКОГО ЯЗЫКА

ОБЩАЯ ИНФОРМАЦИЯ

Устный подкорпус – Электронная база данных, содержащая устную речь на казахском языке (аудио- и видеозаписи), в которой транскрипция, орфоэпия и аудио представлены в синхронизированном виде. Цель создания устного подкорпуса Национального корпуса казахского языка (НККЯ) — формирование электронной базы данных устных речевых образцов казахского языка с внутренней и внешней разметкой, предназначенной для исследования особенностей устной речи и разработки казахоязычных речевых технологий. Устный подкорпус позволяет: изучать, осваивать и анализировать национальные особенности устной речи казахского языка; исследовать язык и речевой стиль отдельных личностей; формировать навыки устной речи в соответствии с орфоэпическими нормами; проводить фонетический и орфоэпический анализ по параметрам произношения, артикуляции и восприятия; выявлять процессы устной речи; определять региональные языковые особенности; изучать лингвосоциальные характеристики; развивать навыки аудирования и говорения при изучении языка; анализировать просодические характеристики речи. Поисковая система подкорпуса поддерживает поиск по словам и метаразметке. В результатах поиска доступны метаразметка, лингвистическая разметка, орфографическая форма слова, орфоэпия говорящего и нормативная орфоэпическая форма. Также предусмотрена возможность просмотра видеозаписей и прослушивания аудиоматериалов по ссылкам. Текстовая база устного подкорпуса включает всего 136 интервью: 76 интервью содержат орфоэпию говорящего и нормативную орфоэпию; 60 интервью представлены в орфографической записи. Общее количество словоупотреблений — 1 000 000.