KZ | RU | EN
Добро пожаловать в Устный подкорпус казахского языка! Устный подкорпус — это электронная база данных транскрипции, орфоэпии и аудиосопоставления произнесенных слов (аудио/видео) на казахском языке. Цель создания Устного подкорпуса КТНК — создание электронной базы данных, представляющей собой хранилище образцов разговорной казахской речи, содержащих внутреннюю и внешнюю нотацию, что позволит использовать её в качестве базы данных при изучении особенностей разговорного казахского языка, а также при разработке казахских разговорных технологий.


ОБЩАЯ ИНФОРМАЦИЯ



Устный подкорпус – Электронная база данных, содержащая устную речь на казахском языке (аудио- и видеозаписи), в которой транскрипция, орфоэпия и аудио представлены в синхронизированном виде. Цель создания устного подкорпуса Национального корпуса казахского языка (НККЯ) — формирование электронной базы данных устных речевых образцов казахского языка с внутренней и внешней разметкой, предназначенной для исследования особенностей устной речи и разработки казахоязычных речевых технологий. Устный подкорпус позволяет: изучать, осваивать и анализировать национальные особенности устной речи казахского языка; исследовать язык и речевой стиль отдельных личностей; формировать навыки устной речи в соответствии с орфоэпическими нормами; проводить фонетический и орфоэпический анализ по параметрам произношения, артикуляции и восприятия; выявлять процессы устной речи; определять региональные языковые особенности; изучать лингвосоциальные характеристики; развивать навыки аудирования и говорения при изучении языка; анализировать просодические характеристики речи. Поисковая система подкорпуса поддерживает поиск по словам и метаразметке. В результатах поиска доступны метаразметка, лингвистическая разметка, орфографическая форма слова, орфоэпия говорящего и нормативная орфоэпическая форма. Также предусмотрена возможность просмотра видеозаписей и прослушивания аудиоматериалов по ссылкам. Текстовая база устного подкорпуса включает всего 136 интервью: 76 интервью содержат орфоэпию говорящего и нормативную орфоэпию; 60 интервью представлены в орфографической записи. Общее количество словоупотреблений — 1 000 000.