KZ | RU | EN
Параллельный корпус – это совокупность оригинального текста и его переводов. Цель создания Параллельного подкорпуса на базе Национального корпуса казахского языка – разработка лингвистической платформы для изучения казахского языка путем формирования базы переведенных и выровненных текстов казахского языка с их эквивалентами на других языках. Параллельный подкорпус включает в себя базу выровненных текстов, разметку, метаразметку и поисковую систему. На первом этапе в текстовую базу подкорпуса вошли произведения художественной литературы и официально-делового стиля. Выровненные тексты подверглись морфологическому анализу на обоих языках. Метаразметка художественного текста включают 28 параметров: автор оригинального текста, название оригинального текста, язык оригинального текста, источник оригинального текста, дата публикации оригинального текста, количество страниц в оригинальном тексте, количество словоупотреблений в оригинальном тексте, год рождения автора оригинального текста, пол автора оригинального текста, стиль оригинального текста, тип оригинального текста, автор перевода, название переведенного текста, язык переведенного текста, источник переведенного текста, дата публикации переведенного текста, количество страниц в переведенном тексте, количество словоупотреблений в переведенном тексте, год рождения автора перевода, пол автора перевода, стиль переведенного текста, тип переведенного текста, способ перевода, структурный уровень перевода, имя и фамилия редактора (выравнивателя) текста, дата выравнивания текста, имя и фамилия лица, внесшего текст в корпус, дата внесения текста в корпус.

HTML tutorial  

HTML tutorial  

HTML tutorial  

HTML tutorial  

HTML tutorial  

HTML tutorial  

HTML tutorial  

HTML tutorial  

HTML tutorial  





Loading...

×

Word data will appear here

×

Word data will appear here