KZ | RU | EN
Welcome to the Main Corpus of the Kazakh Language! The Main Corpus is an electronic collection of texts from 5 functional styles of the Kazakh language (fiction, scientific, journalistic, official/business, and colloquial), serving as an IT resource for research and education. The purpose of the Main Corpus is to be a text resource that covers all stylistic layers of the Kazakh language and represents a unified picture of the language. The total volume is 31,105,900 word usages. The Main Corpus includes a search system by word and word form (inflection). The Main Corpus operates with morphological, semantic, lexical, and phonetic-phonological annotation types. These annotations provide information about the searched word at all levels of the language: In morphological annotation, the analyzer automatically splits the word/word form into root and affixes (lemmatization) and assigns a part of speech to the root (lemma). It also provides grammatical characteristics of affixes. Lexical annotation shows all meanings of words from explanatory dictionaries. Phonetic annotation provides the orthoepy of the word, automatically divides it into syllables, and describes types of syllables. Phonological annotation provides phonemic characteristics of the sounds within the word. Each text included in the Main Corpus has a source (metadata). The metadata window opens on a separate page when the cursor is pointed at the author. Users of the corpus can search for the required word using metadata types (text author, text title, author gender, text style, audience, distribution type, time period, topic, full source).


Морфологиялық белгіленімдер (Морфологические разметки) (Morphological markings):



Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 зт. The Noun существительное noun
2 сн. The Adjective прилагательное adjective
3 са. The Numeral числительное numeral
4 ес. The Pronoun местоимение pronoun
5 ет. The Verb глагол verb
6 үс. The Adverb наречие adverb
7 шл. The Conjunction, The Particle служебные слова syntactic words
8 ел. The Onomatopoeia сөздер звукоподражательные слова onomatopoeic words
9 од. The Interjection междометия interjections
10 мд. модаль сөздер модальные слова modal words
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ӨАС Атау септік именительный Nominative case
2 ІС Ілік септік родительный Genitive case
3 БС Барыс септік дательный Dative case
4 ТС Табыс септік винительный Accusative case
5 ЖС Жатыс септік местный Locative case
6 ШС Шығыс септік исходный Ablative case
7 КС Көмектес септік творительный Instrumental case
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 Ж Жекеше единственное число singular
2 К Көпше множественное число plural
3 КЖ Көптік жалғау окончание множественного числа plural ending
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ТЖ-1 Тәуелдік жалғау, 1-жақ ПО-1 PP-1
2 ТЖ-2 Тәуелдік жалғау, 2-жақ ПО-2 PP-2
3 ТЖ-3 Тәуелдік жалғау, 3-жақ ПО-3 PP-3
4 ТФ Тәуелдік форма ПФ PF
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ЖЖ-1 Жіктік жалғау, 1-жақ ЛО-1 PP-1
2 ЖЖ-2 Жіктік жалғау, 2-жақ ЛО-2 PP-2
3 ЖЖ-3 Жіктік жалғау, 3-жақ ЛО-3 PP-3
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 СШ Comparative degree СС CD
2 КШ Intensifying degree ПС SD
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ӨШ ЖӨШ Өткен шақ ПВ PT
2 ОШ Осы шақ НВ PT
3 КШ Келер шақ БВ FT
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ӨАР Ашық рай Изъяв Ind
2 БР Бұйрық рай Пов Imp
3 ҚР Қалау рай Жел Opt
4 ШР Шартты рай Усл Con
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 БЖ Болымсыздық жұрнақ Отрицательный суффикс NS
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ТЕ Тұйық The Verb ИФ VN
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 Е Есімше П P
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 К Көсемше Д Adv
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 СФ (-дай/дей) Салыстыру формасы СФ CF
2 ҰФ (-ша/ше) Ұқсату формасы ҰФ AF
3 ЖФ (-сыз/сіз) Жоқтық форма ОФ NF
4 ИФ (-лы/лі) Иелік форма ИФ PF
5 ҚФ (-ғы/гі) Қатыстық форма ҚФ RF
6 СУФ (-лық/лік) Субстантив форма СФ SF
7 АТР (-лық/лік) Атрибут анықтағыш форма АТР ATR
8 ӨФ (-шы/ші) Функционалды қосымшалар (Өтіну формасы) ФП FR
9 СБФ (-сы/сі; -сын/сін) Субъектив форма СФ SF