KZ | RU | EN
Welcome to the website of the Main Corpus of the Kazakh Language! The Main Corpus is an IT resource for scientific research and education, representing an electronic collection of texts drawn from five functional styles of the Kazakh language: literary (fiction), scientific, publicistic, official-business, and colloquial styles. The purpose of the Main Corpus is to serve as a textual data source covering all stylistic layers of the Kazakh language, presenting the language as an integrated and holistic system. The total size of the corpus is 31,105,900 word usages. The Main Corpus includes a search system that allows users to search by word and word form (inflected form). The Main Corpus supports several types of linguistic annotation: morphological, semantic, lexical, phonetic, and phonological. These annotations provide information about the queried word at all levels of language analysis: Morphological annotation: the analyzer automatically segments a word/word form into stem and affixes (lemmatization), assigns a part of speech to the stem (lemma), and provides grammatical descriptions of affixes. Lexical annotation: displays all dictionary meanings of a word from explanatory dictionaries. Phonetic annotation: provides the orthoepic form of a word and automatically divides it into syllables, describing syllable types. Phonological annotation: presents the phonemic characteristics of the sounds within a word. Each text included in the Main Corpus is supplied with metadata (meta-annotation). The metadata window opens on a separate page when the cursor is placed over the author’s name. Users can search for words using various metadata parameters, including text author, text title, author’s gender, text style, target audience, distribution type, time period, topic, and full source reference. Если нужно — сделаю короче для главной страницы, маркетинговую версию, или строгий вариант для гранта/отчёта.


Морфологиялық белгіленімдер (Морфологические разметки) (Morphological markings):



Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 зт. The Noun существительное noun
2 сн. The Adjective прилагательное adjective
3 са. The Numeral числительное numeral
4 ес. The Pronoun местоимение pronoun
5 ет. The Verb глагол verb
6 үс. The Adverb наречие adverb
7 шл. The Conjunction, The Particle служебные слова syntactic words
8 ел. The Onomatopoeia сөздер звукоподражательные слова onomatopoeic words
9 од. The Interjection междометия interjections
10 мд. модаль сөздер модальные слова modal words
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ӨАС Атау септік именительный Nominative case
2 ІС Ілік септік родительный Genitive case
3 БС Барыс септік дательный Dative case
4 ТС Табыс септік винительный Accusative case
5 ЖС Жатыс септік местный Locative case
6 ШС Шығыс септік исходный Ablative case
7 КС Көмектес септік творительный Instrumental case
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 Ж Жекеше единственное число singular
2 К Көпше множественное число plural
3 КЖ Көптік жалғау окончание множественного числа plural ending
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ТЖ-1 Тәуелдік жалғау, 1-жақ ПО-1 PP-1
2 ТЖ-2 Тәуелдік жалғау, 2-жақ ПО-2 PP-2
3 ТЖ-3 Тәуелдік жалғау, 3-жақ ПО-3 PP-3
4 ТФ Тәуелдік форма ПФ PF
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ЖЖ-1 Жіктік жалғау, 1-жақ ЛО-1 PP-1
2 ЖЖ-2 Жіктік жалғау, 2-жақ ЛО-2 PP-2
3 ЖЖ-3 Жіктік жалғау, 3-жақ ЛО-3 PP-3
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 СШ Comparative degree СС CD
2 КШ Intensifying degree ПС SD
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ӨШ ЖӨШ Өткен шақ ПВ PT
2 ОШ Осы шақ НВ PT
3 КШ Келер шақ БВ FT
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ӨАР Ашық рай Изъяв Ind
2 БР Бұйрық рай Пов Imp
3 ҚР Қалау рай Жел Opt
4 ШР Шартты рай Усл Con
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 БЖ Болымсыздық жұрнақ Отрицательный суффикс NS
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 ТЕ Тұйық The Verb ИФ VN
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 Е Есімше П P
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 К Көсемше Д Adv
Шартты белгілері (Условные обозначения) Word class (Части речи) Орысша атаулары (названия на русском языке) Халықаралық шартты белгісі (Международный стандарт разметки)
1 СФ (-дай/дей) Салыстыру формасы СФ CF
2 ҰФ (-ша/ше) Ұқсату формасы ҰФ AF
3 ЖФ (-сыз/сіз) Жоқтық форма ОФ NF
4 ИФ (-лы/лі) Иелік форма ИФ PF
5 ҚФ (-ғы/гі) Қатыстық форма ҚФ RF
6 СУФ (-лық/лік) Субстантив форма СФ SF
7 АТР (-лық/лік) Атрибут анықтағыш форма АТР ATR
8 ӨФ (-шы/ші) Функционалды қосымшалар (Өтіну формасы) ФП FR
9 СБФ (-сы/сі; -сын/сін) Субъектив форма СФ SF