KZ | RU | EN
Қазақ тілінің Подкорпус пословиц и поговорок сайтына қош келдіңіз! Мақал-мәтелдер ішкорпусы – Казах тіліндегі қордаланған мақал-мәтелдердің Поиск жүйесіне бағындырылған, лингвомәдени/этнолингвистикалық ақпарат (түсіндірме) беретін электрондық база. Мақал-мәтелдер ішкорпусын жасаудың мақсаты – мақал-мәтелдерді сақтау және жас ұрпаққа, мақал-мәтел іздеуші кез келген қолданушыға түсіндірмесі берілген мақал-мәтелдер легін тез әрі оңай тауып беру. Мақал-мәтелдер ішкорпусына академик Әбдуәли Қайдардың «Халық даналығы» еңбегіндегі және жүзтомдық «Бабалар сөзі» сериясының ішіндегі мақал-мәтелдер алынды. Қазіргі кезде мақал-мәтелдер корпусында 3000-нан аса мақал-мәтел уәждік түсіндірмесімен енгізілген. Количество использований слова - 138 647.


ЖАЛПЫ МӘЛІМЕТ



Қазақ тілінің ұлттық корпусы (ҚТҰК) – Казах тілінің лексика-грамматикалық жүйесін толық қамтыған (терең аннотацияланған) миллиондаған сөзқолданыстан тұратын электронды пішіндегі көлемді мәтіндер жинағы, Казах тілі жайлы барлық мәліметтерді жинақтаушы «ақылды», мамандандырылған білім қоры.

Қазақ тілінің ұлттық корпусы қазіргі кезде белгілі бір мақсатта арнайы әзірленген 16 ішкорпустан тұрады.
Жалпы сөзқолданыс саны – 65 000 000.

Основной корпус – ғылыми зерттеу және оқыту IT-ресурсы ретіндегі Казах тілінің 5 стилінен (көркем әдебиет стилі, ғылыми стиль, публицистикалық стиль, ісқағаз стилі, разговорный стилі) алынған мәтіндердің электронды жиынтығы.

Негізгі корпустың мақсаты – бір тілдің біртұтас бейнесін танытатын Казах тіліндегі барлық стильдік қабаттарды қамтитын мәтіндер дереккөзі болу.

Негізгі корпустың мәтіндер базасының жалпы көлемі – 31 105 900 сөзқолданыс.

Основной корпус сөз, сөзформа (сөз түрленімі) бойынша іздеу жүйесінен тұрады.

Негізгі корпуста және сондай-ақ барлық ішкорпустарда морфологиялық, семантикалық, лексикалық, фонетика-фонологиялық белгіленім түрлері жұмыс істейді. Бұл белгіленімдер іздеу жасалған сөз туралы тілдің барлық деңгейі бойынша ақпарат береді:

Морфологиялық белгіленімде анализатор сөзді/сөзформаны автоматты түрде түбір мен қосымшаға бөліп (лемматизация), түбірге (леммаға) сөз табын қояды. Қосымшалардың грамматикалық сипаттамасын береді.

Лексикалық белгіленім сөздердің түсіндірме сөздіктегі барлық мағынасын көрсетеді.

Фонетикалық белгіленімде сөз орфоэпиясы беріліп, автоматты түрде буынға бөлінеді, буын түрлері сипатталады.

Фонологиялық белгіленімде сөз құрамындағы дыбыстардың фонемалық сипаттамасы беріледі.

Ішкорпустарға енгізілген әрбір мәтіннің дереккөзі (метабелгіленімі) бар. Метабелгіленім терезесі (мәтін авторы, мәтін аты, автор жынысы, мәтін стилі, аудиториясы, таралым типі, мерзімі, тақырыбы, толық дереккөзі т.б.) курсорды авторға нұсқаған кезде екінші беттен ашылады.

Корпусты пайдаланушы метабелгіленім түрлері бойынша қажетті сөзді іздей алады.