NATIONAL CORPUS OF THE KAZAKH LANGUAGE

ЖАЛПЫ МӘЛІМЕТ

Spoken Subcorpus – Kazakh тіліндегі ауызша сөйленген сөздердің (аудио/бейнежазбалардың) транскрибациясы, орфоэпиясы, аудиосы теңестіріле салынған электронды деректер базасы. ҚТҰК-ның ауызша ішкорпусын жасаудың мақсаты – Kazakh тілінің ауызша тіл ерекшеліктерін зерттеуде, қазақтілді Colloquial технологияларын жасауда деректер базасы ретінде қолдануға мүмкіндік беретін, ішкі және сыртқы белгіленім қамтылған Kazakh тілінің ауызша сөз үлгілерінің қоры болып табылатын электронды деректер базасын жасау. ҚТҰК-ның ауызша ішкорпусының көмегімен Kazakh тілінің ұлттық ауызша тілінің машығын тануға, меңгеруге, зерттеуге; белгілі тұлғалардың тілін, сөз стилін зерттеуге; Kazakh тілінің орфоэпиялық нормасына сай ауызша Colloquial дағдысын меңгеруге; жасалым, айтылым, естілім бойынша фонетикалық, орфоэпиялық талдаулар жасауға; ауызша сөздің үдерістерін анықтауға; Kazakh тілінің аймақтық сөз ерекшеліктерін анықтауға; лингвоәлеуметтік ерекшеліктерді тануға; Kazakh тілін үйренуде тыңдалым, айтылым, естілім дағдысын дамытуға; Colloquial процесі үстіндегі просодикалық белгіленімнің көрінісі мен сипатын тануға болады. Ауызша ішкорпустың іздеу жүйесі сөз, әрі метабелгіленім арқылы іздеуге мүмкіндік береді. Мақсатыңызға қарай іздеу жүйесінің қай түрін таңдасаңыз да, нәтижесінде метабелгіленім, белгіленім және сол сөздің орфографиясы, сөйлеушінің орфоэпиясы мен сөздің нормаға түскен орфоэпиясы қолжетімді. Сондай-ақ сілтеме арқылы ауызша ішкорпуста қамтылған мәтіндердің бейнежазбасын көруге әрі сөзжазбасын тыңдауға мүмкіндік бар. Ауызша ішкорпустың мәтіндік базасы – сөйлеушінің орфоэпиясы, сөздің орфоэпиялық нормасы көрсетілген (76 сұхбат) және орфографиясы жазылған (60 сұхбат) жалпы 136 сұхбаттан тұрады. Word usage count: 1 000 000.