Жалпы ақпарат

Қазақ тілінің ұлттық корпусы мәтіндік базасының көлемі - 30 миллион сөзқолданыс. Оның ішінде көлемі 14 миллион сөзқолданыстан тұратын мәтінге 16-21 параметрлік метабелгіленім (мәтін авторы, автордың жасы, мәтін тақырыбы, жазылған стилі, жанры, мәтін типі, дереккөзі т.б.) енгізілген. Жинақталған мәтіндер қазақ тілінің 5 стилінен (көркем стиль, ғылыми стиль, публицистикалық стиль, іскери стиль, сөйлеу стилі) алынған.

Көркем стильде жазылған мәтіндер қазақ тілінің белгілі ақын-жазушыларының шығармалары болып табылады. Көркем стильдегі мәтіндер проза және поэзия жанрын қамтиды.

Публицистикалық мәтіндер интернет жүйесіне салынған газет-журналдар мәтіндері болып табылады.

Ғылыми стильдегі мәтіндер негізінен ғылыми-гуманитарлық еңбектерден алынған. Жаратылыстану саласында мәтіндер есеп-қисап, формулаға құрылатындықтан, корпусқа алынбады.

Іскери стильдегі мәтіндер интернет жүйесіндегі іскери құжаттар мәтіндері болып келеді.

Сөйлеу стилі мәтіндеріне интернеттегі газет-журналдарда, сайттарда орналастырылған сұхбаттар алынды.

Сонымен қатар корпусқа оқулық мәтіндері де енгізілген.

Ұлттық корпусқа салынған мәтіндер метамәтіндік белгіленімдермен қамтамасыз етілген, метамәтіндік ақпараттар қажетті сөзді іздеу кезінде курсорды сөйлемдердің жоғарғы жағындағы авторға нұсқап, тінтуірдің сол жақ батырмасын басқан кезде терезеде ашылып көрінеді.

Корпустан қажет сөзді іздеу барысында төмендегідей программалар жұмыс істейді:

Бұл ақпараттар да қажетті сөзді іздеу кезінде курсорды сөзге нұсқап, тінтуірдің сол жақ батырмасын басқан кезде терезеде ашылып көрінеді.

Сонымен, ұлттық корпуста компьютерлік бағдарлама бойынша қандай да бір сөзді іздегенде, экранға ең алдымен сол сөз кездесетін (метабелгіленімі берілген) мәтіндер, яғни мысалдар тізімі шығады. Сонымен қатар экранның екінші бетіне әртүрлі ұяшықта сол сөз туралы лингвистикалық ақпараттар беріледі.

Бұл сайт кез келген пайдаланушыға қолжетімді.