Қазақ тілінің ұлттық корпусы: Тіл үйренуге жаңа мүмкіндіктер
Aikyn.KZ дереккөзінен алынған мәліметтерге сүйене отырып, Qazaq24.com түсініктеме жасады..
«AMANAT» партиясы Орталық аппаратында «SocioExpertClub» алаңында Қоғамдық саясат институтының ұйымдастыруымен «Цифрлық дәуірдегі қазақ тіл білімі: дамуы, нәтижелері мен болашағы» тақырыбында кездесу өтті, – деп хабарлайды Aikyn.kz
Кездеу барысында Ахмет Байтұрсынұлы атындағы Тіл білімі институты директоры Анар Фазылжан заманынан қалыспай цифрландыру кезеңінде қазақ лингвистикасының қалай дамып жатқаны, қазақ тіліне байланысты жүргізіліп жатқан зерттеулерімен бөлісті.
– Бүгінгі күнге дейін тіліміз талай қиындықты еңсерді. Цифрлану заманында қазақ тілінің берілуі қатты әлсіреді. Бұрын тікелей ата-әжеміз әңгіме айтып, берілетін. Өзіміз кітап оқып, ауылда тұрған соң ауыл ақсақалдарының әңгімесін тыңдап өстік. Кейінгі жылдары бүкіл қазақ үдере қалаға көшті. Бір отбасында ата-апасы қазақша, әке-шешесі орысша, балалары ағылшынша сөйлейтін жанұялар көбейді. Тілдің ұрпақтан ұрпаққа берілуі әлсіреді.
Екіншіден, тілдің калькалануы. Яғни генерацияланған мәтін, chatgpt-мен жазылған өтірік мәтіндер көбейіп кетті. Олардың ішінде ешқандай қуат жоқ. Бір сөзбен айтқанда, тірі мәтіндер азайып барады. Біз осыдан қиналып кеттік. Постиндустриялды қоғам мен жасанды интеллект талаптарына сәйкес қазақ тілінде жаңғыру баяу жүріп жатыр. SIR деген цифрлық ресурста бүкіл әлемнің ғалымдары қазақ тілін цифрлық ресурсы аз тілдер қатарына жатқызды. Десе де, тіл бойынша талай зертеулер жасалып, жұмыс атқарылып жатыр, – деді Анар Фазылжан.
Оның айтуынша, Ахмет Байтұрсынұлының ізімен келе жатқан тіл білімі институның зерттеушілері қазақ тілінің ұлттық корпусын жасап, тілді модельдеумен айналысып жатыр.
– Мұнда ауқымды тілдік модель, нейролингвистикалық бағдарламау бойынша диссертациялық тақырыптар беріп, зерттеу жүргізілуде. Әлеуметтік тіл білімі ғана емес, психолингвистика, нейролингвистика жан-жақты қаралды. Енді дәстүрлі сөз саптары мен генерацияланған сөзді зерттеп жатырмыз. Қазір біздің назарымызда – табиғи тіл мен жасанды тіл, әдеби тіл мен слэнг, реалды коммуникациаляқ тіл мен вертуалды коммуникациялық тіл, жазба тіл мен ауызша тіл.
Бұл – ең бірінші зерттеушілерге қажет дүние. Әсіресе, қазіргі кездегі қазақ тілі және тарихи кезеңдегі қазақ тілі қай жерде және қалай қолданылды, соны тіркеуге керек. Яғни, бұл – біздің микроскоп. Бұрын біз бір тілдік құбылысты «шынымен ертең дамитын дүние ме, әшейін біреудің аузындағы сөз бе» дегенді дәлелдеу үшін қаншама кітап бетін ақтарып, көше аралап сөзін жинасақ, қазір осы базаға кіріп-ақ қорытынды жасай береміз. Екіншіден, тіл үйренуге қажет. Үшіншіден, кез келген қазақ тіліндегі сөздің мән-мағынасын, ақпаратын білгенге жақсы, – дейді Ахмет Байтұрсынұлы атындағы Тіл білімі институты директоры Анар Фазылжан.
Қазақ тілінің ұлттық корпусында 250 миллионнан астам қолданыстағы сөз аннотацияланған. Яғни, оның құрамындағы әрбір сөздің лингвистикалық паспорты жасалған. Қазір онда 22 корпус бар. Тіпті, генерациаланған мәтіндердің сөздері бір корпусқа жинақталған.
Іс-шараға Сенат пен Мәжіліс депутаттары, отандық ғалымдар, тіл білімі саласының мамандары, жоғары оқу орындарының өкілдері, жас зерттеушілер мен сала сарапшылары қатысты.
Бұл тақырыптағы басқа жаңалықтар:
Көрілімдер:32
Бұл хабарлама дереккөзден мұрағатталған 30 Сәуір 2026 17:34 



Кіру
Жаңалықтар
Ауа райы
Магниттік дауылдар
Намаз уақыты
Қымбат металдар
Валюта конвертері
Кредит есептегіш
Криптовалюта бағамы
Жұлдыздар
Сұрақ - Жауап
Интернет жылдамдығын тексеріңіз
Қазақстан радиосы
Қазақстан телевизиясы
Біз туралы








Ең көп оқылғандар



















