Qazaq24.com
Qazaq24.com
close
up
RU
Menu

Нашақорларды жаңа талдау арқылы үйлерде, университеттерде және колледждерде анықтамақшы

Қазақстанда құрылыс арматурасының өндірісі екі есеге артады

Индер ауданында 1 млрд 445 млн теңгелік спорт кешені мерзімінде тапсырылмады

Істі тоқтатамын : Ұлытау облысында адвокат алаяқтық жолмен 31 млн теңге пара алған

Көл, бассейн, сауна. Қостанай облысындағы бұрынғы президенттік резиденцияның қазіргі жай күйі қандай?

Лондонда медиа кеңсені өртемек болған күдікпен үш адам ұсталды

Прогресс бар : қазақстандықтар үшін Еуропаға виза алу жеңілдейді

Атырауда үш күнге ыстық су тоқтатылады

Финляндия азаматтық алу үшін сынақ енгізуді жоспарлап отыр

Екі облыста көктайғаққа байланысты жолдар жабылды

Қарызға белшесінен батқан адамдар не себепті банкрот болуға асықпайды

Бакудегі қайырымдылық жәрмеңкесі Қазақстан мен Әзербайжанның мәдени байланысын нығайтты

Несие несібе емес

Бибісараның тағы бір белесі

Бибисара Асаубаева әлем чемпионаты үшін ойнайтын матчқа бір қадам қалғанда тоқтады

Айқаптағы Мағжан өлеңдері

Петропавл қаласында жағымсыз иіс тарап, ауа сапасы күрт нашарлады

ШҚО да жалған диплом жасатқан жаттықтырушы сотталды

Қазақстанға көшіп келуге рұқсат алу қиындай түсті: тіл меңгеру қажет

Шымкенттің мәдени туристік мүмкіндігі бағамдалды

Жасанды интеллект адамзаттың соңғы емтиханын тапсыра бастады

Жасанды интеллект адамзаттың соңғы емтиханын тапсыра бастады

Aikyn.KZ парақшасынан алынған ақпаратқа сәйкес, Qazaq24.com хабарлайды..

Aikyn.kz адамның емтиханынан ЖИ жүйелері қалай өткенін scitechdaily.com сайтына сүйеніп бағалайды.

Халықаралық ауқымдағы жаңа жоба «Адамзаттың соңғы емтиханы» (Humanity’s Last Exam, HLE) іске асырыла бастады. Оның мақсаты – бүгінгі ең озық ЖИ модельдерінің шынайы мүмкіндіктерін анықтау.

Бұрынғы MMLU сияқты танымал бенчмарк тестер енді ЖИ мүмкіндігін толық ашып көрсетпейді. Себебі заманауи модельдер бұл емтихандардан өте жоғары балл жинай бастады. Сондықтан әлемнің түкпір-түкпірінен жиналған 1000-ға жуық зерттеуші, соның ішінде Техастың A&M университетінің профессорлары мен ғалымдары, мүлде жаңа форматтағы сынақ әзірледі.

Жаңа емтихан 2500 сұрақтан тұрады. Ол математика, жаратылыстану ғылымдары, гуманитарлық пәндер, көне тілдер мен өте тар маманданған академиялық салаларды қамтиды. Жобаның қатысушыларының бірі, Техас A&M университетінің доценті Тунг Нгуен, бұл бастаманың басты идеясын былай түсіндіреді:

«ЖИ жүйелері адамға арналған тестілерде өте жоғары нәтиже көрсете бастағанда, олар адамдық түсінік деңгейіне жақындады деп ойлап қаласыз. Бірақ біздің зерттеу интеллект тек үлгіні тану емес, сонымен бірге тереңдік, контекст және маманданған білім екенін еске салады», – дейді ол.

HLE-ге енгізілген әр сұрақтың бір ғана нақты, тексерілетін жауабы болуы шарт және оны интернеттен тез тауып алу мүмкін болмау керек. Сұрақтар ежелгі пальмира жазуларын аударудан бастап, құстар анатомиясындағы өте ұсақ құрылымдарды тануға дейінгі күрделі тақырыптарды қамтыған. Әр сұрақ алдын ала қазіргі үздік саналатын ЖИ жүйелерінде тексерілген. Егер модель дұрыс жауап берсе, ол сұрақ тестен алынып тасталған. Бұл әдіс жаңа емтиханды қазіргі ЖИ үшін әдейі күрделі еткен.

Нәтижелер де осыны дәлелдеді. Алғашқы сынақтарда GPT-4o – 2,7%, Claude 3.5 Sonnet – 4,1%, OpenAI o1 – 8% ғана нәтиже көрсетті. Кейінгі жаңа жүйелер, соның ішінде Gemini 3.1 Pro мен Claude Opus 4.6, дәлдікті 40-50% шамасына дейін арттырғанымен, толық үстемдікке жете алмады.Зерттеушілердің айтуынша, бұндай емтихан ЖИ-ді «қорқыныш көзі» емес, түсіну құралы ретінде бағалауға көмектеседі. «Бұл ЖИ-мен жарыс емес. Бұл – осы жүйелердің қай тұста мықты, қай жерде әлсіз екенін түсіну тәсілі. Сол түсінік бізге қауіпсіз әрі сенімді технология жасауға көмектеседі», – дейді Нгуен.

Сарапшылардың пікірінше, HLE – ЖИ мен адам интеллекті арасындағы алшақтықты ең айқын көрсеткен жаңа өлшемдердің бірі. Технология қанша дамыса да, әзірге адами таным мен контекстің орны бөлек екенін осы емтихан тағы дәлелдеген. Зерттеудің толық нұсқасы Nature журналында жарияланды.

Жағдайды бақылауды жалғастырыңыз, Qazaq24.com әрқашан ең жаңа жаңалықтарды ұсынады.
seeКөрілімдер:78
embedДереккөз:https://aikyn.kz
archiveБұл хабарлама дереккөзден мұрағатталған 02 Наурыз 2026 18:52
0 Пікірлер
Кіру, пікір қалдыру үшін...
Жарияланымға бірінші жауап беріңіз...
topЕң көп оқылғандар
Қазір ең көп талқыланатын оқиғалар

Нашақорларды жаңа талдау арқылы үйлерде, университеттерде және колледждерде анықтамақшы

16 Сәуір 2026 18:18see125

Қазақстанда құрылыс арматурасының өндірісі екі есеге артады

16 Сәуір 2026 15:34see123

Индер ауданында 1 млрд 445 млн теңгелік спорт кешені мерзімінде тапсырылмады

16 Сәуір 2026 12:18see119

Істі тоқтатамын : Ұлытау облысында адвокат алаяқтық жолмен 31 млн теңге пара алған

16 Сәуір 2026 19:48see115

Көл, бассейн, сауна. Қостанай облысындағы бұрынғы президенттік резиденцияның қазіргі жай күйі қандай?

16 Сәуір 2026 09:24see115

Лондонда медиа кеңсені өртемек болған күдікпен үш адам ұсталды

16 Сәуір 2026 22:37see115

Прогресс бар : қазақстандықтар үшін Еуропаға виза алу жеңілдейді

16 Сәуір 2026 12:40see114

Атырауда үш күнге ыстық су тоқтатылады

16 Сәуір 2026 00:52see114

Финляндия азаматтық алу үшін сынақ енгізуді жоспарлап отыр

17 Сәуір 2026 04:45see112

Екі облыста көктайғаққа байланысты жолдар жабылды

16 Сәуір 2026 05:52see112

Қарызға белшесінен батқан адамдар не себепті банкрот болуға асықпайды

15 Сәуір 2026 19:58see111

Бакудегі қайырымдылық жәрмеңкесі Қазақстан мен Әзербайжанның мәдени байланысын нығайтты

16 Сәуір 2026 16:52see111

Несие несібе емес

17 Сәуір 2026 08:09see110

Бибісараның тағы бір белесі

17 Сәуір 2026 09:31see110

Бибисара Асаубаева әлем чемпионаты үшін ойнайтын матчқа бір қадам қалғанда тоқтады

16 Сәуір 2026 02:46see110

Айқаптағы Мағжан өлеңдері

17 Сәуір 2026 08:52see109

Петропавл қаласында жағымсыз иіс тарап, ауа сапасы күрт нашарлады

17 Сәуір 2026 13:06see109

ШҚО да жалған диплом жасатқан жаттықтырушы сотталды

15 Сәуір 2026 22:06see108

Қазақстанға көшіп келуге рұқсат алу қиындай түсті: тіл меңгеру қажет

17 Сәуір 2026 10:02see108

Шымкенттің мәдени туристік мүмкіндігі бағамдалды

16 Сәуір 2026 08:17see108
newsСоңғы жаңалықтар
Күннің ең жаңа және өзекті оқиғалары