Qazaq24.com
Qazaq24.com
close
up
RU
Menu

7 күнге арналған ауа райы болжамы: Астанада осы апта жауын шашынды болмақ

Абитуриенттерді смарт көзілдірік үшін ҰБТ дан шеттетті

Мемлекет тарапынан әрбір балаға қамқорлық жасалып жатыр Тоқаев

Атырауда зооқорғаушылар акциясы өтті

БЖЗҚ да 45 миллиард теңгені ұмытып кеткен ақшаны кім ала алады?

Жаңа ипотекалық жоба арқылы аяқталмаған үйлерден пәтер алуға болады

Түркістанда қарбыз пісіп, алғашқы партия экспортқа шығарылды

Израиль Бейрутқа жасалатын соққыларды күшейткісі келеді және АҚШ тың шешімін күтіп отыр БАҚ

ҰҚК ірі есірткі зертханасының қызметін тоқтатты

Ұрпақ қауіпсіздігі басты назарда

Қазақстанның ақылы жолдарында мемлекеттік нөмірлерді қолдан жасаудың 2 000 ға жуық жағдайы анықталды

Атырау Арена : 1500 орындық спорт кешені салынуда

Енді қауіпті өндіріс орындары мен шахталарды жасанды интеллект бақылайды

Тұрмысқа қажетті қарапайым жағдай жасалмаған: Тоқаев Алматы облысының инфрақұрылымы үшін шенеуніктерді сынға алды

Шамдар жанбайды Астана аудандарындағы жарықтандыруда не болып жатыр

Әл Фарабидегі жол апаты: Сотталушы мерзімінен бұрын босатылуы мүмкін

Субұрқақта шомылудың денсаулыққа қандай зияны бар?

​Көкшетауда әлеуметтік үйлерді салуға бөлінген миллиардтар жымқырылған: Күдікті қамауға алынды

Астанада ЕАЭО аясында аккредиттеу жүйесін дамыту мәселесі талқыланды

Президент: Тату тәтті отбасы бақытты балалық шақтың негізі

Жасанды интеллект адамзаттың соңғы емтиханын тапсыра бастады

Жасанды интеллект адамзаттың соңғы емтиханын тапсыра бастады

Aikyn.KZ парақшасынан алынған ақпаратқа сәйкес, Qazaq24.com хабарлайды..

Aikyn.kz адамның емтиханынан ЖИ жүйелері қалай өткенін scitechdaily.com сайтына сүйеніп бағалайды.

Халықаралық ауқымдағы жаңа жоба «Адамзаттың соңғы емтиханы» (Humanity’s Last Exam, HLE) іске асырыла бастады. Оның мақсаты – бүгінгі ең озық ЖИ модельдерінің шынайы мүмкіндіктерін анықтау.

Бұрынғы MMLU сияқты танымал бенчмарк тестер енді ЖИ мүмкіндігін толық ашып көрсетпейді. Себебі заманауи модельдер бұл емтихандардан өте жоғары балл жинай бастады. Сондықтан әлемнің түкпір-түкпірінен жиналған 1000-ға жуық зерттеуші, соның ішінде Техастың A&M университетінің профессорлары мен ғалымдары, мүлде жаңа форматтағы сынақ әзірледі.

Жаңа емтихан 2500 сұрақтан тұрады. Ол математика, жаратылыстану ғылымдары, гуманитарлық пәндер, көне тілдер мен өте тар маманданған академиялық салаларды қамтиды. Жобаның қатысушыларының бірі, Техас A&M университетінің доценті Тунг Нгуен, бұл бастаманың басты идеясын былай түсіндіреді:

«ЖИ жүйелері адамға арналған тестілерде өте жоғары нәтиже көрсете бастағанда, олар адамдық түсінік деңгейіне жақындады деп ойлап қаласыз. Бірақ біздің зерттеу интеллект тек үлгіні тану емес, сонымен бірге тереңдік, контекст және маманданған білім екенін еске салады», – дейді ол.

HLE-ге енгізілген әр сұрақтың бір ғана нақты, тексерілетін жауабы болуы шарт және оны интернеттен тез тауып алу мүмкін болмау керек. Сұрақтар ежелгі пальмира жазуларын аударудан бастап, құстар анатомиясындағы өте ұсақ құрылымдарды тануға дейінгі күрделі тақырыптарды қамтыған. Әр сұрақ алдын ала қазіргі үздік саналатын ЖИ жүйелерінде тексерілген. Егер модель дұрыс жауап берсе, ол сұрақ тестен алынып тасталған. Бұл әдіс жаңа емтиханды қазіргі ЖИ үшін әдейі күрделі еткен.

Нәтижелер де осыны дәлелдеді. Алғашқы сынақтарда GPT-4o – 2,7%, Claude 3.5 Sonnet – 4,1%, OpenAI o1 – 8% ғана нәтиже көрсетті. Кейінгі жаңа жүйелер, соның ішінде Gemini 3.1 Pro мен Claude Opus 4.6, дәлдікті 40-50% шамасына дейін арттырғанымен, толық үстемдікке жете алмады.Зерттеушілердің айтуынша, бұндай емтихан ЖИ-ді «қорқыныш көзі» емес, түсіну құралы ретінде бағалауға көмектеседі. «Бұл ЖИ-мен жарыс емес. Бұл – осы жүйелердің қай тұста мықты, қай жерде әлсіз екенін түсіну тәсілі. Сол түсінік бізге қауіпсіз әрі сенімді технология жасауға көмектеседі», – дейді Нгуен.

Сарапшылардың пікірінше, HLE – ЖИ мен адам интеллекті арасындағы алшақтықты ең айқын көрсеткен жаңа өлшемдердің бірі. Технология қанша дамыса да, әзірге адами таным мен контекстің орны бөлек екенін осы емтихан тағы дәлелдеген. Зерттеудің толық нұсқасы Nature журналында жарияланды.

Жағдайды бақылауды жалғастырыңыз, Qazaq24.com әрқашан ең жаңа жаңалықтарды ұсынады.
seeКөрілімдер:100
embedДереккөз:https://aikyn.kz
archiveБұл хабарлама дереккөзден мұрағатталған 02 Наурыз 2026 18:52
0 Пікірлер
Кіру, пікір қалдыру үшін...
Жарияланымға бірінші жауап беріңіз...
topЕң көп оқылғандар
Қазір ең көп талқыланатын оқиғалар

7 күнге арналған ауа райы болжамы: Астанада осы апта жауын шашынды болмақ

01 Маусым 2026 20:49see121

Абитуриенттерді смарт көзілдірік үшін ҰБТ дан шеттетті

01 Маусым 2026 15:28see120

Мемлекет тарапынан әрбір балаға қамқорлық жасалып жатыр Тоқаев

01 Маусым 2026 09:24see118

Атырауда зооқорғаушылар акциясы өтті

01 Маусым 2026 20:58see116

БЖЗҚ да 45 миллиард теңгені ұмытып кеткен ақшаны кім ала алады?

01 Маусым 2026 11:51see114

Жаңа ипотекалық жоба арқылы аяқталмаған үйлерден пәтер алуға болады

01 Маусым 2026 18:00see114

Түркістанда қарбыз пісіп, алғашқы партия экспортқа шығарылды

01 Маусым 2026 09:34see112

Израиль Бейрутқа жасалатын соққыларды күшейткісі келеді және АҚШ тың шешімін күтіп отыр БАҚ

01 Маусым 2026 08:44see112

ҰҚК ірі есірткі зертханасының қызметін тоқтатты

02 Маусым 2026 12:12see112

Ұрпақ қауіпсіздігі басты назарда

02 Маусым 2026 09:23see110

Қазақстанның ақылы жолдарында мемлекеттік нөмірлерді қолдан жасаудың 2 000 ға жуық жағдайы анықталды

01 Маусым 2026 13:11see109

Атырау Арена : 1500 орындық спорт кешені салынуда

01 Маусым 2026 20:58see109

Енді қауіпті өндіріс орындары мен шахталарды жасанды интеллект бақылайды

02 Маусым 2026 11:22see109

Тұрмысқа қажетті қарапайым жағдай жасалмаған: Тоқаев Алматы облысының инфрақұрылымы үшін шенеуніктерді сынға алды

02 Маусым 2026 14:48see108

Шамдар жанбайды Астана аудандарындағы жарықтандыруда не болып жатыр

02 Маусым 2026 09:55see108

Әл Фарабидегі жол апаты: Сотталушы мерзімінен бұрын босатылуы мүмкін

02 Маусым 2026 10:55see108

Субұрқақта шомылудың денсаулыққа қандай зияны бар?

02 Маусым 2026 17:46see107

​Көкшетауда әлеуметтік үйлерді салуға бөлінген миллиардтар жымқырылған: Күдікті қамауға алынды

02 Маусым 2026 10:51see107

Астанада ЕАЭО аясында аккредиттеу жүйесін дамыту мәселесі талқыланды

01 Маусым 2026 11:53see107

Президент: Тату тәтті отбасы бақытты балалық шақтың негізі

01 Маусым 2026 11:34see104
newsСоңғы жаңалықтар
Күннің ең жаңа және өзекті оқиғалары