Qazaq24.com сообщает, основываясь на информации сайта Time.KZ.
Объясняем, почему на расширенном заседании правительства по поводу цифровизации случился момент истины
А дело было так. Президент Касым-Жомарт ТОКАЕВ публично усомнился в чиновничьих отчетах. Поводом стал ответ на простой вопрос главы государства, адресованный министру искусственного интеллекта и цифрового развития Жаслану МАДИЕВУ, о востребованности национальной языковой ИИ-модели:
- Сколько человек пользуется KazLLM?
- Свыше 600 тысяч.
- Это нужно уточнить.
Иногда три простых слова звучат громче прямых заявлений. Потому что “нужно уточнить” в переводе с официального означает: цифры выглядят неправдоподобно. И чем глубже вникаешь в эту историю, тем больше возникает вопросов. Начнем с основного.
***
На разработку казахстанской языковой модели KazLLM было выделено примерно 3,9 миллиарда тенге государственных средств. Проект подавался как фундамент технологического суверенитета - почти казахский ChatGPT, который должен был вывести страну в высшую лигу цифровых держав. С момента яркой презентации модели прошло больше года. Что получила страна?
С уверенностью можно сказать: модель осталась моделью, а созданного на ее основе продукта, который был бы массово востребован (вроде чата GPT), до сих пор нет.
Авторы KazLLM, впрочем, признавали сразу: модель - это лишь ядро, академическая база, которую можно скачать и запустить при наличии мощных серверов. Она предназначена для разработчиков цифровых продуктов. Обычный пользователь даже не поймет, как к ней подступиться.
Проще говоря, у KazLLM нет и не может быть интерфейса, который позволил бы пользователю вступить в диалог с искусственным интеллектом. Интерфейс нужен продукту, то есть тому же ИИ-чату, созданному на основе языковой модели.
Вот почему вышеприведенный диалог на заседании правительства как минимум округлил глаза у всех, кто хоть что-нибудь смыслит в искусственном интеллекте. Получается, министр Мадиев сказал неправду. Откуда же у ядра могли взяться 600 тысяч пользователей? У нас так много спецов? Или все мировое сообщество программистов страшно заинтересовалось новостями о KazLLM?
По правде говоря, кое-какие продукты, созданные на основе этой модели, есть. А вот достоверной и открытой статистики на их счет нет. Но речь сейчас не об этом.
***
Если обратиться к открытым данным крупнейшей платформы искусственного интеллекта Hugging Face, где размещена в числе многих и модель KazLLM, все выглядит куда скромнее: она скачана 449 раз.
Разрыв между числами 449 и 600 000 - это уже не статистическая погрешность. Это методологическая бездна. Но, возможно, самым поразительным в этой истории оказалось другое.
Буквально месяц назад на сайте Astana Hub - акселератора, который активно продвигает цифровую повестку, была опубликована статья стартапера Армана АУБАКИРОВА с почти провокационным заголовком: “Как обучить казахскую Llama-3.1 за 5000 тенге и догнать KazLLM”. Я наткнулся на нее случайно, занимаясь поисками попутной информации к этой статье.
В материале описывается опыт быстрого файн-тюнинга (то есть дообучения) существующей базовой языковой модели с использованием специализированного графического процессора через облачный сервис. Автор прямо утверждает: при грамотном и креативном подходе даже экономобучение способно дать результаты, сопоставимые с теми, что получены на модели, которая обучалась значительно дольше и на более дорогих вычислительных ресурсах.
Фактически речь идет о том, что KazLLM можно существенно улучшить малыми силами, без гигантских государственных программ и вложений. Не за миллионы. Не за миллиарды. За 5 тысяч тенге.
Но раз так, то неизбежно возникает вопрос уже не технический, а концептуальный: если энтузиаст может приблизиться к сопоставимому результату за 10 долларов, зачем тогда вливать в это дело такие суммы, как 3,9 миллиарда тенге?
***
Важный нюанс: и в случае KazLLM, и в эксперименте стартапера использовался ИИ-инструмент Meta Llama. То есть базовая технология в обоих случаях была создана не в Казахстане, а за океаном. С ней работали: дообучали, адаптировали, локализовали… Нашим разработчикам ничего не пришлось изобретать с нуля.
Это нормальная практика для многих стран, ведь почти все национальные модели строятся поверх существующих архитектур. Вопрос в другом: соответствует ли размер инвестиций масштабу технологического прорыва?
По сути, это не выглядит созданием собственного AI-ядра мирового уровня, скорее дорогостоящей попыткой догнать поезд, который уже давно набрал скорость.
***
Особую остроту вопросу добавляет громадье широких планов цифровизации. По бюджетным программам министерство может потратить свыше 938 миллиардов тенге за ближайшие пять лет, из них почти 600 миллиардов пойдет на электронное правительство и инфраструктуру.
Именно по поводу этих расчетов президент произнес сакраментальную фразу: “Сразу скажу, таких денег нет и не может быть”. Это уже не критика, а недвусмысленный сигнал.
Цифровая экономика существует тогда, когда есть продукты, которыми реально пользуются люди. Пользователей нельзя назначить приказом, нельзя нарисовать в отчете. Они либо есть, либо нет. А рынок голосует честно. В том же диалоге на правительственном заседании прозвучало: не менее 13 процентов казахстанцев уже используют ChatGPT. Без государственных программ на миллиарды. Просто потому, что он есть и работает.
На этом фоне история о 600 тысячах пользователей KazLLM начинает выглядеть особенно тревожно вовсе не по причине красивой статистики. Если система поощряет отчетность вместо реальных результатов, приходится говорить о проблемах управления. Похоже, президент это почувствовал. И его короткое “надо проверить” звучит как сигнал к началу большой ревизии.
***
Самый опасный враг цифровизации не проблема финансирования, а иллюзия успеха. Когда презентация важнее продукта и когда “почти сделали” превращается в “уже пользуются сотни тысяч”, то возникает простой и крайне неудобный вопрос: что именно получила страна за 3,9 миллиарда тенге? Собственную технологию или адаптацию чужой?
Массовый продукт или академический эксперимент?
Сотни тысяч пользователей или красивую цифру для доклада?
Если после всех инвестиций казахстанцы упорно продолжают открывать зарубежные AI-сервисы, то говорить приходится не о патриотизме, а всего лишь о качестве.
Так закончилось ли время презентаций? Начинается ли время проверки? Поживем - увидим.
Стас КИСЕЛЁВ, коллаж Владимира КАДЫРБАЕВА, Костанай