Как отметил спикер, Chat-GPT может уже генерировать информацию на казахском языке, но чтобы полноценно и правильно он смог отвечать, необходимо 13 млрд токенов. На сегодня сам Chat-GPT от OpenAI в 10 раз меньше — 1,5 млрд токенов.
«Это потому что сам корпус открытых данных, который есть в мире, всего насчитывает столько данных. Сейчас в Казахстане большая задача состоит в том, чтобы разработать с нашими библиотеками, произведениями, с учетом нашего менталитета, нашу отечественную модель», — сообщил Рустем Бигари.
По его словам, казахстанская языковая модель должна быть разработана к концу года и представлена обществу для того, чтобы дальше могли все помогать ее развивать.
В свою очередь директор Департамента развития инноваций МЦРИАП РК Дархан Мырзабаев рассказал, что сейчас министерство координирует работу с университетами, научно-исследовательскими институтами и всеми, кто участвует, помогает со сбором данных и обеспечивает нужными мощностями.
1 сентября 2023 года президент Казахстана Касым-Жомарт Токаев подчеркнул необходимость развития в стране IT-отраслей. 7 февраля 2024 года Токаев поручил продолжить цифровизацию экономики и обеспечить широкое применение технологий искусственного интеллекта.