Модель искусственного интеллекта Grok от компании xAI, основанной Илоном Маском, показала самый низкий уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum.
В ходе исследования установлено, что уровень так называемых «галлюцинаций» у Grok составляет всего 8%, что почти в четыре раза меньше, чем у ChatGPT и Google Gemini. Для сравнения, ChatGPT показал уровень ошибок в 35%, а Gemini — 38%, что ставит под сомнение их пригодность для задач, требующих высокой точности.
Оценка производилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе собранных данных каждой модели был присвоен балл по шкале от 0 до 99, где более высокие значения указывают на меньшую надежность.
Grok получил итоговый балл 6, что является одним из лучших результатов в рамках этого исследования. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 балла, а также минимальное время простоя, составившее всего 0,07%.
В то же время ChatGPT оказался на последнем месте в рейтинге с максимальным баллом 99. На следующем уровне расположились Claude и Meta AI (которая признана экстремистской и запрещена в России) с показателями 75 и 70 соответственно. Китайский сервис DeepSeek продемонстрировал результаты, сопоставимые с Grok: уровень «галлюцинаций» составил 14%, а пользовательская оценка — 4 балла.
