«Grok-3: Новая версия чат-бота от xAI не удивляет и не бросает вызов лидерам рынка OpenAI»

В понедельник Илон Маск представил Grok-3новую генерацию чат-бота от компании xAI, подчеркивая, что она значительно мощнее предыдущей версии. Ряд экспертов и исследователей в области искусственного интеллекта уже протестировали Grok-3 и высказали смешанные мнения о его возможностях.

По словам Маска, новый бот превосходит GPT-4o от OpenAI, а также решения от Google, DeepSeek и Anthropic по ключевым показателям в таких областях, как математика, наука и программирование. «Мы ежедневно совершенствуем наши модели, и всего за 24 часа вы увидите результаты наших улучшений», — отметил он во время трансляции на платформе X, где его поддерживали три инженера xAI.

Андрей Карпатый, сооснователь OpenAI и бывший руководитель ИИ-подразделения Tesla, указал в сообщении на X, что Grok-3 хорошо справляется с поиском сложной информации в обучающих материалах, однако, как и OpenAI o1-pro, он сталкивается с трудностями при решении сложных задач в игре крестики-нолики. «В общем, создаётся впечатление, что этот уровень сравним с o1-pro и немного превосходит DeepSeek‑r1. Но, безусловно, потребуется больше детальных тестов», — добавил Карпатый, который одним из первых получил доступ к Grok-3.

Параллельно xAI представила новый инструмент для Grok-3DeepSearch, который обещает улучшить процесс исследований, мозговых штурмов и анализа данных, объясняя при этом методы обработки запросов. Как сообщает Business Insider, разработка этого инструмента велась как минимум с конца прошлого года. Карпатый заметил, что DeepSearch «в целом сопоставим с DeepResearch от Perplexity, что является хорошим знаком, но всё же уступает недавно представленному OpenAI Deep Research, который кажется более тщательным и надежным».

Итан Моллик, профессор Уортонской школы бизнеса при Пенсильванском университете и исследователь в области ИИ, считает, что хотя xAI движется быстро, Grok-3 еще не доказал свое лидерство: «Это очень достойная модель на передовой линии, но не настолько выдающаяся, чтобы отказаться от вашей нынешней», — написал он в LinkedIn в понедельник. Моллик добавил, что Grok-3 действительно опережает некоторые модели OpenAI по отдельным параметрам, но не обеспечивает значительного преимущества по сравнению с o3.

Гэри Маркус, основатель Geometric Intelligence и известный критик вокруг прогресса ИИ, выразил сомнение в новом боте: «Илон Маск заявил, что Grok-3 станет самым умным ИИ в истории. Спойлер: это не так». Он охарактеризовал презентацию как «повторение предыдущих демонстраций» и подчеркнул, что, несмотря на некоторые улучшения, не произошло революционных прорывов по сравнению с моделями от OpenAI.

С другой стороны, Карпатый был более оптимистично настроен, отметив высокие логические способности Grok-3 и его способность решать сложные программные задачи.

Релиз Grok-3 совпал с нарастающим соперничеством между Маском и Сэмом Альтманом, генеральным директором OpenAI: их конкуренция усилилась в этом месяце, когда Маск попытался приобрести контроль над OpenAI, предложив $97,4 млрд без предварительных переговоров. В 2015 году он был одним из основателей компании вместе с Альтманом, но покинул ее три года спустя из-за разногласий. На прошлой неделе совет директоров OpenAI отклонил его предложение.

Моллик отметил, что, несмотря на технологические успехи xAI, OpenAI все еще сохраняет серьезное преимущество благодаря партнерствам в индустрии и широкому охвату среди корпоративных клиентов, заявив: «Не уверен, что Grok сможет добиться значительного успеха на рынке». Маркус выразил ещё большее сомнение: «Сэм Альтман пока не имеет поводов для беспокойства. Прорыва нет», — заключил он и добавил, что OpenAI остается недосягаемым лидером благодаря своему доступу к вычислительным ресурсам и масштабам исследований.

В свою очередь, Маск утверждает, что Grok-3 получил более чем десятикратное увеличение вычислительной мощности по сравнению с предыдущей версией и завершил предобучение в начале января. Новая модель стала доступна подписчикам X Premium+, а также xAI запустила новый план — SuperGrok, предназначенный для пользователей мобильных устройств и сайта grok.com. Маск также заявил, что компания намерена открыть исходный код предыдущих версий моделей, как только Grok-3 достигнет своего полного потенциала — по его словам, это произойдет через несколько месяцев.

Источник.