OpenAI представляет GPT-5.2: Новая эра ИИ с рекордами скорости и эффективности

Компания OpenAI анонсировала новый набор моделей GPT-5.2. С 12 декабря доступны для всех версии Instant, Thinking и Pro.

«Пользователи ChatGPT Enterprise уже сейчас в среднем экономят 40-60 минут в день благодаря искусственному интеллекту, а у активных пользователей этот показатель превышает 10 часов в неделю. Создавая GPT-5.2, мы стремились максимизировать экономический потенциал для людей», — отмечается в блоге компании.

Версия Thinking продемонстрировала впечатляющие результаты в ряде тестов.

Модель продемонстрировала экспертный уровень в бенчмарке GDPval, который оценивает выполнение интеллектуальных задач в 44 различных профессиях. В числе тестовых заданий — подготовка презентаций и работа с таблицами.

«Думательная» версия LLM выполняет задачи бенчмарка GDPval в 11 раз быстрее, чем человеческие эксперты, при этом затраты на выполнение работы не превышают 1% от расходов на профессионала.

OpenAI подчеркнула, что GPT-5.2 Thinking «устанавливает новые стандарты профессионального качества». Она отличается:

Версия GPT-5.2 Instant ориентирована на повседневные задачи и обучение. Её стиль общения теплый и разговорный, с ясным изложением ключевой информации, улучшенными пошаговыми инструкциями и качественным переводом технических текстов.

GPT-5.2 Pro предлагается как самое мощное решение для сложных запросов, демонстрируя отличную производительность в специализированных областях, таких как программирование и научные исследования.

«GPT-5.2 — это продолжение нашего процесса совершенствования моделей. Мы продолжаем решать известные проблемы, такие как необоснованные отказы и задержки, чтобы улучшить полезность продукта», — подчеркнули в OpenAI.

Модель GPT-5.1 останется доступной для платных пользователей еще три месяца.

GPT-5.2 Thinking установила новый рекорд в тесте SWE-Bench Pro с результатом 55,6%, который оценивает способность модели работать с четырьмя языками.

Также в тесте SWE-bench Verified было достигнуто высокое значение — 80%.

«Это означает, что для повседневной профессиональной работы модель более эффективно отлаживает код, реализует запросы на новые функции, рефакторит обширные кодовые базы и справляется с исправлениями с меньшим вмешательством человека», — отмечается в блоге OpenAI.

GPT-5.2 Thinking демонстрирует лучшие результаты в фронтенд-разработке и создании сложных интерфейсов по сравнению с GPT-5.1 Thinking.

«GPT-5.2 стал значительным шагом вперёд для моделей GPT в сфере программирования, являясь лучшим решением в своем ценовом сегменте», — отметили в компании.

Сравнительно с GPT-5.1 Thinking, версия GPT-5.2 показывает меньшее количество «галлюцинаций» и обеспечивает более высокую надежность в повседневной работе с данными, исследовательской деятельности, написании текстов, анализе и принятии решений.

GPT-5.2 Thinking «устанавливает новые стандарты» в области анализа с длинным контекстом. Эта модель достигла выдающихся результатов в тесте OpenAI MRCRv2, который анализирует способность модели интегрировать информацию из длинных документов.

В сложных задачах глубокого анализа, требующих работы с большим объемом связанных данных, GPT-5.2 Thinking демонстрирует «значительное превосходство» над GPT-5.1 Thinking.

GPT-5.2 Thinking считается самой мощной моделью визуального восприятия от OpenAI. Она вдвое снижает количество ошибок в анализе диаграмм и понимании пользовательского интерфейса.

Нейросеть способна более точно интерпретировать информационные панели, скриншоты и технические графики.

Например, GPT-5.2 способна успешно идентифицировать ключевые области и устанавливать границы объектов, в то время как GPT-5.1 выделяет лишь отдельные фрагменты, демонстрируя недостаточное понимание пространственной структуры.

Хотя обе модели иногда ошибаются, версия 5.2 значительно лучше справляется с анализом изображений.

Также напомним, что в декабре OpenAI запланировала запуск GPT-5.2 как ответ на рост популярности модели Gemini от Google.