«GPT-4.5: Новая высота в масштабировании AI от OpenAI, доказанная главным научным сотрудником»

OpenAI представила свою крупнейшую языковую модель на сегодняшний день — GPT 4.5. Главный научный сотрудник компании, Марк Чен, заявил, что данная модель демонстрирует, что возможности масштабирования AI-моделей еще не исчерпаны.

В четверг OpenAI официально представила новую языковую модель GPT 4.5, охарактеризовав ее как самую мощную модель для общения на данный момент. Первоначально она будет доступна пользователям Pro, а позже — пользователям Plus, Enterprise, Team и Edu в течение следующих нескольких недель.

Чен считает, что GPT 4.5 является ответом на скептицизм критиков, выражающих сомнения в том, что исследовательские лаборатории способны продолжать совершенствовать и увеличивать размеры моделей.

«GPT 4.5 доказывает, что мы в состоянии продолжать парадигму масштабирования,» — отметил он в своем комментарии. «Это шаг на следующем уровне.»

Отвечая на вопрос о том, почему новая модель не называется GPT-5, Чен пояснил, что OpenAI стремится придерживаться узнаваемых моделей именования. С учетом предсказуемости масштабирования — как, например, переход от GPT-3 к 3.5, компания может предсказать, какие улучшения обеспечит увеличение вычислительных мощностей и эффективности. Новая модель соответствует ожиданиям от GPT 4.5.

Чен добавил, что OpenAI теперь может масштабироваться по двум направлениям. «GPT 4.5 — это наш последний эксперимент в области неконтролируемого обучения, но также имеются аспекты рассуждений,» — подчеркнул он.

Он объяснил, что более длительное время разработки между GPT-4 и 4.5 связано с большим вниманием компании к разработке парадигмы рассуждений.

Эти два подхода дополняют друг друга: «Для того чтобы строить рассуждения, нужны знания. Модель не может просто взять и научиться рассуждениям с нуля,» — сказал Чен. Обе парадигмы усиливают друг друга и создают циклы обратной связи.

По словам Чена, GPT 4.5 является “интеллектуальной” в другом смысле, чем модели, основанные на рассуждениях. Она обладает значительно более обширными знаниями о мире. По сравнению с GPT-4, пользователи предпочли новую модель для повседневного использования на 60%. Для работы, требующей высокой продуктивности и интеллекта, этот показатель поднимается практически до 70%.

Когда речь заходит о возможных ограничениях в масштабировании, Чен четко указал: «Мы наблюдаем аналогичные результаты. GPT 4.5 — это следующий шаг в парадигме неконтролируемого обучения.» Он объяснил, что OpenAI придерживается строгого подхода, основывая свои прогнозы на всех предыдущих моделях, чтобы определить ожидаемую производительность.

Кроме традиционных бенчмарков, где GPT 4.5 демонстрирует аналогичные улучшения, как и переход от GPT-3.5 к GPT-4, Чен отметил, что модель обладает новыми возможностями. Он упомянул о способности создавать ASCII-арт, с задачей которого предыдущие модели часто не справлялись.

Чен также опроверг слухи о том, что разработка GPT 4.5 оказалась особенно сложной. «Создание всех наших базовых моделей — это процесс экспериментов. Это часто подразумевает остановки, анализ результатов и переигрывание тестов,» — пояснил он. Хотя это не было характерно для GPT 4.5, OpenAI так же поступала с GPT-4 и O-серией.

Интересно, что значительно меньшая модель Claude 3.7 Sonnet превосходит GPT-4.5 от Anthropic во многих аспектах, что выглядит несколько странным, учитывая, что данные были собраны только в октябре 2023 года. Вероятной причиной этому могут быть данные, использованные для обучения, так как с 2023 года в области синтетических данных достигнуто много успехов.

Источник