GPT-5.2: Новый виток в развитии ИИ от OpenAI

Компания OpenAI представила свою последнюю флагманскую модель — GPT-5.2. Разработанная как ответ на растущую конкуренцию со стороны Google, она позиционируется как самый продвинутый инструмент для разработчиков и профессионалов.

GPT-5.2 будет доступен пользователям ChatGPT с подпиской и разработчикам через API в трех вариантах. Вариант Instant оптимизирован для скорости и подходит для рутинных задач, таких как поиск информации, написание текстов и перевод. Модель Thinking превосходно справляется со сложными структурированными задачами, включая программирование, анализ больших документов, математические вычисления и планирование. Флагманский вариант Pro обеспечивает максимальную точность и надежность при решении комплексных проблем.

«Мы создали 5.2, чтобы открыть новые экономические возможности для людей», — отметила Фиджи Симо, директор по продуктам OpenAI. — «Модель лучше справляется с созданием таблиц, подготовкой презентаций, написанием кода, распознаванием изображений, пониманием длинного контекста, использованием инструментов и управлением сложными многоэтапными проектами».

Запуск GPT-5.2 происходит на фоне технологической гонки вооружений с моделью Gemini 3 от Google. Gemini 3 демонстрирует лидирующие результаты в большинстве бенчмарков на платформе LMArena, за исключением кодирования, где пока превосходит Claude Opus-4.5 от Anthropic.

Ранее в этом месяце сообщалось, что генеральный директор Сэм Альтман направил сотрудникам внутреннюю записку с призывом «красный код» из-за снижения трафика ChatGPT и опасений потери доли рынка в потребительском сегменте в пользу Google. Этот призыв подразумевал пересмотр приоритетов, включая отказ от внедрения рекламы в пользу улучшения пользовательского опыта ChatGPT.

GPT-5.2 — это попытка OpenAI вернуть себе лидерство, несмотря на то, что некоторые сотрудники, по сообщениям, просили отложить выпуск модели для дополнительной доработки. Несмотря на сигналы о фокусе OpenAI на потребительских сценариях использования через персонализацию и кастомизацию ChatGPT, выпуск GPT-5.2, по всей видимости, направлен на расширение корпоративных возможностей.

Компания целенаправленно ориентируется на разработчиков и экосистему инструментов, стремясь стать фундаментальной платформой для создания AI-приложений. На этой неделе OpenAI опубликовала данные, демонстрирующие значительный рост использования корпоративных AI-инструментов за последний год.

Тем временем Gemini 3 получила глубокую интеграцию в экосистему продуктов и облачных сервисов Google, обеспечивая мультимодальные и агентские рабочие процессы. На этой неделе Google представила управляемые MCP-серверы, упрощающие для агентов подключение к сервисам Google и Cloud, таким как Maps и BigQuery. (MCP — это соединители между AI-системами, данными и инструментами).

OpenAI заявляет, что GPT-5.2 установила новые рекорды в бенчмарках по кодированию, математике, науке, визуальному восприятию, обработке длинного контекста и использованию инструментов. Компания утверждает, что это позволит создавать «более надежные агентские рабочие процессы, код производственного качества и сложные системы, работающие с большими контекстами и реальными данными».

Эти возможности ставят GPT-5.2 в прямое противостояние с режимом Deep Think модели Gemini 3, который позиционируется как значительный прорыв в области логических рассуждений, ориентированный на математику, логику и науку. Согласно собственным данным OpenAI, GPT-5.2 в режиме Thinking превосходит Gemini 3 и Claude Opus 4.5 от Anthropic почти во всех тестах на логическое мышление, от реальных задач программной инженерии (SWE-Bench Pro) и знаний на уровне докторской степени в науке (GPQA Diamond) до абстрактного мышления и выявления закономерностей (ARC-AGI suites).

Исследователь Эйдан Кларк отметил, что более высокие результаты в математике — это не только решение уравнений. Математическое мышление, по его словам, является показателем способности модели следовать многошаговой логике, сохранять числовые значения непротиворечивыми во времени и избегать тонких ошибок, которые могут накапливаться. «Все это свойства, которые имеют большое значение для широкого спектра задач, — сказал Кларк. — Например, финансовое моделирование, прогнозирование, анализ данных».

Макс Шварцер, руководитель продуктового отдела OpenAI, заявил, что GPT-5.2 «существенно улучшает генерацию и отладку кода» и может пошагово разбирать сложные математические и логические задачи. Стартапы в сфере кодирования, такие как Windsurf и CharlieCode, отмечают «передовую производительность в области агентского кодирования» и ощутимый прогресс в сложных многоэтапных рабочих процессах.

Помимо кодирования, Шварцер сообщил, что ответы GPT-5.2 в режиме Thinking содержат на 38% меньше ошибок по сравнению с предыдущей версией, что делает модель более надежной для повседневного принятия решений, исследований и написания текстов.

GPT-5.2 выглядит скорее как консолидация предыдущих двух обновлений OpenAI, чем как полная переработка. GPT-5, выпущенный в августе, стал основой для унифицированной системы с маршрутизатором, переключающим модель между быстрым стандартным режимом и более глубоким режимом «Thinking». GPT-5.1 в ноябре был сфокусирован на улучшении интерактивности, диалоговых возможностей и пригодности для агентских задач и кодирования. Новейшая модель, GPT-5.2, усиливает все эти достижения, становясь более надежной основой для производственного использования.

Для OpenAI ставки высоки как никогда. Компания взяла на себя обязательства по созданию AI-инфраструктуры на сумму 1,4 триллиона долларов в ближайшие несколько лет для поддержки своего роста — обязательства, принятые в то время, когда она еще обладала преимуществом первопроходца среди AI-компаний. Но теперь, когда Google, изначально отстававшая, выходит вперед, эти инвестиции могут быть причиной «красного кода» Альтмана.

Переориентация OpenAI на модели с улучшенными когнитивными способностями также является рискованным шагом. Системы, лежащие в основе режимов Thinking и Deep Research, требуют больших вычислительных ресурсов и, следовательно, более дороги в эксплуатации, чем стандартные чат-боты. Ставя на такие модели с GPT-5.2, OpenAI рискует попасть в порочный круг: тратить больше на вычисления для победы в рейтингах, а затем тратить еще больше на масштабирование этих дорогостоящих моделей.

Уже сообщается, что OpenAI тратит на вычисления больше, чем предполагалось ранее. Как недавно сообщило издание TechCrunch, большая часть расходов OpenAI на инференс (вычисления для запуска обученной AI-модели) оплачивается наличными, а не через облачные кредиты. Это свидетельствует о том, что затраты компании на вычисления превысили возможности партнерских программ и кредитов.

Во время звонка Симo предположила, что по мере масштабирования OpenAI сможет предлагать больше продуктов и услуг для получения дополнительного дохода, который пойдет на оплату дополнительных вычислительных ресурсов. «Но я считаю, что важно рассматривать это в контексте общей эффективности», — сказала Симo. — «Сегодня вы получаете гораздо больше интеллекта за ту же сумму вычислительных ресурсов и те же деньги, что и год назад».

Несмотря на все усилия в области когнитивных способностей, одной из отсутствующих функций в сегодняшнем релизе является новый генератор изображений. По сообщениям, Альтман указал в своей записке «красный код» на то, что генерация изображений станет приоритетом в будущем, особенно после вирусного успеха модели Nano Banana от Google (кодовое название модели Gemini 2.5 Flash Image от Google), выпущенной в августе.

В прошлом месяце Google представила Nano Banana Pro (он же Gemini 3 Pro Image) — обновленную версию с улучшенным рендерингом текста, глобальными знаниями и реалистичным, неотредактированным изображением. Она также лучше интегрируется в продукты Google, что было продемонстрировано на прошлой неделе при использовании в таких инструментах и рабочих процессах, как Google Labs Mixboard для автоматической генерации презентаций.

OpenAI, по сообщениям, планирует выпустить еще одну новую модель в январе, которая будет отличаться улучшенным качеством изображений, повышенной скоростью и более выраженной «личностью». Однако компания не подтвердила эти планы в четверг.

OpenAI также заявила в четверг о внедрении новых мер безопасности, касающихся использования для психического здоровья и верификации возраста для подростков, но не акцентировала внимание на этих изменениях во время анонса. Данная статья была обновлена с дополнительной информацией о статусе эффективности вычислительных ресурсов OpenAI.

*Признаны экстремистскими организациями и запрещены на территории РФ.

Комментарии

Комментариев пока нет.