Opus 4.5: Новый ИИ от Anthropic с улучшенной памятью
Компания Anthropic представила Opus 4.5, новейшую версию своей флагманской модели искусственного интеллекта. Это завершающая модель в серии 4.5, вслед за Sonnet 4.5 и Haiku 4.5.
Новая версия Opus демонстрирует передовые результаты на различных тестах, включая оценку навыков программирования (SWE-Bench и Terminal-bench), использование инструментов (tau2-bench и MCP Atlas) и решение общих задач (ARC-AGI 2, GPQA Diamond).
Особенно стоит отметить, что Opus 4.5 первым преодолел порог в 80% на верифицированном тесте SWE-Bench, являющемся авторитетным бенчмарком для оценки кодирования.
Anthropic также акцентировала внимание на возможностях Opus в работе с компьютером и электронными таблицами. В связи с этим были анонсированы новые продукты: Claude for Chrome и Claude for Excel. Расширение для Chrome станет доступно всем пользователям Max, а версия для Excel — пользователям Max, Team и Enterprise.
Opus 4.5 получил значительные улучшения в области работы с памятью для обработки длинных контекстов. Эти изменения позволили внедрить долгожданную функцию «бесконечного чата» для платных пользователей Claude. Теперь диалоги могут продолжаться без прерываний при достижении лимита контекстного окна. Модель будет сжимать свою память, не уведомляя пользователя.
«Мы добились улучшений в общем качестве обработки длинного контекста при обучении Opus 4.5, но самих по себе контекстных окон недостаточно», — отметила Дианна На Пенн, руководитель отдела управления продуктами в Anthropic. «Важно не только иметь увеличенное контекстное окно, но и знать, какие детали необходимо запомнить».
Многие из этих обновлений ориентированы на сценарии использования ИИ-агентов, особенно когда Opus выступает в роли главного агента, управляющего группой подчиненных агентов на базе Haiku. Для эффективного управления такими задачами требуется сильная рабочая память, именно здесь улучшения, описанные Пенн, демонстрируют свою ценность.
«В таких условиях фундаментальные аспекты, такие как память, становятся крайне важными», — добавляет Пенн. «Claude должен уметь анализировать кодовые базы и большие документы, а также понимать, когда нужно вернуться назад и перепроверить информацию».
Opus 4.5 предстоит столкнуться с серьезной конкуренцией со стороны других недавно выпущенных передовых моделей, в частности GPT 5.1 от OpenAI и Gemini 3 от Google.
Комментарии
Комментариев пока нет.