Gemini Deep Research: ИИ-агент нового поколения
Google представил обновленную версию своего исследовательского агента Gemini Deep Research, построенную на базе передовой модели Gemini 3 Pro. Этот инструмент выходит за рамки создания отчетов, позволяя разработчикам интегрировать возможности Google в собственные приложения с помощью нового API Interactions, предоставляющего расширенный контроль в эпоху агентного ИИ.
Gemini Deep Research способен обрабатывать огромные объемы информации и большие объемы данных в запросах. Клиенты используют его для различных задач, от проведения комплексных проверок до исследований токсичности лекарств.
В ближайшем будущем этот агент будет интегрирован в сервисы Google, включая Поиск, Финансы, приложение Gemini и NotebookLM. Это шаг к будущему, где ИИ-агенты будут выполнять поиск информации вместо пользователей.
Разработчики подчеркивают, что Gemini Deep Research использует Gemini 3 Pro — наиболее «фактическую» модель Google, обученную минимизировать галлюцинации при выполнении сложных задач. Проблема «галлюцинаций» (генерации недостоверной информации) особенно актуальна для длительных и глубоких рассуждений, где множество автономных решений могут привести к некорректному результату.
Для демонстрации своих достижений Google разработал новый бенчмарк DeepSearchQA, предназначенный для тестирования агентов в сложных многошаговых задачах поиска информации. Этот бенчмарк был открыт для сообщества.
Агент также был протестирован на независимых бенчмарках: Humanity’s Last Exam, содержащем узкоспециализированные задачи, и BrowserComp, ориентированном на браузерные агентные задачи.
Gemini Deep Research показал превосходные результаты на собственном бенчмарке Google и Humanity’s Last Exam. Примечательно, что ChatGPT 5 Pro от OpenAI занял второе место, лишь немного уступив Google в BrowserComp.
Однако, стоит отметить, что сравнения бенчмарков устарели практически в момент публикации. В тот же день OpenAI анонсировала выход GPT 5.2 (под кодовым названием Garlic), утверждая, что их новая модель превосходит конкурентов, в том числе Google, по ряду стандартных бенчмарков.
Интересным аспектом этой новости стала своевременность. Зная об ожидаемом релизе Garlic, Google представил свою собственную разработку в области ИИ.
*Признаны экстремистскими организациями и запрещены на территории РФ.
Комментарии
Комментариев пока нет.