Google анонсировала свое новое семейство ИИ-моделей под названием Gemini 2.5, позиционируя его как прорыв в области искусственного интеллекта. Флагманская модель Gemini 2.5 Pro демонстрирует мультимодальные возможности с глубокой интеграцией «мышления», что позволяет эффективно анализировать информацию, делать логические выводы и решать сложные задачи с учетом контекста.
Инновационная модель значительно превосходит предыдущие версии, такие как Gemini 2.0 Flash Thinking. Gemini 2.5 Pro лидирует в нескольких тестах: она заняла первое место в тестах LMArena по предпочтениям пользователей, AIME 2025 в математике и GPQA diamond в науке. Особенно впечатляет результат в тесте Humanity’s Last Exam, где модель показала 18,8% в оценке знания и рассуждений на уровне человеческого предела.
В области программирования Gemini 2.5 Pro продемонстрировала значительный прогресс. В тесте SWE-Bench Verified она набрала 63,8%, обойдя конкурирующие модели OpenAI o3-mini и DeepSeek R1, уступив лишь Anthropic Claude 3.7 Sonnet. Модель также установила новый стандарт в редактировании кода, демонстрируя 68,6% в тесте Aider Polyglot.
Контекстное окно Gemini 2.5 Pro поддерживает до 1 миллиона токенов, а вскоре этот лимит будет увеличен до 2 миллионов, что позволяет обрабатывать огромные объемы данных, включая текст, аудио, изображения, видео и целые репозитории кода.
Google подчеркивает потенциал модели Gemini 2.5 Pro как фундамента для будущих ИИ-агентов, способных выполнять задачи автономно, анонсируя её как ответ на модели от OpenAI. Новая модель может стать основой для множества приложений, изменяя подход к решению сложных задач в разных областях.