- Регистрация
- 03.10.2025
- Сообщения
- 775
Презентация Gemini 3
Google официально представила Gemini 3 — свою самую мощную и продвинутую ИИ-модель. Компания заявляет, что она объединяет способности всей линейки и «считается лучшей в мире».
В анонсе Google подчеркнула эволюцию линейки:
— Gemini 1 принес встроенную мультимодальность и длинные контекстные окна.
— Gemini 2 расширил агентные возможности и улучшил качество рассуждений.
— Gemini 2.5 Pro более полугода занимал первое место в рейтинге LMArena.
Gemini 3 создавался как система глубоких рассуждений, способная улавливать тонкие детали, понимать контекст и разбирать комплексные задачи.
Особенности модели
Google утверждает, что Gemini 3:
— понимает смысл запроса с меньшим количеством подсказок;
— использует улучшенные механизмы логического вывода;
— лучше интерпретирует творческие идеи;
— обеспечивает более высокую точность в сложных задачах.
Модель уже доступна в:
Google Search, приложении Gemini, AI Studio, Vertex AI и среде для вайб-кодинга Google Antigravity.
Руководители DeepMind Демис Хассабис и Корай Кавукчуоглу называют Gemini 3 «самой мощной моделью Google для мультимодального понимания, агентного поведения и интерактивной визуализации».
Режим глубоких рассуждений — Gemini 3 Deep Think
Одновременно представлен новый режим Deep Think, который усиливает логическую часть модели.
Он пока доступен тестировщикам по безопасности, позже станет функцией для подписчиков Google AI Ultra.
Производительность и бенчмарки
Gemini 3 Pro значительно превосходит 2.5 Pro по ключевым метрикам.
Основные результаты:
— LMArena: первое место, 1501 Elo — уровень рассуждений, сопоставимый с PhD.
— Humanity’s Last Exam: 37,5%.
— GPQA Diamond: 91,9%.
— MathArena Apex: 23,4% (математические задачи).
— MMMU-Pro: 81% (мультимодальное мышление).
— Video-MMMU: 87,6%.
— SimpleQA Verified: 72,1%.
Google подчёркивает, что показатели говорят о способности модели решать сложные задачи в науке, математике и смежных областях с высокой точностью.
Стиль ответов
По заявлению команды, Gemini 3 Pro отвечает «умно, компактно и прямо» — формулирует то, что важно услышать, а не то, что хочет пользователь.
Gemini 3 Deep Think — результаты тестов
Режим Deep Think показывает ещё более высокие показатели на сложных метриках:
— Humanity’s Last Exam: 41%.
— GPQA Diamond: 93,8%.
— ARC-AGI-2: 45,1%.