Google представила «лучшую в мире» ИИ-модель Gemini 3

Hazik

Модератор
Команда форума
Местный
Регистрация
03.10.2025
Сообщения
775

Презентация Gemini 3


Google официально представила Gemini 3 — свою самую мощную и продвинутую ИИ-модель. Компания заявляет, что она объединяет способности всей линейки и «считается лучшей в мире».


В анонсе Google подчеркнула эволюцию линейки:
Gemini 1 принес встроенную мультимодальность и длинные контекстные окна.
Gemini 2 расширил агентные возможности и улучшил качество рассуждений.
Gemini 2.5 Pro более полугода занимал первое место в рейтинге LMArena.


Gemini 3 создавался как система глубоких рассуждений, способная улавливать тонкие детали, понимать контекст и разбирать комплексные задачи.


Особенности модели


Google утверждает, что Gemini 3:
— понимает смысл запроса с меньшим количеством подсказок;
— использует улучшенные механизмы логического вывода;
— лучше интерпретирует творческие идеи;
— обеспечивает более высокую точность в сложных задачах.


Модель уже доступна в:
Google Search, приложении Gemini, AI Studio, Vertex AI и среде для вайб-кодинга Google Antigravity.


Руководители DeepMind Демис Хассабис и Корай Кавукчуоглу называют Gemini 3 «самой мощной моделью Google для мультимодального понимания, агентного поведения и интерактивной визуализации».


Режим глубоких рассуждений — Gemini 3 Deep Think


Одновременно представлен новый режим Deep Think, который усиливает логическую часть модели.
Он пока доступен тестировщикам по безопасности, позже станет функцией для подписчиков Google AI Ultra.


Производительность и бенчмарки


Gemini 3 Pro значительно превосходит 2.5 Pro по ключевым метрикам.


Основные результаты:
LMArena: первое место, 1501 Elo — уровень рассуждений, сопоставимый с PhD.
Humanity’s Last Exam: 37,5%.
GPQA Diamond: 91,9%.
MathArena Apex: 23,4% (математические задачи).
MMMU-Pro: 81% (мультимодальное мышление).
Video-MMMU: 87,6%.
SimpleQA Verified: 72,1%.


Google подчёркивает, что показатели говорят о способности модели решать сложные задачи в науке, математике и смежных областях с высокой точностью.


Стиль ответов


По заявлению команды, Gemini 3 Pro отвечает «умно, компактно и прямо» — формулирует то, что важно услышать, а не то, что хочет пользователь.


Gemini 3 Deep Think — результаты тестов


Режим Deep Think показывает ещё более высокие показатели на сложных метриках:
Humanity’s Last Exam: 41%.
GPQA Diamond: 93,8%.
ARC-AGI-2: 45,1%.
 
Назад
Верх