Gemini 3 Pro представлен как самая «разумная» модель Google, и компания открыто позиционирует свое решение как лидера отрасли во многих отношениях. Независимые оценки это подтверждают.
Согласно Artificial Analysis, модель стала новым лидером их интегрального индекса.
Индекс ИИ от Artificial Analysis. Данные: Artificial Analysis.
Если верить тестам Artificial Analysis, Google опередила своих конкурентов в областях интеллектуальных задач — рассуждения, понимания сложных структур, точности и мультимодальности.
Особого внимания заслуживают результаты в Deep Analysis. На тесте Humanity's Last Exam, который оценивает способность модели решать проблемы докторского уровня без инструментов, Gemini 3 Pro набрал более 37%.
Это более чем на десять процентных пунктов выше предыдущего рекорда. На ARC-AGI-2, одном из самых сложных тестов, оценивающих способность выводить правила и применять их к новым ситуациям, модель также показала результаты выше большинства конкурентов.
Результаты десяти специализированных тестов от Artificial Analysis. Данные: Artificial Analysis.
Высокая производительность также очевидна в математических тестах, подчеркнули в Google. В тесте MathArena Apex, где вопросы экстремальных уровней сложности традиционно выводят модели из равновесия, Gemini 3 Pro получил 23,4%. Ранее эта цифра была недостижима для других систем, а лучшие результаты не превышали 5,2%.
Результаты теста MathArena Apex. Данные: MathArena.
В мультимодальных тестах обновленный Gemini также занимает первые позиции. Эксперты напрямую связывают это с потенциально большим масштабом модели.
Эта гипотеза объяснила бы способность ИИ Google превосходить продукты других компаний в задачах, связанных с визуальным анализом и пространственным пониманием.
Отдельно стоит отметить сравнение с Claude и ChatGPT. На тесте SWE-Bench Verified, который проверяет способность автономно обрабатывать задачи GitHub, новая модель отстает от Sonnet 4.5 всего на один процент. По другим показателям Gemini часто выходит вперед.
Сравнительные результаты тестов различных моделей ИИ. Данные: Google.
Еще одним важным доказательством является скорость модели. Artificial Analysis отмечает, что Gemini 3 Pro генерирует около 128 токенов в секунду. Это быстрее, чем производительность GPT-5.1, Kimi K2 Thinking и Grok 4.
Скорее всего, это связано с собственной аппаратной платформой Google на основе процессоров Tensor Processing Unit (TPU).
Таким образом, по ряду параметров модель уверенно конкурирует с существующими флагманами и во многих случаях превосходит их. При этом продукт отстает от конкурентов в некоторых тестах, но обычно лишь незначительно.

Технические данные Gemini 3 Pro. Данные: Google.
Описание новых функций в Gemini 3 Pro. Данные: Google.
Тест Vending-Bench 2. Данные: Google.


