Gemini 3 Pro se presenta como el modelo más «razonable» de Google, y la compañía posiciona abiertamente su solución como líder de la industria en muchos aspectos. Evaluaciones independientes lo confirman.
Según Artificial Analysis, el modelo se ha convertido en el nuevo líder de su índice integral.
Índice de IA de Artificial Analysis. Datos: Artificial Analysis.
Si hemos de creer las pruebas de Artificial Analysis, Google ha tomado la delantera sobre sus competidores en las áreas de tareas inteligentes — razonamiento, comprensión de estructuras complejas, precisión y multimodalidad.
El rendimiento en Análisis Profundo merece especial atención. En el Examen Final de la Humanidad, que evalúa la capacidad de un modelo para resolver problemas de nivel doctoral sin herramientas, Gemini 3 Pro obtuvo más del 37%.
Esto es más de diez puntos porcentuales por encima del récord anterior. En ARC-AGI-2, uno de los benchmarks más desafiantes que evalúa la capacidad de derivar reglas y aplicarlas a nuevas situaciones, el modelo también puntuó por encima de la mayoría de los competidores.
Resultados de diez pruebas especializadas de Artificial Analysis. Datos: Artificial Analysis.
El alto rendimiento también es evidente en las pruebas matemáticas, destacó Google. En la prueba MathArena Apex, donde las preguntas de niveles extremos de complejidad tradicionalmente desequilibran a los modelos, Gemini 3 Pro recibió un 23,4%. Anteriormente, esta cifra era inalcanzable para otros sistemas, y los mejores resultados no superaban el 5,2%.
Resultados de la prueba MathArena Apex. Datos: MathArena.
En pruebas multimodales, el Gemini actualizado también ocupa las primeras posiciones. Los expertos atribuyen esto directamente a la escala potencialmente grande del modelo.
Esta hipótesis explicaría la capacidad de la IA de Google para superar a productos de otras empresas en tareas que involucran análisis visual y comprensión espacial.
Por separado, vale la pena señalar una comparación con Claude y ChatGPT. En el benchmark SWE-Bench Verified, que prueba la capacidad de manejar autónomamente tareas de GitHub, el nuevo modelo está solo un uno por ciento por detrás de Sonnet 4.5. En otras métricas, Gemini a menudo sale adelante.
Resultados comparativos de pruebas de diferentes modelos de IA. Datos: Google.
Otra evidencia importante es la velocidad del modelo. Artificial Analysis señala que Gemini 3 Pro genera aproximadamente 128 tokens por segundo. Esto es más rápido que el rendimiento de GPT-5.1, Kimi K2 Thinking y Grok 4.
Esto se debe muy probablemente a la propia plataforma de hardware de Google basada en procesadores Tensor Processing Unit (TPU).
Así, en varios parámetros, el modelo compite con confianza con los buques insignia existentes y en muchos casos los supera. Al mismo tiempo, el producto se queda atrás de sus competidores en algunas pruebas, pero generalmente solo ligeramente.

Datos técnicos de Gemini 3 Pro. Datos: Google.
Descripción de las nuevas características en Gemini 3 Pro. Datos: Google.
Prueba Vending-Bench 2. Datos: Google.


