Ya disponible · Lanzado en Google I/O 2026 · 19 de mayo de 2026

Gemini 3.5 Flash — GratisIA Agéntica de Nivel Pro a Velocidad Flash

Gemini 3.5 Flash es el modelo frontier más rápido de Google DeepMind, lanzado el 19 de mayo de 2026. Ofrece una profundidad de razonamiento de nivel Pro con una ventana de contexto de 1M tokens y funciona 4× más rápido que modelos frontier comparables a menos de la mitad del costo — pruébalo gratis en Felo AI ahora mismo.

Gratis en Felo AI — sin tarjeta de crédito

81.2%
Puntuación MMMU-Pro
N.º 1 mundial en benchmark multimodal
$0.50
Precio de entrada
$1,50 / 1M tokens vía API
0.2s
Ventaja de velocidad
4× más rápido que modelos comparables
1M
Ventana de contexto
Tokens en una sola solicitud

Qué hace diferente a Gemini 3.5 Flash

El primer modelo Flash en superar a su propio predecesor Pro en benchmarks agénticos y de programación — manteniendo la velocidad y el costo característicos de Flash.

Ícono de velocidad

Diseñado para flujos de trabajo agénticos

Gemini 3.5 Flash es el modelo agéntico y de programación más capaz de Google hasta la fecha. Ejecuta de forma confiable tareas de largo horizonte que duran horas o semanas, gestiona el uso de herramientas en múltiples pasos y coordina sub-agentes a través del framework Antigravity de Google — haciendo que los sistemas agénticos a gran escala sean económicamente viables.

Ícono de razonamiento

Thinking dinámico — Profundidad de razonamiento configurable

El Thinking está activado por defecto con un nuevo parámetro thinking_level (valor predeterminado: medium). Gemini 3.5 Flash realiza una planificación interna de múltiples pasos antes de responder, ofreciendo una profundidad de razonamiento que rivaliza con los modelos Pro insignia en tareas de matemáticas, programación y lógica — con la profundidad ajustable por solicitud.

Ícono de contexto

Ventana de contexto de 1M tokens

Procesa una base de código completa, horas de video o un año de contratos financieros en una sola solicitud. La ventana de 1M tokens de entrada combinada con 64K tokens de salida garantiza que las tareas complejas se completen sin truncamientos. La puntuación MRCR v2 de contexto largo del 26,6 % lidera entre todos los modelos comparables.

Ícono de costo

4× más rápido, menos de la mitad del costo

Gemini 3.5 Flash funciona 4× más rápido que modelos frontier comparables a menos de la mitad del costo. A $1,50 por millón de tokens de entrada con caché de contexto a $0,15/M, ejecutar agentes de IA las 24 horas se vuelve una opción práctica — no solo técnicamente posible.

La nueva frontera de Pareto: Velocidad × Inteligencia

Durante años, más rápido significaba menos capaz. Gemini 3.5 Flash rompe ese equilibrio — se sitúa en la parte superior derecha de la curva velocidad-inteligencia, superando a modelos que cuestan mucho más.

Gráfico de Inteligencia vs Velocidad que muestra a Gemini 3.5 Flash en la frontera de Pareto

Gemini 3.5 Flash lidera la frontera de Pareto inteligencia-vs-velocidad entre los modelos frontier. Fuente: Artificial Analysis, mayo de 2026.

Benchmarks de rendimiento

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Resultados oficiales del model card. Gemini 3.5 Flash lidera en comprensión multimodal, uso de herramientas agénticas y recuperación de contexto largo.

Benchmark
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Fuente: Gemini 3.5 Flash Model Card — Google DeepMind, mayo de 2026.

Especificaciones técnicas

Todo lo que necesitas saber antes de integrar Gemini 3.5 Flash en tu aplicación.

Ventana de contexto

1.048.576 tokens de entrada
65.536 tokens de salida

Precios de API

$1,50 / 1M tokens de entrada
$9,00 / 1M tokens de salida
$0,15 / 1M tokens en caché

Disponibilidad general

19 de mayo de 2026 — Google I/O

Fecha de corte del conocimiento

Enero de 2026

Modo de razonamiento

Activado por defecto. Configurable mediante thinking_level: low / medium (predeterminado) / high. Thought Preservation retiene el razonamiento a lo largo de conversaciones de múltiples turnos.

Uso de herramientas y APIs

Llamadas a funciones, salida estructurada, ejecución de código, fundamentación con Google Search, caché de contexto — todo compatible de forma nativa.

Modalidades de entrada

Texto, imágenes, audio, video, PDF — multimodal nativo, sin preprocesamiento requerido.

Multimodal nativo — un solo modelo, todos los tipos de entrada

Gemini 3.5 Flash procesa texto, imágenes, audio y video de forma nativa — sin pipelines separados ni ensamblaje de múltiples modelos.

Texto y PDF

Analiza documentos de millones de palabras con alta precisión. Gestiona tablas complejas, código y datos estructurados en un solo paso.

Comprensión de imágenes

Puntuación MMMU-Pro de 83,6 % — n.º 1 mundial. Analiza planos arquitectónicos, gráficos y contenido visual detallado en tiempo real.

Análisis de video

Admite hasta 1 hora de video como entrada. Captura cambios clave fotograma a fotograma para resúmenes, preguntas y análisis de contenido.

Procesamiento de audio

Reconoce emociones, sonidos ambientales y conversaciones multilingües. Impulsa la traducción en tiempo real y los asistentes de voz.

Disponible en todos los entornos de desarrollo

Gemini 3.5 Flash está profundamente integrado en el ecosistema de desarrolladores y consumidores de Google — desde el acceso por API hasta el modelo predeterminado que impulsa a miles de millones de usuarios.

Plataformas para desarrolladores

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Plataforma de Agentes Enterprise Gemini (Vertex AI)

Productos para consumidores

  • App Gemini — modelo predeterminado global
  • Modo IA de Google Search — modelo predeterminado
  • Gemini Spark — agente de IA personal
  • Felo AI — acceso gratuito vía búsqueda y playground
Gráfico de Inteligencia vs Costo que muestra a Gemini 3.5 Flash como el modelo frontier de mejor relación calidad-precio

Gemini 3.5 Flash lidera la frontera inteligencia-vs-costo. Menos de la mitad del costo de modelos comparables para un rendimiento de tareas equivalente. Fuente: Artificial Analysis, mayo de 2026.

Quién usa Gemini 3.5 Flash

Desde desarrolladores individuales hasta equipos enterprise, Gemini 3.5 Flash encaja donde necesitas IA rápida y capaz a escala.

Programación agéntica

Puntuación Terminal-Bench 2.1 de 76,2 % con baja latencia. Los agentes de código completan tareas más rápido con menos brechas lógicas — generación iterativa de código, depuración y pruebas A/B a velocidad Flash.

Procesamiento financiero y fiscal

Procesa un año completo de contratos y estados de cuenta en una sola solicitud. Xero lo usa para gestionar formularios fiscales 1099; Ramp usa su OCR multimodal para el procesamiento de facturas complejas.

Plataformas de agentes enterprise

Salesforce lo integra en Agentforce para acelerar el despliegue de agentes enterprise. Databricks lo usa para monitorear datos en tiempo real y diagnosticar problemas de forma autónoma.

Tareas empresariales de largo horizonte

Shopify lo usa para la previsión de crecimiento de comerciantes. Ejecuta de forma confiable flujos de trabajo complejos que duran horas o semanas — el tipo de tareas que antes requerían supervisión humana en cada paso.

Análisis de contenido multimodal

Analiza video, imágenes y documentos juntos en una sola solicitud. La puntuación CharXiv Reasoning de 84,2 % significa que extrae información de gráficos complejos y contenido multimedia con precisión.

Productos de IA para consumidores

Ahora es el modelo predeterminado en la app Gemini y en el modo IA de Google Search — sirviendo a miles de millones de usuarios activos mensuales. El Fast Mode ofrece respuestas casi instantáneas en dispositivos móviles.

Lo que dicen los equipos

Su rendimiento en contextos largos es excepcional para procesar conjuntos de datos multimodales no estructurados a gran escala.

Bridgewater Associates

Integramos Gemini 3.5 Flash en Agentforce para acelerar el despliegue de agentes enterprise — la relación velocidad-capacidad es como nada que hayamos visto antes.

Salesforce

Gemini 3.5 Flash nos permite monitorear información en tiempo real y diagnosticar problemas de forma autónoma en nuestros flujos de trabajo agénticos.

Databricks

Dos formas de usar Gemini 3.5 Flash en Felo

Felo AI Search

Abre Felo AI Search y selecciona el modelo Gemini 3.5 Flash. Haz preguntas, busca en la web con IA y obtén respuestas con fuentes citadas — impulsadas por el modelo frontier más rápido de Google.

Abrir Felo AI Search

Felo LLM Playground

Abre Felo LLM Playground, selecciona Gemini 3.5 Flash y empieza a chatear. Compara las salidas de varios modelos en paralelo para ver de primera mano la diferencia en velocidad y razonamiento.

Abrir Playground

Preguntas frecuentes

Prueba Gemini 3.5 Flash gratis ��� ahora mismo

Lanzado en Google I/O 2026. Abre Felo AI y empieza a usar el modelo frontier más rápido de Google hoy mismo.

Abrir Gemini 3.5 Flash en Felo

Gratis — sin tarjeta de crédito