¿Puedo probar Gemini 3.5 Flash gratis en Felo AI?

Sí. Felo AI ofrece acceso gratuito a Gemini 3.5 Flash. Regístrate con una cuenta gratuita para empezar — sin necesidad de tarjeta de crédito.

¿Cuándo fue el lanzamiento oficial de Gemini 3.5 Flash?

Gemini 3.5 Flash fue lanzado oficialmente (GA) el 19 de mayo de 2026 en Google I/O. Ahora está disponible a través de la Gemini API, Google AI Studio y Felo AI.

¿Cómo se compara Gemini 3.5 Flash con Gemini 3.1 Pro?

En benchmarks agénticos y de programación, Gemini 3.5 Flash supera a Gemini 3.1 Pro — por ejemplo, MCP Atlas 83,6 % vs 78,2 %, y Terminal-Bench 2.1 76,2 % vs 70,3 %. Funciona 4× más rápido a menos de la mitad del costo. Para tareas de razonamiento académico puro, Gemini 3.1 Pro aún mantiene una ligera ventaja.

¿Qué es el parámetro thinking_level y cómo funciona?

El Thinking está activado por defecto en Gemini 3.5 Flash. El nuevo parámetro thinking_level (valores: low, medium, high) reemplaza al antiguo thinking_budget, permitiéndote controlar la profundidad de razonamiento por solicitud. El valor predeterminado es medium, que equilibra velocidad y profundidad para la mayoría de las tareas.

¿Qué es Thought Preservation?

Thought Preservation retiene automáticamente el razonamiento intermedio a lo largo de conversaciones de múltiples turnos. Esto mejora el rendimiento en tareas iterativas como la depuración y la refactorización de código, donde el contexto de los pasos de razonamiento anteriores es importante.

¿Cuál es el precio de Gemini 3.5 Flash vía API?

Entrada: $1,50 por millón de tokens. Salida: $9,00 por millón de tokens. Entrada en caché: $0,15 por millón de tokens. El caché de contexto hace que las tareas repetidas de contexto largo sean significativamente más rentables.

¿La ventana de contexto de 1M tokens ralentiza las respuestas?

No. Gemini 3.5 Flash utiliza optimizaciones de streaming especializadas para entradas de contexto largo. La velocidad de respuesta se mantiene rápida incluso al procesar documentos o bases de código extensas.

¿Qué puedo hacer con Gemini 3.5 Flash en Felo?

Felo integra Gemini 3.5 Flash en sus funciones principales — búsqueda con IA, investigación profunda y exploración de temas están listas para usar de inmediato. También puedes usar el modelo libremente en Felo LLM Playground para chatear, comparar respuestas o probar tus propios prompts.

Ya disponible · Lanzado en Google I/O 2026 · 19 de mayo de 2026

Gemini 3.5 Flash — GratisIA Agéntica de Nivel Pro a Velocidad Flash

Gemini 3.5 Flash es el modelo frontier más rápido de Google DeepMind, lanzado el 19 de mayo de 2026. Ofrece una profundidad de razonamiento de nivel Pro con una ventana de contexto de 1M tokens y funciona 4× más rápido que modelos frontier comparables a menos de la mitad del costo — pruébalo gratis en Felo AI ahora mismo.

Probar Gemini 3.5 Flash gratis

Gratis en Felo AI — sin tarjeta de crédito

81.2%

Puntuación MMMU-Pro

N.º 1 mundial en benchmark multimodal

$0.50

Precio de entrada

$1,50 / 1M tokens vía API

0.2s

Ventaja de velocidad

4× más rápido que modelos comparables

Ventana de contexto

Tokens en una sola solicitud

Qué hace diferente a Gemini 3.5 Flash

El primer modelo Flash en superar a su propio predecesor Pro en benchmarks agénticos y de programación — manteniendo la velocidad y el costo característicos de Flash.

Diseñado para flujos de trabajo agénticos

Gemini 3.5 Flash es el modelo agéntico y de programación más capaz de Google hasta la fecha. Ejecuta de forma confiable tareas de largo horizonte que duran horas o semanas, gestiona el uso de herramientas en múltiples pasos y coordina sub-agentes a través del framework Antigravity de Google — haciendo que los sistemas agénticos a gran escala sean económicamente viables.

Thinking dinámico — Profundidad de razonamiento configurable

El Thinking está activado por defecto con un nuevo parámetro thinking_level (valor predeterminado: medium). Gemini 3.5 Flash realiza una planificación interna de múltiples pasos antes de responder, ofreciendo una profundidad de razonamiento que rivaliza con los modelos Pro insignia en tareas de matemáticas, programación y lógica — con la profundidad ajustable por solicitud.

Ventana de contexto de 1M tokens

Procesa una base de código completa, horas de video o un año de contratos financieros en una sola solicitud. La ventana de 1M tokens de entrada combinada con 64K tokens de salida garantiza que las tareas complejas se completen sin truncamientos. La puntuación MRCR v2 de contexto largo del 26,6 % lidera entre todos los modelos comparables.

4× más rápido, menos de la mitad del costo

Gemini 3.5 Flash funciona 4× más rápido que modelos frontier comparables a menos de la mitad del costo. A $1,50 por millón de tokens de entrada con caché de contexto a $0,15/M, ejecutar agentes de IA las 24 horas se vuelve una opción práctica — no solo técnicamente posible.

La nueva frontera de Pareto: Velocidad × Inteligencia

Durante años, más rápido significaba menos capaz. Gemini 3.5 Flash rompe ese equilibrio — se sitúa en la parte superior derecha de la curva velocidad-inteligencia, superando a modelos que cuestan mucho más.

Gráfico de Inteligencia vs Velocidad que muestra a Gemini 3.5 Flash en la frontera de Pareto

Gemini 3.5 Flash lidera la frontera de Pareto inteligencia-vs-velocidad entre los modelos frontier. Fuente: Artificial Analysis, mayo de 2026.

Benchmarks de rendimiento

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Resultados oficiales del model card. Gemini 3.5 Flash lidera en comprensión multimodal, uso de herramientas agénticas y recuperación de contexto largo.

Benchmark

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Fuente: Gemini 3.5 Flash Model Card — Google DeepMind, mayo de 2026.

Especificaciones técnicas

Todo lo que necesitas saber antes de integrar Gemini 3.5 Flash en tu aplicación.

Ventana de contexto

1.048.576 tokens de entrada

65.536 tokens de salida

Precios de API

$1,50 / 1M tokens de entrada

$9,00 / 1M tokens de salida

$0,15 / 1M tokens en caché

Disponibilidad general

19 de mayo de 2026 — Google I/O

Fecha de corte del conocimiento

Enero de 2026

Modo de razonamiento

Activado por defecto. Configurable mediante thinking_level: low / medium (predeterminado) / high. Thought Preservation retiene el razonamiento a lo largo de conversaciones de múltiples turnos.

Uso de herramientas y APIs

Llamadas a funciones, salida estructurada, ejecución de código, fundamentación con Google Search, caché de contexto — todo compatible de forma nativa.

Modalidades de entrada

Texto, imágenes, audio, video, PDF — multimodal nativo, sin preprocesamiento requerido.

Multimodal nativo — un solo modelo, todos los tipos de entrada

Gemini 3.5 Flash procesa texto, imágenes, audio y video de forma nativa — sin pipelines separados ni ensamblaje de múltiples modelos.

Texto y PDF

Analiza documentos de millones de palabras con alta precisión. Gestiona tablas complejas, código y datos estructurados en un solo paso.

Comprensión de imágenes

Puntuación MMMU-Pro de 83,6 % — n.º 1 mundial. Analiza planos arquitectónicos, gráficos y contenido visual detallado en tiempo real.

Análisis de video

Admite hasta 1 hora de video como entrada. Captura cambios clave fotograma a fotograma para resúmenes, preguntas y análisis de contenido.

Procesamiento de audio

Reconoce emociones, sonidos ambientales y conversaciones multilingües. Impulsa la traducción en tiempo real y los asistentes de voz.

Disponible en todos los entornos de desarrollo

Gemini 3.5 Flash está profundamente integrado en el ecosistema de desarrolladores y consumidores de Google — desde el acceso por API hasta el modelo predeterminado que impulsa a miles de millones de usuarios.

Plataformas para desarrolladores

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Plataforma de Agentes Enterprise Gemini (Vertex AI)

Productos para consumidores

App Gemini — modelo predeterminado global
Modo IA de Google Search — modelo predeterminado
Gemini Spark — agente de IA personal
Felo AI — acceso gratuito vía búsqueda y playground

Gráfico de Inteligencia vs Costo que muestra a Gemini 3.5 Flash como el modelo frontier de mejor relación calidad-precio

Gemini 3.5 Flash lidera la frontera inteligencia-vs-costo. Menos de la mitad del costo de modelos comparables para un rendimiento de tareas equivalente. Fuente: Artificial Analysis, mayo de 2026.

Quién usa Gemini 3.5 Flash

Desde desarrolladores individuales hasta equipos enterprise, Gemini 3.5 Flash encaja donde necesitas IA rápida y capaz a escala.

Programación agéntica

Puntuación Terminal-Bench 2.1 de 76,2 % con baja latencia. Los agentes de código completan tareas más rápido con menos brechas lógicas — generación iterativa de código, depuración y pruebas A/B a velocidad Flash.

Procesamiento financiero y fiscal

Procesa un año completo de contratos y estados de cuenta en una sola solicitud. Xero lo usa para gestionar formularios fiscales 1099; Ramp usa su OCR multimodal para el procesamiento de facturas complejas.

Plataformas de agentes enterprise

Salesforce lo integra en Agentforce para acelerar el despliegue de agentes enterprise. Databricks lo usa para monitorear datos en tiempo real y diagnosticar problemas de forma autónoma.

Tareas empresariales de largo horizonte

Shopify lo usa para la previsión de crecimiento de comerciantes. Ejecuta de forma confiable flujos de trabajo complejos que duran horas o semanas — el tipo de tareas que antes requerían supervisión humana en cada paso.

Análisis de contenido multimodal

Analiza video, imágenes y documentos juntos en una sola solicitud. La puntuación CharXiv Reasoning de 84,2 % significa que extrae información de gráficos complejos y contenido multimedia con precisión.

Productos de IA para consumidores

Ahora es el modelo predeterminado en la app Gemini y en el modo IA de Google Search — sirviendo a miles de millones de usuarios activos mensuales. El Fast Mode ofrece respuestas casi instantáneas en dispositivos móviles.

Lo que dicen los equipos

“Su rendimiento en contextos largos es excepcional para procesar conjuntos de datos multimodales no estructurados a gran escala.”

— Bridgewater Associates

“Integramos Gemini 3.5 Flash en Agentforce para acelerar el despliegue de agentes enterprise — la relación velocidad-capacidad es como nada que hayamos visto antes.”

— Salesforce

“Gemini 3.5 Flash nos permite monitorear información en tiempo real y diagnosticar problemas de forma autónoma en nuestros flujos de trabajo agénticos.”

— Databricks

Dos formas de usar Gemini 3.5 Flash en Felo

Felo AI Search

Abre Felo AI Search y selecciona el modelo Gemini 3.5 Flash. Haz preguntas, busca en la web con IA y obtén respuestas con fuentes citadas — impulsadas por el modelo frontier más rápido de Google.

Abrir Felo AI Search

Felo LLM Playground

Abre Felo LLM Playground, selecciona Gemini 3.5 Flash y empieza a chatear. Compara las salidas de varios modelos en paralelo para ver de primera mano la diferencia en velocidad y razonamiento.

Abrir Playground

Preguntas frecuentes

Prueba Gemini 3.5 Flash gratis �� ahora mismo

Lanzado en Google I/O 2026. Abre Felo AI y empieza a usar el modelo frontier más rápido de Google hoy mismo.

Abrir Gemini 3.5 Flash en Felo

Gratis — sin tarjeta de crédito

Gemini 3.5 Flash — GratisIA Agéntica de Nivel Pro a Velocidad Flash

Qué hace diferente a Gemini 3.5 Flash

Diseñado para flujos de trabajo agénticos

Thinking dinámico — Profundidad de razonamiento configurable

Ventana de contexto de 1M tokens

4× más rápido, menos de la mitad del costo

La nueva frontera de Pareto: Velocidad × Inteligencia

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Especificaciones técnicas

Ventana de contexto

Precios de API

Disponibilidad general

Fecha de corte del conocimiento

Modo de razonamiento

Uso de herramientas y APIs

Modalidades de entrada

Multimodal nativo — un solo modelo, todos los tipos de entrada

Texto y PDF

Comprensión de imágenes

Análisis de video

Procesamiento de audio

Disponible en todos los entornos de desarrollo

Plataformas para desarrolladores

Productos para consumidores

Quién usa Gemini 3.5 Flash

Programación agéntica

Procesamiento financiero y fiscal

Plataformas de agentes enterprise

Tareas empresariales de largo horizonte

Análisis de contenido multimodal

Productos de IA para consumidores

Lo que dicen los equipos

Dos formas de usar Gemini 3.5 Flash en Felo

Felo AI Search

Felo LLM Playground

Preguntas frecuentes

Prueba Gemini 3.5 Flash gratis ��� ahora mismo

Prueba Gemini 3.5 Flash gratis �� ahora mismo