Já disponível · Lançado no Google I/O 2026 · 19 de maio de 2026

Gemini 3.5 Flash — GrátisIA Agêntica de Nível Pro na Velocidade Flash

O Gemini 3.5 Flash é o modelo frontier mais rápido do Google DeepMind, lançado em 19 de maio de 2026. Ele entrega profundidade de raciocínio de nível Pro com uma janela de contexto de 1M tokens e roda 4× mais rápido que modelos frontier comparáveis a menos da metade do custo — experimente grátis no Felo AI agora mesmo.

Gratuito no Felo AI — sem necessidade de cartão de crédito

81.2%
Pontuação MMMU-Pro
N.º 1 mundial em benchmark multimodal
$0.50
Preço de entrada
US$ 1,50 / 1M tokens via API
0.2s
Vantagem de velocidade
4× mais rápido que modelos comparáveis
1M
Janela de contexto
Tokens em uma única requisição

O que torna o Gemini 3.5 Flash diferente

O primeiro modelo Flash a superar seu próprio predecessor Pro em benchmarks agênticos e de programação — mantendo a velocidade e o custo característicos do Flash.

Ícone de velocidade

Criado para fluxos de trabalho agênticos

O Gemini 3.5 Flash é o modelo agêntico e de programação mais capaz do Google até hoje. Ele executa com confiança tarefas de longo horizonte que duram horas ou semanas, lida com uso de ferramentas em múltiplas etapas e coordena sub-agentes via framework Antigravity do Google — tornando sistemas agênticos em larga escala economicamente viáveis.

Ícone de raciocínio

Thinking Dinâmico — Profundidade de raciocínio configurável

O Thinking vem ativado por padrão com um novo parâmetro thinking_level (padrão: medium). O Gemini 3.5 Flash realiza planejamento interno em múltiplas etapas antes de responder, entregando profundidade de raciocínio que rivaliza com modelos Pro principais em tarefas de matemática, programação e lógica — com a profundidade ajustável por requisição.

Ícone de contexto

Janela de contexto de 1M tokens

Processe uma base de código inteira, horas de vídeo ou um ano de contratos financeiros em uma única requisição. A janela de 1M tokens de entrada combinada com 64K tokens de saída garante que tarefas complexas sejam concluídas sem truncamentos. A pontuação MRCR v2 de contexto longo de 26,6% lidera todos os modelos comparáveis.

Ícone de custo

4× mais rápido, menos da metade do custo

O Gemini 3.5 Flash roda 4× mais rápido que modelos frontier comparáveis a menos da metade do custo. A US$ 1,50 por milhão de tokens de entrada com cache de contexto a US$ 0,15/M, executar agentes de IA 24 horas por dia se torna uma opção prática — não apenas tecnicamente possível.

A Nova Fronteira de Pareto: Velocidade × Inteligência

Por anos, mais rápido significava menos capaz. O Gemini 3.5 Flash quebra esse compromisso — ele está no canto superior direito da curva velocidade-inteligência, superando modelos que custam muito mais.

Gráfico de Inteligência vs Velocidade mostrando o Gemini 3.5 Flash na fronteira de Pareto

O Gemini 3.5 Flash lidera a fronteira de Pareto inteligência-velocidade entre os modelos frontier. Fonte: Artificial Analysis, maio de 2026.

Benchmarks de desempenho

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Resultados oficiais do model card. O Gemini 3.5 Flash lidera em compreensão multimodal, uso de ferramentas agênticas e recuperação de contexto longo.

Benchmark
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Fonte: Gemini 3.5 Flash Model Card — Google DeepMind, maio de 2026.

Especificações Técnicas

Tudo o que você precisa saber antes de integrar o Gemini 3.5 Flash à sua aplicação.

Janela de Contexto

1.048.576 tokens de entrada
65.536 tokens de saída

Preços da API

US$ 1,50 / 1M tokens de entrada
US$ 9,00 / 1M tokens de saída
US$ 0,15 / 1M tokens em cache

Disponibilidade Geral

19 de maio de 2026 — Google I/O

Corte de Conhecimento

Janeiro de 2026

Modo de Raciocínio

Ativado por padrão. Configurável via thinking_level: low / medium (padrão) / high. O Thought Preservation retém o raciocínio ao longo de conversas com múltiplos turnos.

Uso de Ferramentas e APIs

Chamada de funções, saída estruturada, execução de código, fundamentação com Google Search, cache de contexto — todos suportados nativamente.

Modalidades de Entrada

Texto, imagens, áudio, vídeo, PDF — multimodal nativo, sem pré-processamento necessário.

Multimodal nativo — um modelo, todos os tipos de entrada

O Gemini 3.5 Flash processa texto, imagens, áudio e vídeo de forma nativa — sem pipelines separados nem combinação de múltiplos modelos.

Texto e PDF

Analisa documentos com milhões de palavras com alta precisão. Lida com tabelas complexas, código e dados estruturados em uma única passagem.

Compreensão de imagens

Pontuação MMMU-Pro de 83,6% — n.º 1 mundial. Analisa plantas arquitetônicas, gráficos e conteúdo visual detalhado em tempo real.

Análise de vídeo

Suporta até 1 hora de vídeo como entrada. Captura mudanças-chave quadro a quadro para sumarização, perguntas e respostas e análise de conteúdo.

Processamento de áudio

Reconhece emoções, sons ambientes e conversas multilíngues. Alimenta tradução em tempo real e assistentes de voz.

Disponível em Todos os Lugares que Você Constrói

O Gemini 3.5 Flash está profundamente integrado ao ecossistema de desenvolvedores e consumidores do Google — do acesso via API ao modelo padrão que atende bilhões de usuários.

Plataformas para Desenvolvedores

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Produtos para Consumidores

  • App Gemini — modelo padrão global
  • Google Search AI Mode — modelo padrão
  • Gemini Spark — agente de IA pessoal
  • Felo AI — acesso gratuito via pesquisa e playground
Gráfico de Inteligência vs Custo mostrando o Gemini 3.5 Flash como o modelo frontier de melhor custo-benefício

O Gemini 3.5 Flash lidera a fronteira inteligência-custo. Menos da metade do custo de modelos comparáveis para desempenho equivalente nas tarefas. Fonte: Artificial Analysis, maio de 2026.

Quem usa o Gemini 3.5 Flash

De desenvolvedores individuais a equipes enterprise, o Gemini 3.5 Flash se encaixa onde você precisa de IA rápida e capaz em escala.

Programação agêntica

Pontuação Terminal-Bench 2.1 de 76,2% com baixa latência. Agentes de código concluem tarefas mais rápido e com menos lacunas lógicas — geração iterativa de código, depuração e testes A/B na velocidade Flash.

Processamento financeiro e fiscal

Processe um ano inteiro de contratos e extratos em uma única requisição. A Xero usa para processar formulários de imposto 1099; a Ramp usa seu OCR multimodal para processamento complexo de notas fiscais.

Plataformas de agentes enterprise

A Salesforce integra ao Agentforce para acelerar a implantação de agentes enterprise. A Databricks usa para monitorar dados em tempo real e diagnosticar problemas de forma autônoma.

Tarefas de negócios de longo horizonte

A Shopify usa para previsão de crescimento de lojistas. Executa com confiança fluxos de trabalho complexos que duram horas ou semanas — o tipo de tarefa que antes exigia supervisão humana em cada etapa.

Análise de conteúdo multimodal

Analise vídeo, imagens e documentos juntos em uma única requisição. A pontuação CharXiv Reasoning de 84,2% significa que extrai insights de gráficos complexos e conteúdo multimídia com precisão.

Produtos de IA para consumidores

Agora o modelo padrão no app Gemini e no Google Search AI Mode — atendendo bilhões de usuários ativos mensais. O Fast Mode entrega respostas quase instantâneas no celular.

O que as equipes estão dizendo

Seu desempenho em contextos longos é excepcional para processar grandes conjuntos de dados multimodais não estruturados em larga escala.

Bridgewater Associates

Integramos o Gemini 3.5 Flash ao Agentforce para acelerar a implantação de agentes enterprise — a relação velocidade-capacidade é algo que nunca vimos antes.

Salesforce

O Gemini 3.5 Flash nos permite monitorar informações em tempo real e diagnosticar problemas de forma autônoma em nossos fluxos de trabalho agênticos.

Databricks

Duas formas de usar o Gemini 3.5 Flash no Felo

Felo AI Search

Abra o Felo AI Search e selecione o modelo Gemini 3.5 Flash. Faça perguntas, pesquise na web com IA e obtenha respostas com fontes citadas — impulsionadas pelo modelo frontier mais rápido do Google.

Abrir Felo AI Search

Felo LLM Playground

Abra o Felo LLM Playground, selecione o Gemini 3.5 Flash e comece a conversar. Compare as saídas de vários modelos lado a lado para ver a diferença de velocidade e raciocínio na prática.

Abrir Playground

Perguntas frequentes

Teste o Gemini 3.5 Flash grátis — agora mesmo

Lançado no Google I/O 2026. Abra o Felo AI e comece a usar o modelo frontier mais rápido do Google hoje.

Abrir Gemini 3.5 Flash no Felo

Gratuito — sem necessidade de cartão de crédito