Gemini 3.5 Flash — GrátisIA Agêntica de Nível Pro na Velocidade Flash
O Gemini 3.5 Flash é o modelo frontier mais rápido do Google DeepMind, lançado em 19 de maio de 2026. Ele entrega profundidade de raciocínio de nível Pro com uma janela de contexto de 1M tokens e roda 4× mais rápido que modelos frontier comparáveis a menos da metade do custo — experimente grátis no Felo AI agora mesmo.
Gratuito no Felo AI — sem necessidade de cartão de crédito
O que torna o Gemini 3.5 Flash diferente
O primeiro modelo Flash a superar seu próprio predecessor Pro em benchmarks agênticos e de programação — mantendo a velocidade e o custo característicos do Flash.
Criado para fluxos de trabalho agênticos
O Gemini 3.5 Flash é o modelo agêntico e de programação mais capaz do Google até hoje. Ele executa com confiança tarefas de longo horizonte que duram horas ou semanas, lida com uso de ferramentas em múltiplas etapas e coordena sub-agentes via framework Antigravity do Google — tornando sistemas agênticos em larga escala economicamente viáveis.
Thinking Dinâmico — Profundidade de raciocínio configurável
O Thinking vem ativado por padrão com um novo parâmetro thinking_level (padrão: medium). O Gemini 3.5 Flash realiza planejamento interno em múltiplas etapas antes de responder, entregando profundidade de raciocínio que rivaliza com modelos Pro principais em tarefas de matemática, programação e lógica — com a profundidade ajustável por requisição.
Janela de contexto de 1M tokens
Processe uma base de código inteira, horas de vídeo ou um ano de contratos financeiros em uma única requisição. A janela de 1M tokens de entrada combinada com 64K tokens de saída garante que tarefas complexas sejam concluídas sem truncamentos. A pontuação MRCR v2 de contexto longo de 26,6% lidera todos os modelos comparáveis.
4× mais rápido, menos da metade do custo
O Gemini 3.5 Flash roda 4× mais rápido que modelos frontier comparáveis a menos da metade do custo. A US$ 1,50 por milhão de tokens de entrada com cache de contexto a US$ 0,15/M, executar agentes de IA 24 horas por dia se torna uma opção prática — não apenas tecnicamente possível.
A Nova Fronteira de Pareto: Velocidade × Inteligência
Por anos, mais rápido significava menos capaz. O Gemini 3.5 Flash quebra esse compromisso — ele está no canto superior direito da curva velocidade-inteligência, superando modelos que custam muito mais.

O Gemini 3.5 Flash lidera a fronteira de Pareto inteligência-velocidade entre os modelos frontier. Fonte: Artificial Analysis, maio de 2026.
Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5
Resultados oficiais do model card. O Gemini 3.5 Flash lidera em compreensão multimodal, uso de ferramentas agênticas e recuperação de contexto longo.
Fonte: Gemini 3.5 Flash Model Card — Google DeepMind, maio de 2026.
Especificações Técnicas
Tudo o que você precisa saber antes de integrar o Gemini 3.5 Flash à sua aplicação.
Janela de Contexto
Preços da API
Disponibilidade Geral
19 de maio de 2026 — Google I/O
Corte de Conhecimento
Janeiro de 2026
Modo de Raciocínio
Ativado por padrão. Configurável via thinking_level: low / medium (padrão) / high. O Thought Preservation retém o raciocínio ao longo de conversas com múltiplos turnos.
Uso de Ferramentas e APIs
Chamada de funções, saída estruturada, execução de código, fundamentação com Google Search, cache de contexto — todos suportados nativamente.
Modalidades de Entrada
Texto, imagens, áudio, vídeo, PDF — multimodal nativo, sem pré-processamento necessário.
Multimodal nativo — um modelo, todos os tipos de entrada
O Gemini 3.5 Flash processa texto, imagens, áudio e vídeo de forma nativa — sem pipelines separados nem combinação de múltiplos modelos.
Texto e PDF
Analisa documentos com milhões de palavras com alta precisão. Lida com tabelas complexas, código e dados estruturados em uma única passagem.
Compreensão de imagens
Pontuação MMMU-Pro de 83,6% — n.º 1 mundial. Analisa plantas arquitetônicas, gráficos e conteúdo visual detalhado em tempo real.
Análise de vídeo
Suporta até 1 hora de vídeo como entrada. Captura mudanças-chave quadro a quadro para sumarização, perguntas e respostas e análise de conteúdo.
Processamento de áudio
Reconhece emoções, sons ambientes e conversas multilíngues. Alimenta tradução em tempo real e assistentes de voz.
Disponível em Todos os Lugares que Você Constrói
O Gemini 3.5 Flash está profundamente integrado ao ecossistema de desenvolvedores e consumidores do Google — do acesso via API ao modelo padrão que atende bilhões de usuários.
Plataformas para Desenvolvedores
- Gemini API
- Google AI Studio
- Android Studio
- Google Antigravity
- Gemini Enterprise Agent Platform (Vertex AI)
Produtos para Consumidores
- App Gemini — modelo padrão global
- Google Search AI Mode — modelo padrão
- Gemini Spark — agente de IA pessoal
- Felo AI — acesso gratuito via pesquisa e playground

O Gemini 3.5 Flash lidera a fronteira inteligência-custo. Menos da metade do custo de modelos comparáveis para desempenho equivalente nas tarefas. Fonte: Artificial Analysis, maio de 2026.
Quem usa o Gemini 3.5 Flash
De desenvolvedores individuais a equipes enterprise, o Gemini 3.5 Flash se encaixa onde você precisa de IA rápida e capaz em escala.

Programação agêntica
Pontuação Terminal-Bench 2.1 de 76,2% com baixa latência. Agentes de código concluem tarefas mais rápido e com menos lacunas lógicas — geração iterativa de código, depuração e testes A/B na velocidade Flash.

Processamento financeiro e fiscal
Processe um ano inteiro de contratos e extratos em uma única requisição. A Xero usa para processar formulários de imposto 1099; a Ramp usa seu OCR multimodal para processamento complexo de notas fiscais.

Plataformas de agentes enterprise
A Salesforce integra ao Agentforce para acelerar a implantação de agentes enterprise. A Databricks usa para monitorar dados em tempo real e diagnosticar problemas de forma autônoma.

Tarefas de negócios de longo horizonte
A Shopify usa para previsão de crescimento de lojistas. Executa com confiança fluxos de trabalho complexos que duram horas ou semanas — o tipo de tarefa que antes exigia supervisão humana em cada etapa.

Análise de conteúdo multimodal
Analise vídeo, imagens e documentos juntos em uma única requisição. A pontuação CharXiv Reasoning de 84,2% significa que extrai insights de gráficos complexos e conteúdo multimídia com precisão.

Produtos de IA para consumidores
Agora o modelo padrão no app Gemini e no Google Search AI Mode — atendendo bilhões de usuários ativos mensais. O Fast Mode entrega respostas quase instantâneas no celular.
O que as equipes estão dizendo
“Seu desempenho em contextos longos é excepcional para processar grandes conjuntos de dados multimodais não estruturados em larga escala.”
— Bridgewater Associates
“Integramos o Gemini 3.5 Flash ao Agentforce para acelerar a implantação de agentes enterprise — a relação velocidade-capacidade é algo que nunca vimos antes.”
— Salesforce
“O Gemini 3.5 Flash nos permite monitorar informações em tempo real e diagnosticar problemas de forma autônoma em nossos fluxos de trabalho agênticos.”
— Databricks
Duas formas de usar o Gemini 3.5 Flash no Felo
Felo AI Search
Abra o Felo AI Search e selecione o modelo Gemini 3.5 Flash. Faça perguntas, pesquise na web com IA e obtenha respostas com fontes citadas — impulsionadas pelo modelo frontier mais rápido do Google.
Abrir Felo AI SearchFelo LLM Playground
Abra o Felo LLM Playground, selecione o Gemini 3.5 Flash e comece a conversar. Compare as saídas de vários modelos lado a lado para ver a diferença de velocidade e raciocínio na prática.
Abrir PlaygroundPerguntas frequentes
Teste o Gemini 3.5 Flash grátis — agora mesmo
Lançado no Google I/O 2026. Abra o Felo AI e comece a usar o modelo frontier mais rápido do Google hoje.
Abrir Gemini 3.5 Flash no FeloGratuito — sem necessidade de cartão de crédito