Posso experimentar o Gemini 3.5 Flash de graça no Felo AI?

Sim. O Felo AI oferece acesso gratuito ao Gemini 3.5 Flash. Crie uma conta gratuita para começar — sem necessidade de cartão de crédito.

Quando o Gemini 3.5 Flash foi lançado oficialmente?

O Gemini 3.5 Flash foi lançado oficialmente (GA) em 19 de maio de 2026 no Google I/O. Ele já está disponível via Gemini API, Google AI Studio e Felo AI.

Como o Gemini 3.5 Flash se compara ao Gemini 3.1 Pro?

Em benchmarks agênticos e de programação, o Gemini 3.5 Flash supera o Gemini 3.1 Pro — por exemplo, MCP Atlas 83,6% vs 78,2%, e Terminal-Bench 2.1 76,2% vs 70,3%. Ele roda 4× mais rápido a menos da metade do custo. Para tarefas de raciocínio acadêmico puro, o Gemini 3.1 Pro ainda mantém uma leve vantagem.

O que é o parâmetro thinking_level e como funciona?

O Thinking vem ativado por padrão no Gemini 3.5 Flash. O novo parâmetro thinking_level (valores: low, medium, high) substitui o antigo thinking_budget, permitindo controlar a profundidade de raciocínio por requisição. O padrão é medium, que equilibra velocidade e profundidade para a maioria das tarefas.

O que é o Thought Preservation?

O Thought Preservation retém automaticamente o raciocínio intermediário ao longo de conversas com múltiplos turnos. Isso melhora o desempenho em tarefas iterativas como depuração e refatoração de código, onde o contexto de etapas anteriores de raciocínio é importante.

Qual é o preço do Gemini 3.5 Flash via API?

Entrada: US$ 1,50 por milhão de tokens. Saída: US$ 9,00 por milhão de tokens. Entrada em cache: US$ 0,15 por milhão de tokens. O cache de contexto torna tarefas repetidas de contexto longo significativamente mais econômicas.

A janela de contexto de 1M tokens deixa as respostas mais lentas?

Não. O Gemini 3.5 Flash usa otimizações de streaming especializadas para entradas de contexto longo. A velocidade de resposta permanece rápida mesmo ao processar documentos extensos ou bases de código.

O que posso fazer com o Gemini 3.5 Flash no Felo?

O Felo integra o Gemini 3.5 Flash em suas funções principais — pesquisa com IA, pesquisa aprofundada e exploração de tópicos estão prontas para uso imediato. Você também pode usar o modelo livremente no Felo LLM Playground para conversar, comparar respostas ou testar seus próprios prompts.

Já disponível · Lançado no Google I/O 2026 · 19 de maio de 2026

Gemini 3.5 Flash — GrátisIA Agêntica de Nível Pro na Velocidade Flash

O Gemini 3.5 Flash é o modelo frontier mais rápido do Google DeepMind, lançado em 19 de maio de 2026. Ele entrega profundidade de raciocínio de nível Pro com uma janela de contexto de 1M tokens e roda 4× mais rápido que modelos frontier comparáveis a menos da metade do custo — experimente grátis no Felo AI agora mesmo.

Testar Gemini 3.5 Flash grátis

Gratuito no Felo AI — sem necessidade de cartão de crédito

81.2%

Pontuação MMMU-Pro

N.º 1 mundial em benchmark multimodal

$0.50

Preço de entrada

US$ 1,50 / 1M tokens via API

0.2s

Vantagem de velocidade

4× mais rápido que modelos comparáveis

Janela de contexto

Tokens em uma única requisição

O que torna o Gemini 3.5 Flash diferente

O primeiro modelo Flash a superar seu próprio predecessor Pro em benchmarks agênticos e de programação — mantendo a velocidade e o custo característicos do Flash.

Criado para fluxos de trabalho agênticos

O Gemini 3.5 Flash é o modelo agêntico e de programação mais capaz do Google até hoje. Ele executa com confiança tarefas de longo horizonte que duram horas ou semanas, lida com uso de ferramentas em múltiplas etapas e coordena sub-agentes via framework Antigravity do Google — tornando sistemas agênticos em larga escala economicamente viáveis.

Thinking Dinâmico — Profundidade de raciocínio configurável

O Thinking vem ativado por padrão com um novo parâmetro thinking_level (padrão: medium). O Gemini 3.5 Flash realiza planejamento interno em múltiplas etapas antes de responder, entregando profundidade de raciocínio que rivaliza com modelos Pro principais em tarefas de matemática, programação e lógica — com a profundidade ajustável por requisição.

Janela de contexto de 1M tokens

Processe uma base de código inteira, horas de vídeo ou um ano de contratos financeiros em uma única requisição. A janela de 1M tokens de entrada combinada com 64K tokens de saída garante que tarefas complexas sejam concluídas sem truncamentos. A pontuação MRCR v2 de contexto longo de 26,6% lidera todos os modelos comparáveis.

4× mais rápido, menos da metade do custo

O Gemini 3.5 Flash roda 4× mais rápido que modelos frontier comparáveis a menos da metade do custo. A US$ 1,50 por milhão de tokens de entrada com cache de contexto a US$ 0,15/M, executar agentes de IA 24 horas por dia se torna uma opção prática — não apenas tecnicamente possível.

A Nova Fronteira de Pareto: Velocidade × Inteligência

Por anos, mais rápido significava menos capaz. O Gemini 3.5 Flash quebra esse compromisso — ele está no canto superior direito da curva velocidade-inteligência, superando modelos que custam muito mais.

Gráfico de Inteligência vs Velocidade mostrando o Gemini 3.5 Flash na fronteira de Pareto

O Gemini 3.5 Flash lidera a fronteira de Pareto inteligência-velocidade entre os modelos frontier. Fonte: Artificial Analysis, maio de 2026.

Benchmarks de desempenho

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Resultados oficiais do model card. O Gemini 3.5 Flash lidera em compreensão multimodal, uso de ferramentas agênticas e recuperação de contexto longo.

Benchmark

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Fonte: Gemini 3.5 Flash Model Card — Google DeepMind, maio de 2026.

Especificações Técnicas

Tudo o que você precisa saber antes de integrar o Gemini 3.5 Flash à sua aplicação.

Janela de Contexto

1.048.576 tokens de entrada

65.536 tokens de saída

Preços da API

US$ 1,50 / 1M tokens de entrada

US$ 9,00 / 1M tokens de saída

US$ 0,15 / 1M tokens em cache

Disponibilidade Geral

19 de maio de 2026 — Google I/O

Corte de Conhecimento

Janeiro de 2026

Modo de Raciocínio

Ativado por padrão. Configurável via thinking_level: low / medium (padrão) / high. O Thought Preservation retém o raciocínio ao longo de conversas com múltiplos turnos.

Uso de Ferramentas e APIs

Chamada de funções, saída estruturada, execução de código, fundamentação com Google Search, cache de contexto — todos suportados nativamente.

Modalidades de Entrada

Texto, imagens, áudio, vídeo, PDF — multimodal nativo, sem pré-processamento necessário.

Multimodal nativo — um modelo, todos os tipos de entrada

O Gemini 3.5 Flash processa texto, imagens, áudio e vídeo de forma nativa — sem pipelines separados nem combinação de múltiplos modelos.

Texto e PDF

Analisa documentos com milhões de palavras com alta precisão. Lida com tabelas complexas, código e dados estruturados em uma única passagem.

Compreensão de imagens

Pontuação MMMU-Pro de 83,6% — n.º 1 mundial. Analisa plantas arquitetônicas, gráficos e conteúdo visual detalhado em tempo real.

Análise de vídeo

Suporta até 1 hora de vídeo como entrada. Captura mudanças-chave quadro a quadro para sumarização, perguntas e respostas e análise de conteúdo.

Processamento de áudio

Reconhece emoções, sons ambientes e conversas multilíngues. Alimenta tradução em tempo real e assistentes de voz.

Disponível em Todos os Lugares que Você Constrói

O Gemini 3.5 Flash está profundamente integrado ao ecossistema de desenvolvedores e consumidores do Google — do acesso via API ao modelo padrão que atende bilhões de usuários.

Plataformas para Desenvolvedores

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

Produtos para Consumidores

App Gemini — modelo padrão global
Google Search AI Mode — modelo padrão
Gemini Spark — agente de IA pessoal
Felo AI — acesso gratuito via pesquisa e playground

Gráfico de Inteligência vs Custo mostrando o Gemini 3.5 Flash como o modelo frontier de melhor custo-benefício

O Gemini 3.5 Flash lidera a fronteira inteligência-custo. Menos da metade do custo de modelos comparáveis para desempenho equivalente nas tarefas. Fonte: Artificial Analysis, maio de 2026.

Quem usa o Gemini 3.5 Flash

De desenvolvedores individuais a equipes enterprise, o Gemini 3.5 Flash se encaixa onde você precisa de IA rápida e capaz em escala.

Programação agêntica

Pontuação Terminal-Bench 2.1 de 76,2% com baixa latência. Agentes de código concluem tarefas mais rápido e com menos lacunas lógicas — geração iterativa de código, depuração e testes A/B na velocidade Flash.

Processamento financeiro e fiscal

Processe um ano inteiro de contratos e extratos em uma única requisição. A Xero usa para processar formulários de imposto 1099; a Ramp usa seu OCR multimodal para processamento complexo de notas fiscais.

Plataformas de agentes enterprise

A Salesforce integra ao Agentforce para acelerar a implantação de agentes enterprise. A Databricks usa para monitorar dados em tempo real e diagnosticar problemas de forma autônoma.

Tarefas de negócios de longo horizonte

A Shopify usa para previsão de crescimento de lojistas. Executa com confiança fluxos de trabalho complexos que duram horas ou semanas — o tipo de tarefa que antes exigia supervisão humana em cada etapa.

Análise de conteúdo multimodal

Analise vídeo, imagens e documentos juntos em uma única requisição. A pontuação CharXiv Reasoning de 84,2% significa que extrai insights de gráficos complexos e conteúdo multimídia com precisão.

Produtos de IA para consumidores

Agora o modelo padrão no app Gemini e no Google Search AI Mode — atendendo bilhões de usuários ativos mensais. O Fast Mode entrega respostas quase instantâneas no celular.

O que as equipes estão dizendo

“Seu desempenho em contextos longos é excepcional para processar grandes conjuntos de dados multimodais não estruturados em larga escala.”

— Bridgewater Associates

“Integramos o Gemini 3.5 Flash ao Agentforce para acelerar a implantação de agentes enterprise — a relação velocidade-capacidade é algo que nunca vimos antes.”

— Salesforce

“O Gemini 3.5 Flash nos permite monitorar informações em tempo real e diagnosticar problemas de forma autônoma em nossos fluxos de trabalho agênticos.”

— Databricks

Duas formas de usar o Gemini 3.5 Flash no Felo

Felo AI Search

Abra o Felo AI Search e selecione o modelo Gemini 3.5 Flash. Faça perguntas, pesquise na web com IA e obtenha respostas com fontes citadas — impulsionadas pelo modelo frontier mais rápido do Google.

Abrir Felo AI Search

Felo LLM Playground

Abra o Felo LLM Playground, selecione o Gemini 3.5 Flash e comece a conversar. Compare as saídas de vários modelos lado a lado para ver a diferença de velocidade e raciocínio na prática.

Abrir Playground

Perguntas frequentes

Teste o Gemini 3.5 Flash grátis — agora mesmo

Lançado no Google I/O 2026. Abra o Felo AI e comece a usar o modelo frontier mais rápido do Google hoje.

Abrir Gemini 3.5 Flash no Felo

Gratuito — sem necessidade de cartão de crédito