Gemini 3.5 Flash Está Chegando ao Felo AI — O Modelo de IA Mais Rápido do Google, Gratuito

May 19, 2026 · 5 minutos de leitura

Committed to answers at your fingertips

O Gemini 3.5 Flash da Google DeepMind chega em breve ao Felo AI — respostas em subsegundos, raciocínio em nível Pro, contexto de 1M, a /usr/bin/bash.50/M tokens. Acesso gratuito.

Velocidade e profundidade costumavam ser uma escolha: ou um, ou outro.

A Google DeepMind acabou de quebrar essa regra com o Gemini 3.5 Flash — o primeiro modelo Flash que oferece raciocínio em nível Pro com uma primeira resposta em 0,2 segundos.

E estamos trazendo isso para o Felo AI. Gratuitamente.

O Primeiro Modelo Flash Que Não Parece Um Compromisso

Modelos Flash anteriores faziam você escolher: rápido mas superficial, ou profundo porém lento. O Gemini 3.5 Flash elimina essa escolha — agora não há mais trade-off.

Capacidade	O Que Oferece
Velocidade Sub-segundo	Primeiro token em 0,2 segundo — assistentes de voz em tempo real, autocompletar de código ao vivo, pesquisa sem espera
Modo de Pensamento	Planejamento multietapas configurável antes da resposta — rivaliza com o modelo Pro em matemática, programação e lógica
Contexto de 1M Tokens	Base de código completa, horas de vídeo, um ano de contratos — tudo em uma única solicitação, sem truncamento
Multimodal Nativo	Texto, imagens, vídeo e áudio em uma única arquitetura — pontuação MMMU-Pro de 81,2%, nº 1 global
$0,50 por M Tokens	92% do desempenho da classe GPT-5.5 a uma fração do custo — agentes de IA 24h por dia tornam-se viáveis

Por Que Isso Muda o Que É Possível no Felo AI

Pense nas coisas que pareciam lentas ou caras demais para fazer com IA:

Conversas de voz em tempo real. Com latência de 0,2 segundo, falar com uma IA parece falar com uma pessoa — sem esperar a resposta carregar.

Programação autônoma em escala. Uma pontuação de 78% no SWE-bench com baixa latência significa que agentes de código concluem tarefas mais rápido e com menos falhas lógicas. A Replit chamou isso de “o primeiro modelo que combina velocidade, economia e capacidade suficiente para alimentar o núcleo do nosso agente de programação”.

Processamento de documentos inteiros de uma só vez. Envie um ano de contratos financeiros para uma janela de contexto de 1M e obtenha uma precisão de extração 15% melhor que em modelos anteriores — sem entradas perdidas.

Suporte ao cliente multilíngue 24/7. A $0,50/M tokens com 91,8% de capacidade multilíngue, manter suporte de IA continuamente custa 80% menos que abordagens tradicionais.

Análise de vídeo em larga escala. 86,9% no Video-MMMU, suportando até 1 hora de entrada de vídeo. Analise o conteúdo quadro a quadro e gere automaticamente textos de marketing em tempo real.

Ilustração da velocidade do Gemini 3.5 Flash — processamento de IA ultrarrápido com fluxos de dados dinâmicos convergindo em um ponto focal brilhante, nas cores azul e ciano profundas da marca Felo AI

Como o Gemini 3.5 Flash Se Compara

Os testes de benchmark da Google DeepMind colocam o Gemini 3.5 Flash em uma posição competitiva:

MMMU-Pro: 81,2% — pontuação nº 1 global em benchmark multimodal
SWE-bench: 78% com Modo de Pensamento ativado — forte desempenho em programação autônoma
BigLaw Bench: +7% de melhoria em raciocínio jurídico em relação a modelos anteriores
OmniDocBench: distância de edição OCR de 0,121 — preciso em tabelas complexas e escrita manual

Em compreensão multimodal e uso de ferramentas de agentes, o Gemini 3.5 Flash supera tanto o Claude Sonnet 4.6 quanto o GPT-5.5.

O Que as Equipes Já Estão Dizendo

"O Gemini 3.5 Flash é o primeiro modelo a oferecer profundidade em nível Pro com velocidade e escala de Flash. Seu desempenho em longos contextos é excepcional para processar grandes conjuntos de dados de pesquisa." — Bridgewater Associates

"Em nossa avaliação Junie de agentes de programação, a qualidade se aproxima do modelo Pro principal enquanto mantém alta escalabilidade e baixo custo em ambientes com cotas restritas." — JetBrains

Duas Formas de Usar o Gemini 3.5 Flash no Felo AI

Felo AI Search

Selecione o Gemini 3.5 Flash como seu modelo de pesquisa. Obtenha respostas rápidas e com citações alimentadas pelo modelo mais rápido do Google — integrado à pesquisa web em tempo real do Felo.

Felo LLM Playground

Inicie uma conversa direta com o Gemini 3.5 Flash, compare resultados lado a lado com outros modelos e sinta pessoalmente a diferença de velocidade.

Interface do Felo AI mostrando o chat do Gemini 3.5 Flash com respostas rápidas do Modo de Pensamento, interface em modo escuro com detalhes em azul e ciano

O Que Vem a Seguir

O Gemini 3.5 Flash chegará ao Felo AI muito em breve. Estamos finalizando a integração para que você tenha uma experiência perfeita desde o primeiro dia.

Quando for lançado:

Abra o Felo AI Search, selecione o Gemini 3.5 Flash e obtenha respostas instantâneas
Acesse o LLM Playground para testar a velocidade em comparação com outros modelos
Alterne entre modelos durante a conversa para comparar resultados em tempo real

Sem configuração. Sem cobrança. Apenas abrir e usar.

Fique Ligado

Anunciaremos a data exata de lançamento aqui no blog e em nossos canais. Cadastre-se no Felo AI para estar pronto quando o Gemini 3.5 Flash for lançado.

IA rápida não deveria custar uma fortuna. Em breve, não custará.

Este post também está disponível em English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, ไทย, Español and বাংলা.

O Primeiro Modelo Flash Que Não Parece Um Compromisso​

Por Que Isso Muda o Que É Possível no Felo AI​

Como o Gemini 3.5 Flash Se Compara​

O Que as Equipes Já Estão Dizendo​

Duas Formas de Usar o Gemini 3.5 Flash no Felo AI​

Felo AI Search​

Felo LLM Playground​

O Que Vem a Seguir​

Fique Ligado​