Ora Disponibile · Lanciato al Google I/O 2026 · 19 maggio 2026

Gemini 3.5 Flash — GratuitoAI Agentiva di Livello Pro alla Velocità Flash

Gemini 3.5 Flash è il modello frontier più veloce di Google DeepMind, lanciato il 19 maggio 2026. Offre una profondità di ragionamento di livello Pro con una finestra di contesto da 1M token ed è 4× più veloce dei modelli frontier comparabili a meno della metà del costo — provalo gratis su Felo AI adesso.

Gratuito su Felo AI — nessuna carta di credito richiesta

81.2%
Punteggio MMMU-Pro
Benchmark multimodale #1 al mondo
$0.50
Prezzo di Input
$1,50 / 1M token via API
0.2s
Vantaggio in Velocità
4× più veloce dei modelli comparabili
1M
Finestra di Contesto
Token in una singola richiesta

Cosa Rende Diverso Gemini 3.5 Flash

Il primo modello Flash a superare il suo predecessore Pro sui benchmark agentivi e di programmazione — mantenendo la velocità e il costo tipici di Flash.

Icona velocità

Progettato per Flussi di Lavoro Agentivi

Gemini 3.5 Flash è il modello agentivo e di programmazione più capace di Google fino ad oggi. Esegue in modo affidabile compiti a lungo orizzonte che durano ore o settimane, gestisce l'uso di strumenti multi-step e coordina sotto-agenti tramite il framework Antigravity di Google — rendendo i sistemi agentivi su larga scala economicamente sostenibili.

Icona pensiero

Thinking Dinamico — Profondità di Ragionamento Configurabile

Il Thinking è abilitato per impostazione predefinita con un nuovo parametro thinking_level (default: medium). Gemini 3.5 Flash esegue una pianificazione interna multi-step prima di rispondere, offrendo una profondità di ragionamento che rivaleggia con i modelli Pro di punta su matematica, programmazione e compiti logici — con la profondità regolabile per ogni richiesta.

Icona contesto

Finestra di Contesto da 1M Token

Inserisci un'intera codebase, ore di video o un anno di contratti finanziari in una singola richiesta. La finestra di input da 1M token abbinata a 64K token di output significa che i compiti complessi rimangono completi — nulla viene troncato. Il punteggio MRCR v2 per contesti lunghi del 26,6% è il migliore tra i modelli comparabili.

Icona costo

4× più Veloce, Meno della Metà del Costo

Gemini 3.5 Flash è 4× più veloce dei modelli frontier comparabili a meno della metà del costo. A $1,50 per milione di token di input con context caching a $0,15/M, gestire agenti AI 24 ore su 24 diventa pratico — non solo tecnicamente possibile.

La Nuova Frontiera di Pareto: Velocità × Intelligenza

Per anni, più veloce significava meno capace. Gemini 3.5 Flash rompe questo compromesso — si posiziona in alto a destra della curva velocità-intelligenza, superando modelli che costano molto di più.

Grafico Intelligence vs Speed che mostra Gemini 3.5 Flash alla frontiera di Pareto

Gemini 3.5 Flash guida la frontiera di Pareto intelligence-vs-speed tra i modelli frontier. Fonte: Artificial Analysis, maggio 2026.

Benchmark di Prestazioni

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Risultati ufficiali della scheda modello. Gemini 3.5 Flash è in testa nella comprensione multimodale, nell'uso degli strumenti agente e nel recupero di contesti lunghi.

Benchmark
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Fonte: Scheda Modello Gemini 3.5 Flash — Google DeepMind, maggio 2026.

Specifiche Tecniche

Tutto quello che devi sapere prima di integrare Gemini 3.5 Flash nella tua applicazione.

Finestra di Contesto

1.048.576 token di input
65.536 token di output

Prezzi API

$1,50 / 1M token di input
$9,00 / 1M token di output
$0,15 / 1M token in cache

Disponibilità Generale

19 maggio 2026 — Google I/O

Data di Taglio della Conoscenza

Gennaio 2026

Modalità Thinking

Attivo per impostazione predefinita. Configurabile tramite thinking_level: low / medium (default) / high. Thought Preservation mantiene il ragionamento nelle conversazioni multi-turno.

Uso degli Strumenti e API

Function calling, output strutturato, esecuzione di codice, Google Search grounding, context caching — tutto supportato nativamente.

Modalità di Input

Testo, immagini, audio, video, PDF — multimodale nativo, nessuna pre-elaborazione richiesta.

Multimodale Nativo — Un Modello, Ogni Tipo di Input

Gemini 3.5 Flash elabora testo, immagini, audio e video in modo nativo — nessuna pipeline separata, nessun assemblaggio di più modelli.

Testo e PDF

Analizza documenti da un milione di parole con alta precisione. Gestisce tabelle complesse, codice e dati strutturati in un unico passaggio.

Comprensione delle Immagini

Punteggio MMMU-Pro dell'83,6% — #1 al mondo. Analizza progetti architettonici, grafici e contenuti visivi dettagliati in tempo reale.

Analisi Video

Supporta fino a 1 ora di input video. Cattura i cambiamenti chiave fotogramma per fotogramma per riassunti, domande e risposte e analisi dei contenuti.

Elaborazione Audio

Riconosce emozioni, suoni ambientali e conversazioni multilingue. Alimenta la traduzione in tempo reale e gli assistenti vocali.

Disponibile Ovunque Tu Costruisca

Gemini 3.5 Flash è profondamente integrato nell'ecosistema developer e consumer di Google — dall'accesso API al modello predefinito che alimenta miliardi di utenti.

Piattaforme per Sviluppatori

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Prodotti Consumer

  • App Gemini — modello predefinito globale
  • Google Search AI Mode — modello predefinito
  • Gemini Spark — agente AI personale
  • Felo AI — accesso gratuito tramite ricerca e playground
Grafico Intelligence vs Cost che mostra Gemini 3.5 Flash come il modello frontier con il miglior rapporto qualità-prezzo

Gemini 3.5 Flash guida la frontiera intelligence-vs-cost. Meno della metà del costo dei modelli comparabili per prestazioni equivalenti. Fonte: Artificial Analysis, maggio 2026.

Chi Usa Gemini 3.5 Flash

Dai singoli sviluppatori ai team aziendali, Gemini 3.5 Flash si adatta ovunque sia necessaria un'AI veloce e capace su larga scala.

Programmazione Agentiva

Punteggio Terminal-Bench 2.1 del 76,2% con bassa latenza. Gli agenti di programmazione completano i compiti più velocemente con meno lacune logiche — generazione di codice iterativa, debug e test A/B alla velocità Flash.

Elaborazione Finanziaria e Fiscale

Elabora un anno intero di contratti e rendiconti in una singola richiesta. Xero lo usa per gestire i moduli fiscali 1099; Ramp lo usa per l'OCR multimodale nell'elaborazione di fatture complesse.

Piattaforme di Agenti Aziendali

Salesforce lo integra in Agentforce per accelerare il deployment di agenti aziendali. Databricks lo usa per monitorare dati in tempo reale e diagnosticare problemi in modo autonomo.

Compiti Aziendali a Lungo Orizzonte

Shopify lo usa per le previsioni di crescita dei merchant. Esegue in modo affidabile flussi di lavoro complessi che durano ore o settimane — il tipo di compiti che in precedenza richiedevano supervisione umana a ogni passaggio.

Analisi di Contenuti Multimodali

Analizza video, immagini e documenti insieme in una singola richiesta. Il punteggio CharXiv Reasoning dell'84,2% significa che estrae informazioni da grafici complessi e contenuti misti con precisione.

Prodotti AI per Consumatori

Ora il modello predefinito nell'app Gemini e nella modalità AI di Google Search — al servizio di miliardi di utenti attivi mensili. La Modalità Veloce offre risposte quasi istantanee su mobile.

Cosa Dicono i Team

Le sue prestazioni su contesti lunghi sono eccezionali per l'elaborazione di grandi dataset multimodali non strutturati.

Bridgewater Associates

Abbiamo integrato Gemini 3.5 Flash in Agentforce per accelerare il deployment di agenti aziendali — il rapporto velocità-capacità è qualcosa che non avevamo mai visto prima.

Salesforce

Gemini 3.5 Flash ci permette di monitorare informazioni in tempo reale e diagnosticare problemi in modo autonomo nei nostri flussi di lavoro agentivi.

Databricks

Due Modi per Usare Gemini 3.5 Flash su Felo

Felo AI Search

Apri Felo AI Search e seleziona il modello Gemini 3.5 Flash. Fai domande, cerca sul web con l'AI e ottieni risposte con citazioni — alimentato dal modello frontier più veloce di Google.

Apri Felo AI Search

Felo LLM Playground

Apri Felo LLM Playground, seleziona Gemini 3.5 Flash e inizia a chattare. Confronta gli output di più modelli fianco a fianco per vedere di persona la differenza in velocità e ragionamento.

Apri il Playground

Domande Frequenti

Prova Gemini 3.5 Flash Gratis — Adesso

Lanciato al Google I/O 2026. Apri Felo AI e inizia a usare oggi il modello frontier più veloce di Google.

Apri Gemini 3.5 Flash su Felo

Gratuito — nessuna carta di credito richiesta