Posso provare Gemini 3.5 Flash gratuitamente su Felo AI?

Sì. Felo AI offre accesso gratuito a Gemini 3.5 Flash. Registra un account gratuito per iniziare — nessuna carta di credito richiesta.

Quando è stato ufficialmente rilasciato Gemini 3.5 Flash?

Gemini 3.5 Flash è stato ufficialmente lanciato (GA) il 19 maggio 2026 al Google I/O. È ora disponibile tramite Gemini API, Google AI Studio e Felo AI.

Come si confronta Gemini 3.5 Flash con Gemini 3.1 Pro?

Sui benchmark agentivi e di programmazione, Gemini 3.5 Flash supera effettivamente Gemini 3.1 Pro — ad esempio, MCP Atlas 83,6% vs 78,2% e Terminal-Bench 2.1 76,2% vs 70,3%. È 4× più veloce a meno della metà del costo. Per compiti di ragionamento accademico puro, Gemini 3.1 Pro mantiene ancora un leggero vantaggio.

Cos'è il parametro thinking_level e come funziona?

Il Thinking è abilitato per impostazione predefinita in Gemini 3.5 Flash. Il nuovo parametro thinking_level (valori: low, medium, high) sostituisce il vecchio thinking_budget, permettendoti di controllare la profondità di ragionamento per ogni richiesta. Il valore predefinito è medium, che bilancia velocità e profondità per la maggior parte dei compiti.

Cos'è il Thought Preservation?

Il Thought Preservation conserva automaticamente il ragionamento intermedio nelle conversazioni multi-turno. Questo migliora le prestazioni su compiti iterativi come il debug e il refactoring del codice, dove il contesto dei passaggi di ragionamento precedenti è importante.

Qual è il prezzo di Gemini 3.5 Flash tramite API?

Input: $1,50 per milione di token. Output: $9,00 per milione di token. Input in cache: $0,15 per milione di token. Il context caching rende i compiti ripetuti a contesto lungo significativamente più convenienti.

La finestra di contesto da 1M token rallenta le risposte?

No. Gemini 3.5 Flash utilizza ottimizzazioni di streaming specializzate per input a contesto lungo. La velocità di risposta rimane elevata anche durante l'elaborazione di documenti o codebase di grandi dimensioni.

Cosa posso fare con Gemini 3.5 Flash su Felo?

Felo integra Gemini 3.5 Flash nelle sue funzionalità principali — ricerca AI, ricerca approfondita ed esplorazione di argomenti sono pronte all'uso. Puoi anche usare il modello liberamente nel Felo LLM Playground per chattare, confrontare output o testare i tuoi prompt.

Ora Disponibile · Lanciato al Google I/O 2026 · 19 maggio 2026

Gemini 3.5 Flash — GratuitoAI Agentiva di Livello Pro alla Velocità Flash

Gemini 3.5 Flash è il modello frontier più veloce di Google DeepMind, lanciato il 19 maggio 2026. Offre una profondità di ragionamento di livello Pro con una finestra di contesto da 1M token ed è 4× più veloce dei modelli frontier comparabili a meno della metà del costo — provalo gratis su Felo AI adesso.

Prova Gemini 3.5 Flash Gratis

Gratuito su Felo AI — nessuna carta di credito richiesta

81.2%

Punteggio MMMU-Pro

Benchmark multimodale #1 al mondo

$0.50

Prezzo di Input

$1,50 / 1M token via API

0.2s

Vantaggio in Velocità

4× più veloce dei modelli comparabili

Finestra di Contesto

Token in una singola richiesta

Cosa Rende Diverso Gemini 3.5 Flash

Il primo modello Flash a superare il suo predecessore Pro sui benchmark agentivi e di programmazione — mantenendo la velocità e il costo tipici di Flash.

Progettato per Flussi di Lavoro Agentivi

Gemini 3.5 Flash è il modello agentivo e di programmazione più capace di Google fino ad oggi. Esegue in modo affidabile compiti a lungo orizzonte che durano ore o settimane, gestisce l'uso di strumenti multi-step e coordina sotto-agenti tramite il framework Antigravity di Google — rendendo i sistemi agentivi su larga scala economicamente sostenibili.

Thinking Dinamico — Profondità di Ragionamento Configurabile

Il Thinking è abilitato per impostazione predefinita con un nuovo parametro thinking_level (default: medium). Gemini 3.5 Flash esegue una pianificazione interna multi-step prima di rispondere, offrendo una profondità di ragionamento che rivaleggia con i modelli Pro di punta su matematica, programmazione e compiti logici — con la profondità regolabile per ogni richiesta.

Finestra di Contesto da 1M Token

Inserisci un'intera codebase, ore di video o un anno di contratti finanziari in una singola richiesta. La finestra di input da 1M token abbinata a 64K token di output significa che i compiti complessi rimangono completi — nulla viene troncato. Il punteggio MRCR v2 per contesti lunghi del 26,6% è il migliore tra i modelli comparabili.

4× più Veloce, Meno della Metà del Costo

Gemini 3.5 Flash è 4× più veloce dei modelli frontier comparabili a meno della metà del costo. A $1,50 per milione di token di input con context caching a $0,15/M, gestire agenti AI 24 ore su 24 diventa pratico — non solo tecnicamente possibile.

La Nuova Frontiera di Pareto: Velocità × Intelligenza

Per anni, più veloce significava meno capace. Gemini 3.5 Flash rompe questo compromesso — si posiziona in alto a destra della curva velocità-intelligenza, superando modelli che costano molto di più.

Grafico Intelligence vs Speed che mostra Gemini 3.5 Flash alla frontiera di Pareto

Gemini 3.5 Flash guida la frontiera di Pareto intelligence-vs-speed tra i modelli frontier. Fonte: Artificial Analysis, maggio 2026.

Benchmark di Prestazioni

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Risultati ufficiali della scheda modello. Gemini 3.5 Flash è in testa nella comprensione multimodale, nell'uso degli strumenti agente e nel recupero di contesti lunghi.

Benchmark

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Fonte: Scheda Modello Gemini 3.5 Flash — Google DeepMind, maggio 2026.

Specifiche Tecniche

Tutto quello che devi sapere prima di integrare Gemini 3.5 Flash nella tua applicazione.

Finestra di Contesto

1.048.576 token di input

65.536 token di output

Prezzi API

$1,50 / 1M token di input

$9,00 / 1M token di output

$0,15 / 1M token in cache

Disponibilità Generale

19 maggio 2026 — Google I/O

Data di Taglio della Conoscenza

Gennaio 2026

Modalità Thinking

Attivo per impostazione predefinita. Configurabile tramite thinking_level: low / medium (default) / high. Thought Preservation mantiene il ragionamento nelle conversazioni multi-turno.

Uso degli Strumenti e API

Function calling, output strutturato, esecuzione di codice, Google Search grounding, context caching — tutto supportato nativamente.

Modalità di Input

Testo, immagini, audio, video, PDF — multimodale nativo, nessuna pre-elaborazione richiesta.

Multimodale Nativo — Un Modello, Ogni Tipo di Input

Gemini 3.5 Flash elabora testo, immagini, audio e video in modo nativo — nessuna pipeline separata, nessun assemblaggio di più modelli.

Testo e PDF

Analizza documenti da un milione di parole con alta precisione. Gestisce tabelle complesse, codice e dati strutturati in un unico passaggio.

Comprensione delle Immagini

Punteggio MMMU-Pro dell'83,6% — #1 al mondo. Analizza progetti architettonici, grafici e contenuti visivi dettagliati in tempo reale.

Analisi Video

Supporta fino a 1 ora di input video. Cattura i cambiamenti chiave fotogramma per fotogramma per riassunti, domande e risposte e analisi dei contenuti.

Elaborazione Audio

Riconosce emozioni, suoni ambientali e conversazioni multilingue. Alimenta la traduzione in tempo reale e gli assistenti vocali.

Disponibile Ovunque Tu Costruisca

Gemini 3.5 Flash è profondamente integrato nell'ecosistema developer e consumer di Google — dall'accesso API al modello predefinito che alimenta miliardi di utenti.

Piattaforme per Sviluppatori

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

Prodotti Consumer

App Gemini — modello predefinito globale
Google Search AI Mode — modello predefinito
Gemini Spark — agente AI personale
Felo AI — accesso gratuito tramite ricerca e playground

Grafico Intelligence vs Cost che mostra Gemini 3.5 Flash come il modello frontier con il miglior rapporto qualità-prezzo

Gemini 3.5 Flash guida la frontiera intelligence-vs-cost. Meno della metà del costo dei modelli comparabili per prestazioni equivalenti. Fonte: Artificial Analysis, maggio 2026.

Chi Usa Gemini 3.5 Flash

Dai singoli sviluppatori ai team aziendali, Gemini 3.5 Flash si adatta ovunque sia necessaria un'AI veloce e capace su larga scala.

Programmazione Agentiva

Punteggio Terminal-Bench 2.1 del 76,2% con bassa latenza. Gli agenti di programmazione completano i compiti più velocemente con meno lacune logiche — generazione di codice iterativa, debug e test A/B alla velocità Flash.

Elaborazione Finanziaria e Fiscale

Elabora un anno intero di contratti e rendiconti in una singola richiesta. Xero lo usa per gestire i moduli fiscali 1099; Ramp lo usa per l'OCR multimodale nell'elaborazione di fatture complesse.

Piattaforme di Agenti Aziendali

Salesforce lo integra in Agentforce per accelerare il deployment di agenti aziendali. Databricks lo usa per monitorare dati in tempo reale e diagnosticare problemi in modo autonomo.

Compiti Aziendali a Lungo Orizzonte

Shopify lo usa per le previsioni di crescita dei merchant. Esegue in modo affidabile flussi di lavoro complessi che durano ore o settimane — il tipo di compiti che in precedenza richiedevano supervisione umana a ogni passaggio.

Analisi di Contenuti Multimodali

Analizza video, immagini e documenti insieme in una singola richiesta. Il punteggio CharXiv Reasoning dell'84,2% significa che estrae informazioni da grafici complessi e contenuti misti con precisione.

Prodotti AI per Consumatori

Ora il modello predefinito nell'app Gemini e nella modalità AI di Google Search — al servizio di miliardi di utenti attivi mensili. La Modalità Veloce offre risposte quasi istantanee su mobile.

Cosa Dicono i Team

“Le sue prestazioni su contesti lunghi sono eccezionali per l'elaborazione di grandi dataset multimodali non strutturati.”

— Bridgewater Associates

“Abbiamo integrato Gemini 3.5 Flash in Agentforce per accelerare il deployment di agenti aziendali — il rapporto velocità-capacità è qualcosa che non avevamo mai visto prima.”

— Salesforce

“Gemini 3.5 Flash ci permette di monitorare informazioni in tempo reale e diagnosticare problemi in modo autonomo nei nostri flussi di lavoro agentivi.”

— Databricks

Due Modi per Usare Gemini 3.5 Flash su Felo

Felo AI Search

Apri Felo AI Search e seleziona il modello Gemini 3.5 Flash. Fai domande, cerca sul web con l'AI e ottieni risposte con citazioni — alimentato dal modello frontier più veloce di Google.

Apri Felo AI Search

Felo LLM Playground

Apri Felo LLM Playground, seleziona Gemini 3.5 Flash e inizia a chattare. Confronta gli output di più modelli fianco a fianco per vedere di persona la differenza in velocità e ragionamento.

Apri il Playground

Domande Frequenti

Prova Gemini 3.5 Flash Gratis — Adesso

Lanciato al Google I/O 2026. Apri Felo AI e inizia a usare oggi il modello frontier più veloce di Google.

Apri Gemini 3.5 Flash su Felo

Gratuito — nessuna carta di credito richiesta