Kini GA · Diluncurkan di Google I/O 2026 · 19 Mei 2026

Gemini 3.5 Flash — GratisAI Agentik Setara Pro dengan Kecepatan Flash

Gemini 3.5 Flash adalah model frontier tercepat dari Google DeepMind, diluncurkan 19 Mei 2026. Menghadirkan kedalaman penalaran setara Pro dengan jendela konteks 1M token dan berjalan 4× lebih cepat dari model frontier sejenis dengan biaya kurang dari setengahnya — coba gratis di Felo AI sekarang juga.

Gratis digunakan di Felo AI — tanpa kartu kredit

81.2%
Skor MMMU-Pro
Benchmark multimodal #1 dunia
$0.50
Harga Input
$1,50 / 1M token via API
0.2s
Keunggulan Kecepatan
4× lebih cepat dari model sejenis
1M
Jendela Konteks
Token dalam satu permintaan

Apa yang Membuat Gemini 3.5 Flash Berbeda

Model Flash pertama yang melampaui pendahulunya sendiri (Pro) pada benchmark agentik dan coding — sekaligus mempertahankan kecepatan dan biaya kelas Flash.

Ikon kecepatan

Dirancang untuk Alur Kerja Agentik

Gemini 3.5 Flash adalah model agentik dan coding paling andal dari Google hingga saat ini. Model ini secara konsisten menjalankan tugas jangka panjang selama berjam-jam atau berminggu-minggu, menangani penggunaan alat multi-langkah, dan mengoordinasikan sub-agen melalui kerangka Antigravity Google — menjadikan sistem agentik skala besar layak secara ekonomis.

Ikon berpikir

Dynamic Thinking — Kedalaman Penalaran yang Dapat Dikonfigurasi

Thinking diaktifkan secara default dengan parameter thinking_level baru (default: medium). Gemini 3.5 Flash melakukan perencanaan multi-langkah internal sebelum merespons, menghadirkan kedalaman penalaran yang menyaingi model Pro unggulan pada tugas matematika, coding, dan logika — dengan kedalaman yang dapat disesuaikan per permintaan.

Ikon konteks

Jendela Konteks 1M Token

Masukkan seluruh codebase, berjam-jam video, atau setahun kontrak keuangan dalam satu permintaan. Jendela input 1M token dipasangkan dengan output 64K token berarti tugas kompleks tetap lengkap — tidak ada yang terpotong. Skor MRCR v2 konteks panjang sebesar 26,6% memimpin semua model sejenis.

Ikon biaya

4× Lebih Cepat, Kurang dari Setengah Biaya

Gemini 3.5 Flash berjalan 4× lebih cepat dari model frontier sejenis dengan biaya kurang dari setengahnya. Dengan harga $1,50 per juta token input dan context caching $0,15/M, menjalankan agen AI sepanjang waktu menjadi pilihan yang praktis — bukan sekadar mungkin secara teknis.

Pareto Frontier Baru: Kecepatan × Kecerdasan

Selama bertahun-tahun, lebih cepat berarti kurang mampu. Gemini 3.5 Flash memecah pertukaran itu — ia berada di sudut kanan atas kurva kecepatan-kecerdasan, melampaui model yang jauh lebih mahal.

Grafik Intelligence vs Speed yang menunjukkan Gemini 3.5 Flash di Pareto frontier

Gemini 3.5 Flash memimpin Pareto frontier intelligence-vs-speed di antara model frontier. Sumber: Artificial Analysis, Mei 2026.

Benchmark Performa

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Hasil resmi model card. Gemini 3.5 Flash unggul dalam pemahaman multimodal, penggunaan alat agentik, dan pengambilan konteks panjang.

Benchmark
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Sumber: Gemini 3.5 Flash Model Card — Google DeepMind, Mei 2026.

Spesifikasi Teknis

Semua yang perlu Anda ketahui sebelum mengintegrasikan Gemini 3.5 Flash ke dalam aplikasi Anda.

Jendela Konteks

1.048.576 token input
65.536 token output

Harga API

$1,50 / 1M token input
$9,00 / 1M token output
$0,15 / 1M token yang di-cache

Ketersediaan Umum

19 Mei 2026 — Google I/O

Batas Pengetahuan

Januari 2026

Mode Thinking

Aktif secara default. Dapat dikonfigurasi melalui thinking_level: low / medium (default) / high. Thought Preservation mempertahankan penalaran di seluruh percakapan multi-giliran.

Penggunaan Alat & API

Function calling, structured output, eksekusi kode, Google Search grounding, context caching — semua didukung secara native.

Modalitas Input

Teks, gambar, audio, video, PDF — multimodal native, tidak perlu preprocessing.

Multimodal Native — Satu Model, Semua Jenis Input

Gemini 3.5 Flash memproses teks, gambar, audio, dan video secara native — tanpa pipeline terpisah, tanpa menggabungkan beberapa model.

Teks & PDF

Mengurai dokumen berjuta kata dengan akurasi tinggi. Menangani tabel kompleks, kode, dan data terstruktur dalam satu kali proses.

Pemahaman Gambar

Skor MMMU-Pro 83,6% — #1 dunia. Menganalisis cetak biru arsitektur, grafik, dan konten visual detail secara real-time.

Analisis Video

Mendukung input video hingga 1 jam. Menangkap perubahan kunci frame demi frame untuk ringkasan, tanya jawab, dan analisis konten.

Pemrosesan Audio

Mengenali emosi, suara sekitar, dan percakapan multibahasa. Mendukung terjemahan real-time dan asisten suara.

Tersedia di Mana Pun Anda Membangun

Gemini 3.5 Flash terintegrasi secara mendalam di seluruh ekosistem developer dan konsumen Google — dari akses API hingga model default yang melayani miliaran pengguna.

Platform Developer

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Produk Konsumen

  • Aplikasi Gemini — model default global
  • Google Search AI Mode — model default
  • Gemini Spark — agen AI personal
  • Felo AI — akses gratis melalui pencarian & playground
Grafik Intelligence vs Cost yang menunjukkan Gemini 3.5 Flash sebagai model frontier dengan nilai terbaik

Gemini 3.5 Flash memimpin frontier intelligence-vs-cost. Kurang dari setengah biaya model sejenis untuk performa tugas yang setara. Sumber: Artificial Analysis, Mei 2026.

Siapa yang Menggunakan Gemini 3.5 Flash

Dari pengembang individu hingga tim enterprise, Gemini 3.5 Flash cocok di mana pun Anda membutuhkan AI yang cepat dan andal dalam skala besar.

Coding Agentik

Skor Terminal-Bench 2.1 sebesar 76,2% dengan latensi rendah. Agen coding menyelesaikan tugas lebih cepat dengan lebih sedikit celah logika — pembuatan kode iteratif, debugging, dan A/B testing dengan kecepatan Flash.

Pemrosesan Keuangan & Pajak

Proses setahun penuh kontrak dan laporan dalam satu permintaan. Xero menggunakannya untuk menangani formulir pajak 1099; Ramp menggunakan OCR multimodalnya untuk pemrosesan faktur kompleks.

Platform Agen Enterprise

Salesforce mengintegrasikannya ke dalam Agentforce untuk mempercepat penerapan agen enterprise. Databricks menggunakannya untuk memantau data real-time dan mendiagnosis masalah secara otonom.

Tugas Bisnis Jangka Panjang

Shopify menggunakannya untuk peramalan pertumbuhan merchant. Secara konsisten menjalankan alur kerja kompleks selama berjam-jam atau berminggu-minggu — jenis tugas yang sebelumnya membutuhkan pengawasan manusia di setiap langkah.

Analisis Konten Multimodal

Analisis video, gambar, dan dokumen sekaligus dalam satu permintaan. Skor CharXiv Reasoning 84,2% berarti model ini mengekstrak wawasan dari grafik kompleks dan konten campuran secara akurat.

Produk AI Konsumen

Kini menjadi model default di aplikasi Gemini dan Google Search AI Mode — melayani miliaran pengguna aktif bulanan. Fast Mode menghadirkan respons hampir instan di perangkat mobile.

Apa Kata Para Tim

Performa konteks panjangnya luar biasa untuk memproses dataset multimodal tidak terstruktur dalam skala besar.

Bridgewater Associates

Kami mengintegrasikan Gemini 3.5 Flash ke dalam Agentforce untuk mempercepat penerapan agen enterprise — rasio kecepatan terhadap kemampuannya tidak tertandingi oleh apa pun yang pernah kami lihat sebelumnya.

Salesforce

Gemini 3.5 Flash memungkinkan kami memantau informasi real-time dan mendiagnosis masalah secara otonom dalam alur kerja agentik kami.

Databricks

Dua Cara Menggunakan Gemini 3.5 Flash di Felo

Felo AI Search

Buka Felo AI Search dan pilih model Gemini 3.5 Flash. Ajukan pertanyaan, cari web dengan AI, dan dapatkan jawaban bersumber — didukung model frontier tercepat Google.

Buka Felo AI Search

Felo LLM Playground

Buka Felo LLM Playground, pilih Gemini 3.5 Flash, dan mulai mengobrol. Bandingkan output dari beberapa model secara berdampingan untuk melihat perbedaan kecepatan dan penalaran secara langsung.

Buka Playground

Pertanyaan yang Sering Diajukan

Coba Gemini 3.5 Flash Gratis — Sekarang Juga

Diluncurkan di Google I/O 2026. Buka Felo AI dan mulai gunakan model frontier tercepat Google hari ini.

Buka Gemini 3.5 Flash di Felo

Gratis digunakan — tanpa kartu kredit