Kini GA · Dilancarkan di Google I/O 2026 · 19 Mei 2026

Gemini 3.5 Flash — PercumaAI Agentik Setara Pro dengan Kelajuan Flash

Gemini 3.5 Flash ialah model frontier terpantas Google DeepMind, dilancarkan pada 19 Mei 2026. Ia menghadirkan kedalaman penaakulan setara Pro dengan tetingkap konteks 1M token dan berjalan 4× lebih pantas daripada model frontier setanding pada kurang daripada separuh kos — cuba percuma di Felo AI sekarang.

Percuma di Felo AI — tiada kad kredit diperlukan

81.2%
Skor MMMU-Pro
Penanda aras multimodal #1 dunia
$0.50
Harga Input
$1.50 / 1M token melalui API
0.2s
Kelebihan Kelajuan
4× lebih pantas daripada model setanding
1M
Tetingkap Konteks
Token dalam satu permintaan

Apa yang Menjadikan Gemini 3.5 Flash Berbeza

Model Flash pertama yang mengatasi pendahulunya sendiri iaitu Pro dalam penanda aras agentik dan pengekodan — sambil mengekalkan kelajuan dan kos peringkat Flash.

Ikon kelajuan

Dibina untuk Aliran Kerja Agentik

Gemini 3.5 Flash ialah model agentik dan pengekodan paling berkebolehan Google setakat ini. Ia melaksanakan tugas jangka panjang yang berlangsung berjam-jam atau berminggu-minggu dengan boleh dipercayai, mengendalikan penggunaan alat berbilang langkah, dan menyelaraskan sub-ejen melalui rangka kerja Antigravity Google — menjadikan sistem agentik berskala besar ekonomik dari segi kos.

Ikon berfikir

Pemikiran Dinamik — Kedalaman Penaakulan Boleh Dikonfigurasi

Pemikiran diaktifkan secara lalai dengan parameter thinking_level baharu (lalai: medium). Gemini 3.5 Flash melakukan perancangan berbilang langkah dalaman sebelum memberi respons, menghasilkan kedalaman penaakulan yang menyaingi model Pro utama dalam tugas matematik, pengekodan, dan logik — dengan kedalaman yang boleh dilaraskan bagi setiap permintaan.

Ikon konteks

Tetingkap Konteks 1M Token

Masukkan keseluruhan pangkalan kod, berjam-jam video, atau setahun kontrak kewangan dalam satu permintaan. Tetingkap input 1M token berpasangan dengan output 64K token bermakna tugas kompleks kekal lengkap — tiada yang dipotong. Skor konteks panjang MRCR v2 sebesar 26.6% mengatasi semua model setanding.

Ikon kos

4× Lebih Pantas, Kurang daripada Separuh Kos

Gemini 3.5 Flash berjalan 4× lebih pantas daripada model frontier setanding pada kurang daripada separuh kos. Pada $1.50 setiap juta token input dengan caching konteks pada $0.15/M, menjalankan ejen AI sepanjang masa menjadi pilihan praktikal — bukan sekadar mungkin secara teknikal.

Pareto Frontier Baharu: Kelajuan × Kecerdasan

Selama bertahun-tahun, lebih pantas bermakna kurang berkebolehan. Gemini 3.5 Flash memecahkan pertukaran itu — ia berada di sudut kanan atas lengkung kelajuan-kecerdasan, mengatasi model yang jauh lebih mahal.

Carta Intelligence vs Speed yang menunjukkan Gemini 3.5 Flash di Pareto frontier

Gemini 3.5 Flash memimpin Pareto frontier intelligence-vs-speed dalam kalangan model frontier. Sumber: Artificial Analysis, Mei 2026.

Penanda Aras Prestasi

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Keputusan kad model rasmi. Gemini 3.5 Flash memimpin dalam pemahaman multimodal, penggunaan alat agentik, dan pengambilan semula konteks panjang.

Penanda Aras
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Sumber: Kad Model Gemini 3.5 Flash — Google DeepMind, Mei 2026.

Spesifikasi Teknikal

Semua yang perlu anda ketahui sebelum mengintegrasikan Gemini 3.5 Flash ke dalam aplikasi anda.

Tetingkap Konteks

1,048,576 token input
65,536 token output

Harga API

$1.50 / 1M token input
$9.00 / 1M token output
$0.15 / 1M token dicache

Ketersediaan Umum

19 Mei 2026 — Google I/O

Tarikh Potongan Pengetahuan

Januari 2026

Mod Pemikiran

Aktif secara lalai. Boleh dikonfigurasi melalui thinking_level: low / medium (lalai) / high. Thought Preservation mengekalkan penaakulan merentasi perbualan berbilang giliran.

Penggunaan Alat & API

Function calling, output berstruktur, pelaksanaan kod, Google Search grounding, context caching — semua disokong secara asli.

Modaliti Input

Teks, imej, audio, video, PDF — multimodal asli, tiada pra-pemprosesan diperlukan.

Multimodal Asli — Satu Model, Setiap Jenis Input

Gemini 3.5 Flash memproses teks, imej, audio, dan video secara asli — tiada saluran paip berasingan, tiada penggabungan pelbagai model.

Teks & PDF

Menghurai dokumen berjuta perkataan dengan ketepatan tinggi. Mengendalikan jadual kompleks, kod, dan data berstruktur dalam satu laluan.

Pemahaman Imej

Skor MMMU-Pro sebesar 83.6% — #1 dunia. Menganalisis pelan bangunan, carta, dan kandungan visual terperinci secara masa nyata.

Analisis Video

Menyokong input video sehingga 1 jam. Menangkap perubahan utama bingkai demi bingkai untuk ringkasan, soal jawab, dan analisis kandungan.

Pemprosesan Audio

Mengenal pasti emosi, bunyi persekitaran, dan perbualan berbilang bahasa. Menyokong terjemahan masa nyata dan pembantu suara.

Tersedia di Mana Sahaja Anda Membina

Gemini 3.5 Flash disepadukan secara mendalam merentasi ekosistem pembangun dan pengguna Google — daripada akses API hingga model lalai yang menguasai berbilion pengguna.

Platform Pembangun

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Produk Pengguna

  • Aplikasi Gemini — model lalai global
  • Google Search AI Mode — model lalai
  • Gemini Spark — ejen AI peribadi
  • Felo AI — akses percuma melalui carian & playground
Carta Intelligence vs Cost yang menunjukkan Gemini 3.5 Flash sebagai model frontier dengan nilai terbaik

Gemini 3.5 Flash memimpin frontier intelligence-vs-cost. Kurang daripada separuh kos model setanding untuk prestasi tugas yang setara. Sumber: Artificial Analysis, Mei 2026.

Siapa yang Menggunakan Gemini 3.5 Flash

Daripada pembangun individu hingga pasukan perusahaan, Gemini 3.5 Flash sesuai di mana sahaja anda memerlukan AI yang pantas dan berkebolehan pada skala besar.

Pengekodan Agentik

Skor Terminal-Bench 2.1 sebesar 76.2% dengan kependaman rendah. Ejen pengekodan menyelesaikan tugas lebih pantas dengan lebih sedikit jurang logik — penjanaan kod berulang, penyahpepijatan, dan ujian A/B pada kelajuan Flash.

Pemprosesan Kewangan & Cukai

Proses setahun penuh kontrak dan penyata dalam satu permintaan. Xero menggunakannya untuk mengendalikan borang cukai 1099; Ramp menggunakan OCR multimodalnya untuk pemprosesan invois yang kompleks.

Platform Ejen Perusahaan

Salesforce mengintegrasikannya ke dalam Agentforce untuk mempercepatkan penggunaan ejen perusahaan. Databricks menggunakannya untuk memantau data masa nyata dan mendiagnosis isu secara autonomi.

Tugas Perniagaan Jangka Panjang

Shopify menggunakannya untuk ramalan pertumbuhan pedagang. Melaksanakan aliran kerja kompleks yang berlangsung berjam-jam atau berminggu-minggu dengan boleh dipercayai — jenis tugas yang sebelum ini memerlukan pengawasan manusia di setiap langkah.

Analisis Kandungan Multimodal

Analisis video, imej, dan dokumen bersama dalam satu permintaan. Skor Penaakulan CharXiv sebesar 84.2% bermakna ia mengekstrak pandangan daripada carta kompleks dan kandungan media campuran dengan tepat.

Produk AI Pengguna

Kini model lalai dalam aplikasi Gemini dan Mod AI Google Search — melayani berbilion pengguna aktif bulanan. Fast Mode menghasilkan respons hampir serta-merta pada peranti mudah alih.

Apa Kata Para Pasukan

Prestasi konteks panjangnya luar biasa untuk memproses set data multimodal tidak berstruktur berskala besar.

Bridgewater Associates

Kami mengintegrasikan Gemini 3.5 Flash ke dalam Agentforce untuk mempercepatkan penggunaan ejen perusahaan — nisbah kelajuan kepada keupayaan tidak seperti mana-mana yang pernah kami lihat sebelum ini.

Salesforce

Gemini 3.5 Flash membolehkan kami memantau maklumat masa nyata dan mendiagnosis isu secara autonomi dalam aliran kerja agentik kami.

Databricks

Dua Cara Menggunakan Gemini 3.5 Flash di Felo

Felo AI Search

Buka Felo AI Search dan pilih model Gemini 3.5 Flash. Tanya soalan, cari web dengan AI, dan dapatkan jawapan bersumber — dikuasakan oleh model frontier terpantas Google.

Buka Felo AI Search

Felo LLM Playground

Buka Felo LLM Playground, pilih Gemini 3.5 Flash, dan mula berbual. Bandingkan output daripada pelbagai model secara sebelah menyebelah untuk melihat perbezaan kelajuan dan penaakulan secara langsung.

Buka Playground

Soalan Lazim

Cuba Gemini 3.5 Flash Percuma — Sekarang Juga

Dilancarkan di Google I/O 2026. Buka Felo AI dan mula gunakan model frontier terpantas Google hari ini.

Buka Gemini 3.5 Flash di Felo

Percuma — tiada kad kredit diperlukan