Bolehkah saya mencuba Gemini 3.5 Flash secara percuma di Felo AI?

Ya. Felo AI menawarkan akses percuma kepada Gemini 3.5 Flash. Daftar akaun percuma untuk memulakan — tiada kad kredit diperlukan.

Bilakah Gemini 3.5 Flash dilancarkan secara rasmi?

Gemini 3.5 Flash dilancarkan secara rasmi (GA) pada 19 Mei 2026 di Google I/O. Ia kini tersedia melalui Gemini API, Google AI Studio, dan Felo AI.

Bagaimana Gemini 3.5 Flash berbanding dengan Gemini 3.1 Pro?

Dalam penanda aras agentik dan pengekodan, Gemini 3.5 Flash sebenarnya mengatasi Gemini 3.1 Pro — contohnya, MCP Atlas 83.6% berbanding 78.2%, dan Terminal-Bench 2.1 76.2% berbanding 70.3%. Ia berjalan 4× lebih pantas pada kurang daripada separuh kos. Untuk tugas penaakulan akademik tulen, Gemini 3.1 Pro masih mempunyai kelebihan sedikit.

Apakah parameter thinking_level dan bagaimana ia berfungsi?

Pemikiran diaktifkan secara lalai dalam Gemini 3.5 Flash. Parameter thinking_level baharu (nilai: low, medium, high) menggantikan thinking_budget lama, membolehkan anda mengawal kedalaman penaakulan bagi setiap permintaan. Lalainya ialah medium, yang mengimbangi kelajuan dan kedalaman untuk kebanyakan tugas.

Apakah Thought Preservation?

Thought Preservation secara automatik mengekalkan penaakulan perantaraan merentasi perbualan berbilang giliran. Ini meningkatkan prestasi pada tugas berulang seperti penyahpepijatan dan pemfaktoran semula kod, di mana konteks daripada langkah penaakulan terdahulu adalah penting.

Apakah harga Gemini 3.5 Flash melalui API?

Input: $1.50 setiap juta token. Output: $9.00 setiap juta token. Input dicache: $0.15 setiap juta token. Caching konteks menjadikan tugas konteks panjang berulang jauh lebih kos efektif.

Adakah tetingkap konteks 1M token melambatkan respons?

Tidak. Gemini 3.5 Flash menggunakan pengoptimuman penstriman khusus untuk input konteks panjang. Kelajuan respons kekal pantas walaupun ketika memproses dokumen atau pangkalan kod yang besar.

Apa yang boleh saya lakukan dengan Gemini 3.5 Flash di Felo?

Felo mengintegrasikan Gemini 3.5 Flash ke dalam ciri terasnya — carian berkuasa AI, penyelidikan mendalam, dan penerokaan topik semuanya sedia untuk digunakan. Anda juga boleh menggunakan model ini secara bebas di Felo LLM Playground untuk berbual, membandingkan output, atau menguji prompt anda sendiri.

Kini GA · Dilancarkan di Google I/O 2026 · 19 Mei 2026

Gemini 3.5 Flash — PercumaAI Agentik Setara Pro dengan Kelajuan Flash

Gemini 3.5 Flash ialah model frontier terpantas Google DeepMind, dilancarkan pada 19 Mei 2026. Ia menghadirkan kedalaman penaakulan setara Pro dengan tetingkap konteks 1M token dan berjalan 4× lebih pantas daripada model frontier setanding pada kurang daripada separuh kos — cuba percuma di Felo AI sekarang.

Cuba Gemini 3.5 Flash Percuma

Percuma di Felo AI — tiada kad kredit diperlukan

81.2%

Skor MMMU-Pro

Penanda aras multimodal #1 dunia

$0.50

Harga Input

$1.50 / 1M token melalui API

0.2s

Kelebihan Kelajuan

4× lebih pantas daripada model setanding

Tetingkap Konteks

Token dalam satu permintaan

Apa yang Menjadikan Gemini 3.5 Flash Berbeza

Model Flash pertama yang mengatasi pendahulunya sendiri iaitu Pro dalam penanda aras agentik dan pengekodan — sambil mengekalkan kelajuan dan kos peringkat Flash.

Dibina untuk Aliran Kerja Agentik

Gemini 3.5 Flash ialah model agentik dan pengekodan paling berkebolehan Google setakat ini. Ia melaksanakan tugas jangka panjang yang berlangsung berjam-jam atau berminggu-minggu dengan boleh dipercayai, mengendalikan penggunaan alat berbilang langkah, dan menyelaraskan sub-ejen melalui rangka kerja Antigravity Google — menjadikan sistem agentik berskala besar ekonomik dari segi kos.

Pemikiran Dinamik — Kedalaman Penaakulan Boleh Dikonfigurasi

Pemikiran diaktifkan secara lalai dengan parameter thinking_level baharu (lalai: medium). Gemini 3.5 Flash melakukan perancangan berbilang langkah dalaman sebelum memberi respons, menghasilkan kedalaman penaakulan yang menyaingi model Pro utama dalam tugas matematik, pengekodan, dan logik — dengan kedalaman yang boleh dilaraskan bagi setiap permintaan.

Tetingkap Konteks 1M Token

Masukkan keseluruhan pangkalan kod, berjam-jam video, atau setahun kontrak kewangan dalam satu permintaan. Tetingkap input 1M token berpasangan dengan output 64K token bermakna tugas kompleks kekal lengkap — tiada yang dipotong. Skor konteks panjang MRCR v2 sebesar 26.6% mengatasi semua model setanding.

4× Lebih Pantas, Kurang daripada Separuh Kos

Gemini 3.5 Flash berjalan 4× lebih pantas daripada model frontier setanding pada kurang daripada separuh kos. Pada $1.50 setiap juta token input dengan caching konteks pada $0.15/M, menjalankan ejen AI sepanjang masa menjadi pilihan praktikal — bukan sekadar mungkin secara teknikal.

Pareto Frontier Baharu: Kelajuan × Kecerdasan

Selama bertahun-tahun, lebih pantas bermakna kurang berkebolehan. Gemini 3.5 Flash memecahkan pertukaran itu — ia berada di sudut kanan atas lengkung kelajuan-kecerdasan, mengatasi model yang jauh lebih mahal.

Carta Intelligence vs Speed yang menunjukkan Gemini 3.5 Flash di Pareto frontier

Gemini 3.5 Flash memimpin Pareto frontier intelligence-vs-speed dalam kalangan model frontier. Sumber: Artificial Analysis, Mei 2026.

Penanda Aras Prestasi

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Keputusan kad model rasmi. Gemini 3.5 Flash memimpin dalam pemahaman multimodal, penggunaan alat agentik, dan pengambilan semula konteks panjang.

Penanda Aras

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Sumber: Kad Model Gemini 3.5 Flash — Google DeepMind, Mei 2026.

Spesifikasi Teknikal

Semua yang perlu anda ketahui sebelum mengintegrasikan Gemini 3.5 Flash ke dalam aplikasi anda.

Tetingkap Konteks

1,048,576 token input

65,536 token output

Harga API

$1.50 / 1M token input

$9.00 / 1M token output

$0.15 / 1M token dicache

Ketersediaan Umum

19 Mei 2026 — Google I/O

Tarikh Potongan Pengetahuan

Januari 2026

Mod Pemikiran

Aktif secara lalai. Boleh dikonfigurasi melalui thinking_level: low / medium (lalai) / high. Thought Preservation mengekalkan penaakulan merentasi perbualan berbilang giliran.

Penggunaan Alat & API

Function calling, output berstruktur, pelaksanaan kod, Google Search grounding, context caching — semua disokong secara asli.

Modaliti Input

Teks, imej, audio, video, PDF — multimodal asli, tiada pra-pemprosesan diperlukan.

Multimodal Asli — Satu Model, Setiap Jenis Input

Gemini 3.5 Flash memproses teks, imej, audio, dan video secara asli — tiada saluran paip berasingan, tiada penggabungan pelbagai model.

Teks & PDF

Menghurai dokumen berjuta perkataan dengan ketepatan tinggi. Mengendalikan jadual kompleks, kod, dan data berstruktur dalam satu laluan.

Pemahaman Imej

Skor MMMU-Pro sebesar 83.6% — #1 dunia. Menganalisis pelan bangunan, carta, dan kandungan visual terperinci secara masa nyata.

Analisis Video

Menyokong input video sehingga 1 jam. Menangkap perubahan utama bingkai demi bingkai untuk ringkasan, soal jawab, dan analisis kandungan.

Pemprosesan Audio

Mengenal pasti emosi, bunyi persekitaran, dan perbualan berbilang bahasa. Menyokong terjemahan masa nyata dan pembantu suara.

Tersedia di Mana Sahaja Anda Membina

Gemini 3.5 Flash disepadukan secara mendalam merentasi ekosistem pembangun dan pengguna Google — daripada akses API hingga model lalai yang menguasai berbilion pengguna.

Platform Pembangun

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

Produk Pengguna

Aplikasi Gemini — model lalai global
Google Search AI Mode — model lalai
Gemini Spark — ejen AI peribadi
Felo AI — akses percuma melalui carian & playground

Carta Intelligence vs Cost yang menunjukkan Gemini 3.5 Flash sebagai model frontier dengan nilai terbaik

Gemini 3.5 Flash memimpin frontier intelligence-vs-cost. Kurang daripada separuh kos model setanding untuk prestasi tugas yang setara. Sumber: Artificial Analysis, Mei 2026.

Siapa yang Menggunakan Gemini 3.5 Flash

Daripada pembangun individu hingga pasukan perusahaan, Gemini 3.5 Flash sesuai di mana sahaja anda memerlukan AI yang pantas dan berkebolehan pada skala besar.

Pengekodan Agentik

Skor Terminal-Bench 2.1 sebesar 76.2% dengan kependaman rendah. Ejen pengekodan menyelesaikan tugas lebih pantas dengan lebih sedikit jurang logik — penjanaan kod berulang, penyahpepijatan, dan ujian A/B pada kelajuan Flash.

Pemprosesan Kewangan & Cukai

Proses setahun penuh kontrak dan penyata dalam satu permintaan. Xero menggunakannya untuk mengendalikan borang cukai 1099; Ramp menggunakan OCR multimodalnya untuk pemprosesan invois yang kompleks.

Platform Ejen Perusahaan

Salesforce mengintegrasikannya ke dalam Agentforce untuk mempercepatkan penggunaan ejen perusahaan. Databricks menggunakannya untuk memantau data masa nyata dan mendiagnosis isu secara autonomi.

Tugas Perniagaan Jangka Panjang

Shopify menggunakannya untuk ramalan pertumbuhan pedagang. Melaksanakan aliran kerja kompleks yang berlangsung berjam-jam atau berminggu-minggu dengan boleh dipercayai — jenis tugas yang sebelum ini memerlukan pengawasan manusia di setiap langkah.

Analisis Kandungan Multimodal

Analisis video, imej, dan dokumen bersama dalam satu permintaan. Skor Penaakulan CharXiv sebesar 84.2% bermakna ia mengekstrak pandangan daripada carta kompleks dan kandungan media campuran dengan tepat.

Produk AI Pengguna

Kini model lalai dalam aplikasi Gemini dan Mod AI Google Search — melayani berbilion pengguna aktif bulanan. Fast Mode menghasilkan respons hampir serta-merta pada peranti mudah alih.

Apa Kata Para Pasukan

“Prestasi konteks panjangnya luar biasa untuk memproses set data multimodal tidak berstruktur berskala besar.”

— Bridgewater Associates

“Kami mengintegrasikan Gemini 3.5 Flash ke dalam Agentforce untuk mempercepatkan penggunaan ejen perusahaan — nisbah kelajuan kepada keupayaan tidak seperti mana-mana yang pernah kami lihat sebelum ini.”

— Salesforce

“Gemini 3.5 Flash membolehkan kami memantau maklumat masa nyata dan mendiagnosis isu secara autonomi dalam aliran kerja agentik kami.”

— Databricks

Dua Cara Menggunakan Gemini 3.5 Flash di Felo

Felo AI Search

Buka Felo AI Search dan pilih model Gemini 3.5 Flash. Tanya soalan, cari web dengan AI, dan dapatkan jawapan bersumber — dikuasakan oleh model frontier terpantas Google.

Buka Felo AI Search

Felo LLM Playground

Buka Felo LLM Playground, pilih Gemini 3.5 Flash, dan mula berbual. Bandingkan output daripada pelbagai model secara sebelah menyebelah untuk melihat perbezaan kelajuan dan penaakulan secara langsung.

Buka Playground

Soalan Lazim

Cuba Gemini 3.5 Flash Percuma — Sekarang Juga

Dilancarkan di Google I/O 2026. Buka Felo AI dan mula gunakan model frontier terpantas Google hari ini.

Buka Gemini 3.5 Flash di Felo

Percuma — tiada kad kredit diperlukan