正式發布 · Google I/O 2026 · 2026 年 5 月 19 日

Gemini 3.5 Flash — 免費使用閃電速度,Pro 級智慧代理 AI

Gemini 3.5 Flash 是 Google DeepMind 最快的前沿模型,於 2026 年 5 月 19 日正式發布。它具備 Pro 級推理深度,支援 100 萬 token 上下文視窗,速度比同級前沿模型快 4 倍,成本不到一半 — 立即在 Felo AI 免費體驗。

在 Felo AI 免費使用,無需信用卡

81.2%
MMMU-Pro 分數
全球多模態基準測試第一
$0.50
輸入定價
API 每百萬 token $1.50
0.2s
速度優勢
比同級模型快 4 倍
1M
上下文視窗
單次請求 token 數

Gemini 3.5 Flash 的差異化優勢

首款在智慧代理與程式設計基準測試上超越自家 Pro 前代的 Flash 模型 — 同時保持 Flash 級別的速度與成本。

速度圖示

專為智慧代理工作流程打造

Gemini 3.5 Flash 是 Google 迄今最強大的智慧代理與程式設計模型。它能可靠執行持續數小時乃至數週的長程任務,處理多步驟工具調用,並透過 Google 的 Antigravity 框架協調子代理 — 讓大規模智慧代理系統在經濟上真正可行。

思考圖示

動態思考 — 可調節推理深度

思考模式預設啟用,並新增 thinking_level 參數(預設值:medium)。Gemini 3.5 Flash 在回應前進行內部多步驟規劃,在數學、程式設計和邏輯任務上的推理深度可媲美旗艦 Pro 模型,且可按請求調整深度。

上下文圖示

100 萬 token 上下文視窗

單次請求即可處理完整程式碼庫、數小時影片或整年的金融合約。100 萬輸入 token 搭配 6.4 萬輸出 token,複雜任務完整處理,不截斷任何內容。MRCR v2 長上下文分數 26.6%,領先所有同級模型。

成本圖示

快 4 倍,成本不到一半

Gemini 3.5 Flash 比同級前沿模型快 4 倍,成本不到一半。每百萬輸入 token 僅需 $1.50,上下文快取僅 $0.15/M,全天候運行 AI 智慧代理切實可行,而不只是技術上可能。

全新帕累托前沿:速度 × 智能

長久以來,速度越快意味著能力越弱。Gemini 3.5 Flash 打破了這一取捨 — 它位於速度-智能曲線的右上角,超越了成本高出許多的模型。

顯示 Gemini 3.5 Flash 位於帕累托前沿的智能與速度對比圖

Gemini 3.5 Flash 在前沿模型中引領智能-速度帕累托前沿。資料來源:Artificial Analysis,2026 年 5 月。

效能基準測試

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

官方模型卡測試結果。Gemini 3.5 Flash 在多模態理解、智慧代理工具調用和長上下文檢索方面領先。

基準測試
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

資料來源:Gemini 3.5 Flash 模型卡 — Google DeepMind,2026 年 5 月。

技術規格

將 Gemini 3.5 Flash 整合至應用程式前,您需要了解的所有資訊。

上下文視窗

輸入 1,048,576 tokens
輸出 65,536 tokens

API 定價

輸入每百萬 token $1.50
輸出每百萬 token $9.00
快取每百萬 token $0.15

正式發布

2026 年 5 月 19 日 — Google I/O

知識截止日期

2026 年 1 月

思考模式

預設啟用。可透過 thinking_level 設定:low / medium(預設)/ high。Thought Preservation 在多輪對話中保留推理過程。

工具調用與 API

函式呼叫、結構化輸出、程式碼執行、Google 搜尋接地、上下文快取 — 全部原生支援。

輸入模態

文字、圖像、音訊、影片、PDF — 原生多模態,無需預處理。

原生多模態 — 一個模型,處理所有輸入類型

Gemini 3.5 Flash 原生處理文字、圖像、音訊和影片 — 無需獨立處理流程,無需串接多個模型。

文字與 PDF

高精度解析百萬字文件。單次處理複雜表格、程式碼和結構化資料,不遺漏任何細節。

圖像理解

MMMU-Pro 分數 83.6%,全球第一。即時分析建築藍圖、圖表和複雜視覺內容。

影片分析

支援最長 1 小時影片輸入,逐幀擷取關鍵變化,適用於摘要生成、問答和內容分析。

音訊處理

辨識情緒、環境音和多語言對話,支援即時翻譯和語音助理場景。

隨處皆可開發

Gemini 3.5 Flash 深度整合於 Google 的開發者與消費者生態系統 — 從 API 存取到為數十億用戶提供服務的預設模型。

開發者平台

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

消費者產品

  • Gemini 應用程式 — 全球預設模型
  • Google 搜尋 AI 模式 — 預設模型
  • Gemini Spark — 個人 AI 代理
  • Felo AI — 透過搜尋與對話廣場免費使用
顯示 Gemini 3.5 Flash 為最佳性價比前沿模型的智能與成本對比圖

Gemini 3.5 Flash 引領智能-成本前沿。以不到同級模型一半的成本,達到同等任務效能。資料來源:Artificial Analysis,2026 年 5 月。

誰在使用 Gemini 3.5 Flash

從個人開發者到企業團隊,Gemini 3.5 Flash 適用於任何需要大規模快速、高能 AI 的場景。

智慧代理程式設計

Terminal-Bench 2.1 分數 76.2%,延遲極低。程式設計代理以 Flash 速度更快完成任務、減少邏輯漏洞 — 支援迭代程式碼生成、除錯和 A/B 測試。

財務與稅務處理

單次請求處理全年合約和報表。Xero 用它處理 1099 稅務表單;Ramp 用其多模態 OCR 處理複雜發票。

企業智慧代理平台

Salesforce 將其整合至 Agentforce,加速企業代理部署。Databricks 用它即時監控資料並自主診斷問題。

長程業務任務

Shopify 用它進行商家成長預測。可靠執行持續數小時乃至數週的複雜工作流程 — 以往每個步驟都需要人工監督的任務,現在可全程自動化。

多模態內容分析

單次請求同時分析影片、圖像和文件。CharXiv Reasoning 分數 84.2%,能從複雜圖表和混合媒體內容中精準提取洞察。

消費級 AI 產品

現為 Gemini 應用程式和 Google 搜尋 AI 模式的預設模型,每月服務數十億活躍用戶。快速模式在行動裝置上實現近乎即時的回應。

用戶怎麼說

其長上下文效能在處理大規模非結構化多模態資料集時表現卓越。

Bridgewater Associates

我們將 Gemini 3.5 Flash 整合至 Agentforce 以加速企業代理部署 — 這種速度與能力的比例是我們前所未見的。

Salesforce

Gemini 3.5 Flash 讓我們能在智慧代理工作流程中即時監控資訊並自主診斷問題。

Databricks

在 Felo 上使用 Gemini 3.5 Flash 的兩種方式

Felo AI 搜尋

開啟 Felo AI 搜尋,選擇 Gemini 3.5 Flash 模型。提問、用 AI 搜尋網路,獲取附引用的答案 — 由 Google 最快前沿模型驅動。

開啟 Felo AI 搜尋

Felo LLM 對話廣場

開啟 Felo LLM 對話廣場,選擇 Gemini 3.5 Flash,開始對話。並排比較多個模型的輸出,親身感受速度與推理能力的差異。

開啟對話廣場

常見問題

立即免費體驗 Gemini 3.5 Flash

於 Google I/O 2026 正式發布。開啟 Felo AI,立即使用 Google 最快前沿模型。

在 Felo 上使用 Gemini 3.5 Flash

免費使用,無需信用卡