在 Felo AI 上可以免費試用 Gemini 3.5 Flash 嗎？

可以。Felo AI 提供 Gemini 3.5 Flash 的免費試用。註冊免費帳號即可開始使用，無需信用卡。

Gemini 3.5 Flash 何時正式發布？

Gemini 3.5 Flash 於 2026 年 5 月 19 日在 Google I/O 正式發布（GA）。現已可透過 Gemini API、Google AI Studio 和 Felo AI 使用。

Gemini 3.5 Flash 與 Gemini 3.1 Pro 相比如何？

在智慧代理與程式設計基準測試上，Gemini 3.5 Flash 實際上超越了 Gemini 3.1 Pro — 例如 MCP Atlas 83.6% 對 78.2%，Terminal-Bench 2.1 76.2% 對 70.3%。速度快 4 倍，成本不到一半。在純學術推理任務上，Gemini 3.1 Pro 仍略有優勢。

thinking_level 參數是什麼？如何運作？

Gemini 3.5 Flash 預設啟用思考模式。新的 thinking_level 參數（值：low、medium、high）取代了舊版 thinking_budget，讓你可以按請求控制推理深度。預設值為 medium，在大多數任務中平衡速度與深度。

什麼是「思考保留」（Thought Preservation）？

思考保留會自動在多輪對話中保留中間推理過程。這能提升迭代任務（如除錯和程式碼重構）的表現，因為這類任務需要參考先前推理步驟的上下文。

透過 API 使用 Gemini 3.5 Flash 的定價是多少？

輸入：每百萬 token $1.50。輸出：每百萬 token $9.00。快取輸入：每百萬 token $0.15。上下文快取讓重複的長上下文任務大幅降低成本。

100 萬 token 上下文視窗會拖慢回應速度嗎？

不會。Gemini 3.5 Flash 針對長上下文輸入使用了專門的串流最佳化。即使處理大型文件或程式碼庫，回應速度依然保持快速。

在 Felo 上使用 Gemini 3.5 Flash 能做什麼？

Felo 將 Gemini 3.5 Flash 整合至核心功能中 — AI 搜尋、深度調研、主題探索等功能開箱即用。你也可以在 Felo LLM 對話廣場裡自由使用，隨意對話、比較模型輸出或測試自己的提示詞。

正式發布 · Google I/O 2026 · 2026 年 5 月 19 日

Gemini 3.5 Flash — 免費使用閃電速度，Pro 級智慧代理 AI

Gemini 3.5 Flash 是 Google DeepMind 最快的前沿模型，於 2026 年 5 月 19 日正式發布。它具備 Pro 級推理深度，支援 100 萬 token 上下文視窗，速度比同級前沿模型快 4 倍，成本不到一半 — 立即在 Felo AI 免費體驗。

免費體驗 Gemini 3.5 Flash

在 Felo AI 免費使用，無需信用卡

81.2%

MMMU-Pro 分數

全球多模態基準測試第一

$0.50

輸入定價

API 每百萬 token $1.50

0.2s

速度優勢

比同級模型快 4 倍

上下文視窗

單次請求 token 數

Gemini 3.5 Flash 的差異化優勢

首款在智慧代理與程式設計基準測試上超越自家 Pro 前代的 Flash 模型 — 同時保持 Flash 級別的速度與成本。

專為智慧代理工作流程打造

Gemini 3.5 Flash 是 Google 迄今最強大的智慧代理與程式設計模型。它能可靠執行持續數小時乃至數週的長程任務，處理多步驟工具調用，並透過 Google 的 Antigravity 框架協調子代理 — 讓大規模智慧代理系統在經濟上真正可行。

動態思考 — 可調節推理深度

思考模式預設啟用，並新增 thinking_level 參數（預設值：medium）。Gemini 3.5 Flash 在回應前進行內部多步驟規劃，在數學、程式設計和邏輯任務上的推理深度可媲美旗艦 Pro 模型，且可按請求調整深度。

100 萬 token 上下文視窗

單次請求即可處理完整程式碼庫、數小時影片或整年的金融合約。100 萬輸入 token 搭配 6.4 萬輸出 token，複雜任務完整處理，不截斷任何內容。MRCR v2 長上下文分數 26.6%，領先所有同級模型。

快 4 倍，成本不到一半

Gemini 3.5 Flash 比同級前沿模型快 4 倍，成本不到一半。每百萬輸入 token 僅需 $1.50，上下文快取僅 $0.15/M，全天候運行 AI 智慧代理切實可行，而不只是技術上可能。

全新帕累托前沿：速度 × 智能

長久以來，速度越快意味著能力越弱。Gemini 3.5 Flash 打破了這一取捨 — 它位於速度-智能曲線的右上角，超越了成本高出許多的模型。

Gemini 3.5 Flash 在前沿模型中引領智能-速度帕累托前沿。資料來源：Artificial Analysis，2026 年 5 月。

效能基準測試

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

官方模型卡測試結果。Gemini 3.5 Flash 在多模態理解、智慧代理工具調用和長上下文檢索方面領先。

基準測試

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

資料來源：Gemini 3.5 Flash 模型卡 — Google DeepMind，2026 年 5 月。

技術規格

將 Gemini 3.5 Flash 整合至應用程式前，您需要了解的所有資訊。

上下文視窗

輸入 1,048,576 tokens

輸出 65,536 tokens

API 定價

輸入每百萬 token $1.50

輸出每百萬 token $9.00

快取每百萬 token $0.15

正式發布

2026 年 5 月 19 日 — Google I/O

知識截止日期

2026 年 1 月

思考模式

預設啟用。可透過 thinking_level 設定：low / medium（預設）/ high。Thought Preservation 在多輪對話中保留推理過程。

工具調用與 API

函式呼叫、結構化輸出、程式碼執行、Google 搜尋接地、上下文快取 — 全部原生支援。

輸入模態

文字、圖像、音訊、影片、PDF — 原生多模態，無需預處理。

原生多模態 — 一個模型，處理所有輸入類型

Gemini 3.5 Flash 原生處理文字、圖像、音訊和影片 — 無需獨立處理流程，無需串接多個模型。

文字與 PDF

高精度解析百萬字文件。單次處理複雜表格、程式碼和結構化資料，不遺漏任何細節。

圖像理解

MMMU-Pro 分數 83.6%，全球第一。即時分析建築藍圖、圖表和複雜視覺內容。

影片分析

支援最長 1 小時影片輸入，逐幀擷取關鍵變化，適用於摘要生成、問答和內容分析。

音訊處理

辨識情緒、環境音和多語言對話，支援即時翻譯和語音助理場景。

隨處皆可開發

Gemini 3.5 Flash 深度整合於 Google 的開發者與消費者生態系統 — 從 API 存取到為數十億用戶提供服務的預設模型。

開發者平台

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

消費者產品

Gemini 應用程式 — 全球預設模型
Google 搜尋 AI 模式 — 預設模型
Gemini Spark — 個人 AI 代理
Felo AI — 透過搜尋與對話廣場免費使用

Gemini 3.5 Flash 引領智能-成本前沿。以不到同級模型一半的成本，達到同等任務效能。資料來源：Artificial Analysis，2026 年 5 月。

誰在使用 Gemini 3.5 Flash

從個人開發者到企業團隊，Gemini 3.5 Flash 適用於任何需要大規模快速、高能 AI 的場景。

智慧代理程式設計

Terminal-Bench 2.1 分數 76.2%，延遲極低。程式設計代理以 Flash 速度更快完成任務、減少邏輯漏洞 — 支援迭代程式碼生成、除錯和 A/B 測試。

財務與稅務處理

單次請求處理全年合約和報表。Xero 用它處理 1099 稅務表單；Ramp 用其多模態 OCR 處理複雜發票。

企業智慧代理平台

Salesforce 將其整合至 Agentforce，加速企業代理部署。Databricks 用它即時監控資料並自主診斷問題。

長程業務任務

Shopify 用它進行商家成長預測。可靠執行持續數小時乃至數週的複雜工作流程 — 以往每個步驟都需要人工監督的任務，現在可全程自動化。

多模態內容分析

單次請求同時分析影片、圖像和文件。CharXiv Reasoning 分數 84.2%，能從複雜圖表和混合媒體內容中精準提取洞察。

消費級 AI 產品

現為 Gemini 應用程式和 Google 搜尋 AI 模式的預設模型，每月服務數十億活躍用戶。快速模式在行動裝置上實現近乎即時的回應。

用戶怎麼說

“其長上下文效能在處理大規模非結構化多模態資料集時表現卓越。”

— Bridgewater Associates

“我們將 Gemini 3.5 Flash 整合至 Agentforce 以加速企業代理部署 — 這種速度與能力的比例是我們前所未見的。”

— Salesforce

“Gemini 3.5 Flash 讓我們能在智慧代理工作流程中即時監控資訊並自主診斷問題。”

— Databricks

在 Felo 上使用 Gemini 3.5 Flash 的兩種方式

Felo AI 搜尋

開啟 Felo AI 搜尋，選擇 Gemini 3.5 Flash 模型。提問、用 AI 搜尋網路，獲取附引用的答案 — 由 Google 最快前沿模型驅動。

開啟 Felo AI 搜尋

Felo LLM 對話廣場

開啟 Felo LLM 對話廣場，選擇 Gemini 3.5 Flash，開始對話。並排比較多個模型的輸出，親身感受速度與推理能力的差異。

開啟對話廣場

常見問題

立即免費體驗 Gemini 3.5 Flash

於 Google I/O 2026 正式發布。開啟 Felo AI，立即使用 Google 最快前沿模型。

在 Felo 上使用 Gemini 3.5 Flash

免費使用，無需信用卡