เปิดตัวแล้ว · เปิดตัวที่ Google I/O 2026 · 19 พฤษภาคม 2026

Gemini 3.5 Flash — ฟรีAI Agentic ระดับ Pro ด้วยความเร็ว Flash

Gemini 3.5 Flash คือโมเดล frontier ที่เร็วที่สุดของ Google DeepMind เปิดตัวเมื่อ 19 พฤษภาคม 2026 มาพร้อมความสามารถในการคิดวิเคราะห์ระดับ Pro หน้าต่างบริบท 1M token และทำงานเร็วกว่าโมเดล frontier เทียบเท่าถึง 4 เท่า ในราคาน้อยกว่าครึ่ง — ทดลองใช้ฟรีบน Felo AI ได้เลยตอนนี้

ใช้ฟรีบน Felo AI — ไม่ต้องใช้บัตรเครดิต

81.2%
คะแนน MMMU-Pro
อันดับ 1 ของโลก benchmark multimodal
$0.50
ราคา Input
$1.50 / 1M token ผ่าน API
0.2s
ความได้เปรียบด้านความเร็ว
เร็วกว่าโมเดลเทียบเท่า 4 เท่า
1M
หน้าต่างบริบท
Token ในคำขอเดียว

อะไรทำให้ Gemini 3.5 Flash แตกต่าง

โมเดล Flash ตัวแรกที่แซงหน้า Pro รุ่นก่อนหน้าในด้าน benchmark agentic และ coding — ขณะที่ยังคงความเร็วและต้นทุนระดับ Flash

ไอคอนความเร็ว

สร้างมาเพื่อ Agentic Workflows

Gemini 3.5 Flash คือโมเดล agentic และ coding ที่มีความสามารถสูงสุดของ Google ในปัจจุบัน รองรับการทำงานระยะยาวที่ใช้เวลาหลายชั่วโมงหรือหลายสัปดาห์ จัดการการใช้เครื่องมือหลายขั้นตอน และประสานงาน sub-agent ผ่าน Antigravity framework ของ Google — ทำให้ระบบ agentic ขนาดใหญ่เป็นไปได้ในเชิงเศรษฐกิจ

ไอคอนการคิด

Dynamic Thinking — ปรับความลึกในการคิดวิเคราะห์ได้

Thinking เปิดใช้งานโดยค่าเริ่มต้นพร้อมพารามิเตอร์ thinking_level ใหม่ (ค่าเริ่มต้น: medium) Gemini 3.5 Flash วางแผนหลายขั้นตอนภายในก่อนตอบ ให้ความลึกในการคิดวิเคราะห์ที่เทียบเท่าโมเดล Pro หลักในงานคณิตศาสตร์ การเขียนโค้ด และตรรกะ — พร้อมปรับความลึกได้ตามแต่ละคำขอ

ไอคอนบริบท

หน้าต่างบริบท 1M Token

ป้อน codebase ทั้งหมด วิดีโอหลายชั่วโมง หรือสัญญาทางการเงิ��ทั้งปีในคำขอเดียว หน้าต่าง input 1M token คู่กับ output 64K token หมายความว่างานซับซ้อนสมบูรณ์ครบถ้วน — ไม่มีการตัดทอน คะแนน MRCR v2 long-context ที่ 26.6% นำหน้าโมเดลเทียบเท่าทั้งหมด

ไอคอนต้นทุน

เร็วกว่า 4 เท่า ต้นทุนน้อยกว่าครึ่ง

Gemini 3.5 Flash ทำงานเร็วกว่าโมเดล frontier เทียบเท่าถึง 4 เท่า ในราคาน้���ยกว่าครึ่ง ที่ $1.50 ต่อล้าน input token พร้อม context caching ที่ $0.15/M การรัน AI agent ตลอด 24 ชั่วโมงกลายเป็นตัวเลือกที่ทำได้จริง ไม่ใช่แค่เป็นไปได้ในทางเทคนิค

พรมแดน Pareto ใหม่: ความเร็ว × ความฉลาด

มาหลายปีแล้วที่ความเร็วหมายถึงความสามารถที่ลดลง Gemini 3.5 Flash ทำลายข้อจำกัดนั้น — มันอยู่ที่มุมขวาบนของเส้นโค้งความเร็ว-ความฉลาด แซงหน้าโมเดลที่มีราคาแพงกว่ามาก

กราฟความฉลาดเทียบกับความเร็ว แสดง Gemini 3.5 Flash ที่พรมแดน Pareto

Gemini 3.5 Flash นำพรมแดน Pareto ด้านความฉลาดเทียบกับความเร็วในบรรดาโมเดล frontier แหล่งที่มา: Artificial Analysis พฤษภาคม 2026

ผลการทดสอบประสิทธิภาพ

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

ผลลัพธ์จาก model card อย่างเป็นทางการ Gemini 3.5 Flash นำในด้านความเข้าใจมัลติโมดัล การใช้เครื่องมือ Agent และการดึงข้อมูล long-context

Benchmark
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

แหล่งที่มา: Gemini 3.5 Flash Model Card — Google DeepMind พฤษภาคม 2026

ข้อมูลจำเพาะทางเทคนิค

ทุกสิ่งที่คุณต้องรู้ก่อนนำ Gemini 3.5 Flash ไปใช้ในแอปพลิเคชันของคุณ

หน้าต่างบริบท

1,048,576 token สำหรับ input
65,536 token สำหรับ output

ราคา API

$1.50 / 1M input token
$9.00 / 1M output token
$0.15 / 1M cached token

เปิดให้ใช้งานทั่วไป

19 พฤษภาคม 2026 — Google I/O

ข้อมูลล่าสุดถึง

มกราคม 2026

โหมดการคิดวิเคราะห์

เปิดใช้งานโดยค่าเริ่มต้น ปรับได้ผ่าน thinking_level: low / medium (ค่าเริ่มต้น) / high Thought Preservation เก็บรักษาการคิดวิเคราะห์ตลอดการสนทนาหลายรอบ

การใช้เครื่องมือและ API

Function calling, structured output, code execution, Google Search grounding, context caching — รองรับทั้งหมดแบบ native

ประเภท Input ที่รองรับ

ข้อความ รูปภาพ เสียง วิดีโอ PDF — multimodal แบบ native ไม่ต้องประมวลผลล่วงหน้า

Multimodal แบบ Native — หนึ่งโมเดล ทุกประเภท Input

Gemini 3.5 Flash ประมวลผลข้อความ รูปภาพ เสียง และวิดีโอแบบ native — ไม่ต้องใช้ pipeline แยก ไม่ต้องเชื่อมต่อหลายโมเดล

ข้อความและ PDF

แยกวิเคราะห์เอกสารหลายล้านคำด้วยความแม่นยำสูง รองรับตารางซับซ้อน โค้ด และข้อมูลที่มีโครงสร้างในการประมวลผลครั้งเดียว

ความเข้าใจรูปภาพ

คะแนน MMMU-Pro 83.6% — อันดับ 1 ของโลก วิเคราะห์แบบแปลนสถาปัตยกรรม กราฟ และเนื้อหาภาพที่ละเอียดแบบเรียลไทม์

การวิเคราะห์วิดีโอ

รองรับ input วิดีโอสูงสุด 1 ชั่วโมง จับการเปลี่ยนแปลงสำคัญทีละเฟรมสำหรับการสรุป ตอบคำถาม และวิเคราะห์เนื้อหา

การประมวลผลเสียง

จดจำอารมณ์ เสียงแวดล้อม และการสนทนาหลายภาษา ขับเคลื่อนการแปลแบบเรียลไทม์และผู้ช่วยเสียง

พร้อมใช้งานทุกที่ที่คุณสร้าง

Gemini 3.5 Flash ผสานรวมอย่างลึกซึ้งทั่วทั้งระบบนิเวศนักพัฒนาและผู้บริโภคของ Google — ตั้งแต่การเข้าถึง API ไปจนถึงโมเดลเริ่มต้นที่ขับเคลื่อนผู้ใช้หลายพันล้านคน

แพลตฟอร์มสำหรับนักพัฒนา

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

ผลิตภัณฑ์สำหรับผู้บริโภค

  • แอป Gemini — โมเดลเริ่มต้นทั่วโลก
  • Google Search AI Mode — โมเดลเริ่มต้น
  • Gemini Spark — AI agent ส่วนตัว
  • Felo AI — เข้าถึงฟรีผ่านการค้นหาและ playground
กราฟความฉลาดเทียบกับต้นทุน แสดง Gemini 3.5 Flash เป็นโมเดล frontier ที่คุ้มค่าที่สุด

Gemini 3.5 Flash นำพรมแดนด้านความฉลาดเทียบกับต้นทุน ต้นทุนน้อยกว่าครึ่งของโมเดลเทียบเท่าสำหรับประสิทธิภาพงานที่เทียบเท่ากัน แหล่งที่มา: Artificial Analysis พฤษภาคม 2026

ใครใช้ Gemini 3.5 Flash

ตั้งแต่นักพัฒนาอิสระไปจนถึงทีมองค์กร Gemini 3.5 Flash เหมาะกับทุกที่ที่คุณต้องการ AI ที่รวดเร็วและมีความสามารถในระดับขนาดใหญ่

Agentic Coding

คะแนน Terminal-Bench 2.1 ที่ 76.2% พร้อมความหน่วงต่ำ Coding agent ทำงานเสร็จเร็วขึ้นและมีช่องว่างทางตรรกะน้อยลง — การสร้างโค้ดแบบ iterative การ debug และการทดสอบ A/B ด้วยความเร็ว Flash

การประมวลผลทางการเงินและภาษี

ประมวลผลสัญญาและงบการเงินทั้งปีในคำขอเดียว Xero ใช้จัดการแบบฟอร์มภาษี 1099 และ Ramp ใช้ multimodal OCR สำหรับประมวลผลใบแจ้งหนี้ที่ซับซ้อน

แพลตฟอร์ม Agent ระดับองค์กร

Salesforce ผสานเข้ากับ Agentforce เพื่อเร่งการใช้งาน enterprise agent Databricks ใช้ตรวจสอบข้อมูลแบบเรียลไทม์และวินิจฉัยปัญหาโดยอัตโนมัติ

งานธุรกิจระยะยาว

Shopify ใช้สำหรับพยากรณ์การเติบโตของผู้ค้า รองรับการทำงาน workflow ที่ซับซ้อนซึ่งใช้เวลาหลายชั่วโมงหรือหลายสัปดาห์ — งานประเภทที่เคยต้องการการดูแลจากมนุษย์ทุกขั้นตอน

การวิเคราะห์เนื้อหา Multimodal

วิเคราะห์วิดีโอ รูปภาพ และเอกสารพร้อมกันในคำขอเดียว คะแนน CharXiv Reasoning ที่ 84.2% หมายความว่าดึงข้อมูลเชิงลึกจากกราฟซับซ้อนและเนื้อหาผสมได้อย่างแม่นยำ

ผลิตภัณฑ์ AI สำหรับผู้บริโภค

ปัจจุบันเป็นโมเดลเริ่มต้นในแอป Gemini และ Google Search AI Mode — ให้บริการผู้ใช้งานรายเดือนหลายพันล้านคน Fast Mode ให้การตอบสนองเกือบทันทีบนมือถือ

เสียงจากทีมต่างๆ

ประสิทธิภาพ long-context ยอดเยี่ยมมากสำหรับการประมวลผล dataset multimodal ที่ไม่มีโครงสร้างขนาดใหญ่

Bridgewater Associates

เราผสาน Gemini 3.5 Flash เข้ากับ Agentforce เพื่อเร่งการใช้งาน enterprise agent — อัตราส่วนความเร็วต่อความสามารถนั้นไม่เคยเห็นมาก่อน

Salesforce

Gemini 3.5 Flash ช่วยให้เราตรวจสอบข้อมูลแบบเรียลไทม์และวินิจฉัยปัญหาโดยอัตโนมัติใน agentic workflows ของเรา

Databricks

สองวิธีใช้ Gemini 3.5 Flash บน Felo

Felo AI Search

เปิด Felo AI Search และเลือกโมเดล Gemini 3.5 Flash ถามคำถาม ค้นหาเว็บด้วย AI และรับคำตอบพร้อมแหล่งอ้างอิง — ขับเคลื่อนโดยโมเดล frontier ที่เร็วที่สุดของ Google

เปิด Felo AI Search

Felo LLM Playground

เปิด Felo LLM Playground เลือก Gemini 3.5 Flash และเริ่มสนทนา เปรียบเทียบผลลัพธ์จากหลายโมเดลแบบเคียงข้างกันเพื่อดูความแตกต่างด้านความเร็วและการคิดวิเคราะห์ด้วยตัวเอง

เปิด Playground

คำถามที่พบบ่อย

ทดลองใช้ Gemini 3.5 Flash ฟรี — ตอนนี้เลย

เปิดตัวที่ Google I/O 2026 เปิด Felo AI และเริ่มใช้โมเดล frontier ที่เร็วที่สุดของ Google วันนี้

เปิด Gemini 3.5 Flash บน Felo

ใช้ฟรี — ไม่ต้องใช้บัตรเครดิต