Gemini 3.5 Flash — Miễn PhíAI Agentic Ngang Pro với Tốc Độ Flash
Gemini 3.5 Flash là mô hình frontier nhanh nhất của Google DeepMind, ra mắt ngày 19 tháng 5 năm 2026. Mang đến chiều sâu lý luận ngang Pro với cửa sổ ngữ cảnh 1M token và chạy nhanh hơn 4× so với các mô hình frontier tương đương với chi phí chưa đến một nửa — dùng thử miễn phí trên Felo AI ngay bây giờ.
Miễn phí trên Felo AI — không cần thẻ tín dụng
Điều Gì Làm Gemini 3.5 Flash Khác Biệt
Mô hình Flash đầu tiên vượt qua chính người tiền nhiệm Pro của nó trên các benchmark agentic và coding — trong khi vẫn duy trì tốc độ và chi phí ở mức Flash.
Được Xây Dựng Cho Quy Trình Agentic
Gemini 3.5 Flash là mô hình agentic và coding có năng lực nhất của Google cho đến nay. Nó thực thi đáng tin cậy các tác vụ dài hạn kéo dài hàng giờ hoặc hàng tuần, xử lý sử dụng công cụ đa bước và điều phối các sub-agent thông qua framework Antigravity của Google — giúp các hệ thống agentic quy mô lớn trở nên khả thi về mặt kinh tế.
Dynamic Thinking — Chiều Sâu Lý Luận Có Thể Cấu Hình
Thinking được bật mặc định với tham số thinking_level mới (mặc định: medium). Gemini 3.5 Flash thực hiện lập kế hoạch đa bước nội bộ trước khi phản hồi, mang lại chiều sâu lý luận sánh ngang các mô hình Pro hàng đầu trong các tác vụ toán học, lập trình và logic — với độ sâu có thể điều chỉnh theo từng yêu cầu.
Cửa Sổ Ngữ Cảnh 1M Token
Đưa toàn bộ codebase, hàng giờ video hoặc một năm hợp đồng tài chính vào một yêu cầu duy nhất. Cửa sổ input 1M token kết hợp với 64K token output đảm bảo các tác vụ phức tạp luôn hoàn chỉnh — không có gì bị cắt bớt. Điểm MRCR v2 ngữ cảnh dài 26,6% dẫn đầu tất cả các mô hình tương đương.
Nhanh Hơn 4×, Chi Phí Chưa Đến Một Nửa
Gemini 3.5 Flash chạy nhanh hơn 4× so với các mô hình frontier tương đương với chi phí chưa đến một nửa. Ở mức $1,50 mỗi triệu token input với context caching $0,15/M, việc vận hành AI agent liên tục 24/7 trở thành lựa chọn thực tế — không chỉ là có thể về mặt kỹ thuật.
Biên Giới Pareto Mới: Tốc Độ × Trí Tuệ
Nhiều năm qua, nhanh hơn đồng nghĩa với kém năng lực hơn. Gemini 3.5 Flash phá vỡ sự đánh đổi đó — nó nằm ở góc trên bên phải của đường cong tốc độ-trí tuệ, vượt qua các mô hình có giá cao hơn nhiều.

Gemini 3.5 Flash dẫn đầu biên giới Pareto trí tuệ-tốc độ trong số các mô hình frontier. Nguồn: Artificial Analysis, tháng 5 năm 2026.
Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5
Kết quả từ model card chính thức. Gemini 3.5 Flash dẫn đầu về hiểu đa phương thức, sử dụng công cụ agentic và truy xuất ngữ cảnh dài.
Nguồn: Gemini 3.5 Flash Model Card — Google DeepMind, tháng 5 năm 2026.
Thông Số Kỹ Thuật
Mọi thứ bạn cần biết trước khi tích hợp Gemini 3.5 Flash vào ứng dụng của mình.
Cửa Sổ Ngữ Cảnh
Giá API
Phát Hành Chính Thức
19 tháng 5, 2026 — Google I/O
Ngưỡng Kiến Thức
Tháng 1 năm 2026
Chế Độ Suy Nghĩ
Bật mặc định. Có thể cấu hình qua thinking_level: low / medium (mặc định) / high. Thought Preservation giữ lại lý luận qua các cuộc hội thoại nhiều lượt.
Sử Dụng Công Cụ & API
Gọi hàm, đầu ra có cấu trúc, thực thi code, Google Search grounding, context caching — tất cả được hỗ trợ natively.
Các Loại Đầu Vào
Văn bản, hình ảnh, âm thanh, video, PDF — đa phương thức native, không cần tiền xử lý.
Đa Phương Thức Native — Một Mô Hình, Mọi Loại Input
Gemini 3.5 Flash xử lý văn bản, hình ảnh, âm thanh và video theo cách native — không cần pipeline riêng biệt, không cần ghép nối nhiều mô hình.
Văn Bản & PDF
Phân tích tài liệu hàng triệu từ với độ chính xác cao. Xử lý bảng phức tạp, code và dữ liệu có cấu trúc trong một lần duy nhất.
Hiểu Hình Ảnh
Điểm MMMU-Pro 83,6% — #1 thế giới. Phân tích bản vẽ kiến trúc, biểu đồ và nội dung trực quan chi tiết theo thời gian thực.
Phân Tích Video
Hỗ trợ input video lên đến 1 giờ. Nắm bắt các thay đổi quan trọng từng khung hình để tóm tắt, hỏi đáp và phân tích nội dung.
Xử Lý Âm Thanh
Nhận diện cảm xúc, âm thanh môi trường và hội thoại đa ngôn ngữ. Hỗ trợ dịch thuật thời gian thực và trợ lý giọng nói.
Có Mặt Ở Khắp Nơi Bạn Xây Dựng
Gemini 3.5 Flash được tích hợp sâu vào hệ sinh thái nhà phát triển và người dùng của Google — từ truy cập API đến mô hình mặc định phục vụ hàng tỷ người dùng.
Nền Tảng Nhà Phát Triển
- Gemini API
- Google AI Studio
- Android Studio
- Google Antigravity
- Gemini Enterprise Agent Platform (Vertex AI)
Sản Phẩm Người Dùng
- Ứng dụng Gemini — mô hình mặc định toàn cầu
- Google Search AI Mode — mô hình mặc định
- Gemini Spark — AI agent cá nhân
- Felo AI — truy cập miễn phí qua tìm kiếm & playground

Gemini 3.5 Flash dẫn đầu biên giới trí tuệ-chi phí. Chi phí chưa đến một nửa so với các mô hình tương đương cho hiệu suất tác vụ tương đương. Nguồn: Artificial Analysis, tháng 5 năm 2026.
Ai Đang Dùng Gemini 3.5 Flash
Từ lập trình viên cá nhân đến nhóm doanh nghiệp, Gemini 3.5 Flash phù hợp ở bất cứ đâu bạn cần AI nhanh và có năng lực ở quy mô lớn.

Lập Trình Agentic
Điểm Terminal-Bench 2.1 đạt 76,2% với độ trễ thấp. Các coding agent hoàn thành tác vụ nhanh hơn với ít lỗ hổng logic hơn — tạo code lặp đi lặp lại, gỡ lỗi và A/B testing ở tốc độ Flash.

Xử Lý Tài Chính & Thuế
Xử lý toàn bộ hợp đồng và báo cáo cả năm trong một yêu cầu. Xero dùng nó để xử lý biểu mẫu thuế 1099; Ramp dùng OCR đa phương thức của nó cho xử lý hóa đơn phức tạp.

Nền Tảng Agent Doanh Nghiệp
Salesforce tích hợp vào Agentforce để tăng tốc triển khai agent doanh nghiệp. Databricks dùng nó để giám sát dữ liệu thời gian thực và chẩn đoán sự cố tự động.

Tác Vụ Kinh Doanh Dài Hạn
Shopify dùng nó để dự báo tăng trưởng cho người bán. Thực thi đáng tin cậy các quy trình phức tạp kéo dài hàng giờ hoặc hàng tuần — loại tác vụ trước đây cần giám sát của con người ở mỗi bước.

Phân Tích Nội Dung Đa Phương Thức
Phân tích video, hình ảnh và tài liệu cùng nhau trong một yêu cầu. Điểm CharXiv Reasoning 84,2% nghĩa là nó trích xuất thông tin chính xác từ biểu đồ phức tạp và nội dung đa phương tiện.

Sản Phẩm AI Tiêu Dùng
Hiện là mô hình mặc định trong ứng dụng Gemini và Google Search AI Mode — phục vụ hàng tỷ người dùng hoạt động hàng tháng. Fast Mode mang lại phản hồi gần như tức thì trên điện thoại.
Các Nhóm Nói Gì
“Hiệu suất ngữ cảnh dài của nó xuất sắc cho việc xử lý các tập dữ liệu đa phương thức phi cấu trúc quy mô lớn.”
— Bridgewater Associates
“Chúng tôi đã tích hợp Gemini 3.5 Flash vào Agentforce để tăng tốc triển khai agent doanh nghiệp — tỷ lệ tốc độ trên năng lực không giống bất cứ thứ gì chúng tôi từng thấy.”
— Salesforce
“Gemini 3.5 Flash cho phép chúng tôi giám sát thông tin thời gian thực và chẩn đoán sự cố tự động trong các quy trình agentic của mình.”
— Databricks
Hai Cách Dùng Gemini 3.5 Flash trên Felo
Felo AI Search
Mở Felo AI Search và chọn mô hình Gemini 3.5 Flash. Đặt câu hỏi, tìm kiếm web với AI và nhận câu trả lời có trích dẫn nguồn — được hỗ trợ bởi mô hình frontier nhanh nhất của Google.
Mở Felo AI SearchFelo LLM Playground
Mở Felo LLM Playground, chọn Gemini 3.5 Flash và bắt đầu trò chuyện. So sánh kết quả từ nhiều mô hình cạnh nhau để tự mình thấy sự khác biệt về tốc độ và lý luận.
Mở PlaygroundCâu Hỏi Thường Gặp
Dùng thử Gemini 3.5 Flash Miễn phí — Ngay Bây Giờ
Ra mắt tại Google I/O 2026. Mở Felo AI và bắt đầu sử dụng mô hình frontier nhanh nhất của Google ngay hôm nay.
Mở Gemini 3.5 Flash trên FeloMiễn phí — không cần thẻ tín dụng