Gemini 3.5 Flash sắp ra mắt trên Felo AI — Mô hình AI nhanh nhất của Google, miễn phí
Gemini 3.5 Flash của Google DeepMind sắp xuất hiện trên Felo AI — phản hồi dưới một giây, khả năng suy luận cấp Pro, ngữ cảnh 1M, với /usr/bin/bash.50/M token. Truy cập miễn phí.
Tốc độ và chiều sâu từng là hai lựa chọn phải đánh đổi. Chọn một trong hai.
Google DeepMind vừa phá vỡ quy luật đó với Gemini 3.5 Flash — mô hình Flash đầu tiên mang lại khả năng suy luận cấp Pro cùng phản hồi đầu tiên chỉ trong 0.2 giây.
Và chúng tôi đang đưa nó lên Felo AI. Hoàn toàn miễn phí.
Mô hình Flash đầu tiên không còn là sự thỏa hiệp
Các mô hình Flash trước đây buộc bạn phải chọn: nhanh nhưng nông, hoặc sâu nhưng chậm. Gemini 3.5 Flash xóa bỏ lựa chọn đó vì giờ đây không còn đánh đổi nữa.
| Khả năng | Điều mà nó mang lại |
|---|---|
| Tốc độ dưới một giây | Token đầu tiên chỉ 0.2 giây — trợ lý giọng nói thời gian thực, hoàn thành mã trực tiếp, tìm kiếm không độ trễ |
| Chế độ Suy nghĩ | Lập kế hoạch nhiều bước có thể cấu hình trước khi phản hồi — sánh ngang với bản Pro hàng đầu về toán học, lập trình và logic |
| Ngữ cảnh 1M Token | Toàn bộ nền mã, hàng giờ video, một năm hợp đồng — tất cả trong một yêu cầu, không bị cắt ngắn |
| Đa phương thức tích hợp | Văn bản, hình ảnh, video, âm thanh trong cùng một kiến trúc — đạt điểm MMMU-Pro 81,2%, xếp hạng #1 toàn cầu |
| $0.50 mỗi triệu token | 92% hiệu suất cấp GPT-5.5 với chi phí chỉ bằng một phần nhỏ — các agent AI hoạt động 24/7 trở nên khả thi |
Vì sao điều này thay đổi giới hạn có thể trên Felo AI
Hãy nghĩ đến những việc trước đây quá chậm hoặc tốn kém để làm với AI:
Hội thoại giọng nói thời gian thực. Với độ trễ 0.2 giây, nói chuyện với AI giống như nói chuyện với người thật — không còn cảnh chờ phản hồi tải về.
Lập trình tự động ở quy mô lớn. Điểm SWE-bench 78% với độ trễ thấp giúp các agent lập trình hoàn thành nhiệm vụ nhanh hơn, ít lỗi logic hơn. Replit gọi đây là “mô hình đầu tiên kết hợp tốc độ, tiết kiệm và đủ mạnh để vận hành vòng lõi của agent lập trình.”
Xử lý toàn bộ tài liệu trong một lần. Đưa cả năm hợp đồng tài chính vào cửa sổ ngữ cảnh 1M và nhận lại độ chính xác trích xuất cao hơn 15% so với các mô hình trước — không bỏ sót mục nào.
Hỗ trợ khách hàng đa ngôn ngữ 24/7. Với $0.50/M token và khả năng đa ngôn ngữ đạt 91,8%, việc vận hành hỗ trợ AI liên tục giảm chi phí tới 80% so với cách truyền thống.
Phân tích video quy mô lớn. Đạt 86,9% trên Video-MMMU, hỗ trợ đầu vào tới 1 giờ video. Phân tích nội dung từng khung hình và tự động tạo nội dung tiếp thị theo thời gian thực.

So sánh Gemini 3.5 Flash
Các tiêu chuẩn đo của Google DeepMind cho thấy Gemini 3.5 Flash có vị thế rất cạnh tranh:
- MMMU-Pro: 81,2% — điểm cao nhất thế giới trong kiểm định đa phương thức
- SWE-bench: 78% với Chế độ Suy nghĩ bật — hiệu năng mạnh trong lập trình tự động
- BigLaw Bench: cải thiện +7% khả năng suy luận pháp lý so với các mô hình trước
- OmniDocBench: khoảng cách chỉnh sửa OCR 0.121 — chính xác trên bảng biểu và chữ viết tay phức tạp
Về khả năng hiểu đa phương thức và sử dụng công cụ agent, Gemini 3.5 Flash vượt qua cả Claude Sonnet 4.6 và GPT-5.5.
Phản hồi từ các nhóm đã thử nghiệm
"Gemini 3.5 Flash là mô hình đầu tiên mang lại chiều sâu cấp Pro ở tốc độ và quy mô Flash. Hiệu năng ngữ cảnh dài của nó thật xuất sắc khi xử lý các tập dữ liệu nghiên cứu lớn."
— Bridgewater Associates
"Trong bài đánh giá agent lập trình Junie của chúng tôi, chất lượng đạt gần mức của bản Pro hàng đầu, đồng thời duy trì khả năng mở rộng cao và chi phí thấp trong môi trường giới hạn hạn ngạch."
— JetBrains
Hai cách sử dụng Gemini 3.5 Flash trên Felo AI
Felo AI Search
Chọn Gemini 3.5 Flash làm mô hình tìm kiếm của bạn. Nhận câu trả lời nhanh, có trích dẫn được hỗ trợ bởi mô hình biên nhanh nhất của Google — kết hợp cùng tìm kiếm web thời gian thực của Felo.
Felo LLM Playground
Bắt đầu trò chuyện trực tiếp với Gemini 3.5 Flash, so sánh kết quả song song với các mô hình khác và tự mình cảm nhận sự khác biệt về tốc độ.

Tiếp theo là gì
Gemini 3.5 Flash sẽ sớm xuất hiện trên Felo AI. Chúng tôi đang hoàn thiện tích hợp để bạn có trải nghiệm mượt mà ngay từ ngày đầu.
Khi ra mắt:
- Mở Felo AI Search, chọn Gemini 3.5 Flash và nhận câu trả lời tức thì
- Truy cập LLM Playground để thử tốc độ so với các mô hình khác
- Chuyển đổi giữa các mô hình trong khi trò chuyện để so sánh kết quả theo thời gian thực
Không cần thiết lập. Không cần thanh toán. Chỉ cần mở và sử dụng.
Hãy đón chờ
Chúng tôi sẽ công bố ngày ra mắt chính thức tại đây trên blog và trên các kênh của mình. Đăng ký Felo AI để sẵn sàng khi Gemini 3.5 Flash chính thức hoạt động.
AI nhanh không nên là thứ xa xỉ. Và sắp tới, nó sẽ không còn như vậy nữa.
Bài viết này cũng có sẵn bằng English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Türkçe, Italiano, ไทย, Español, বাংলা and Português.