Tôi có thể dùng thử Gemini 3.5 Flash miễn phí trên Felo AI không?

Có. Felo AI cung cấp quyền truy cập miễn phí vào Gemini 3.5 Flash. Đăng ký tài khoản miễn phí để bắt đầu — không cần thẻ tín dụng.

Gemini 3.5 Flash được phát hành chính thức khi nào?

Gemini 3.5 Flash được ra mắt chính thức (GA) vào ngày 19 tháng 5 năm 2026 tại Google I/O. Hiện có sẵn qua Gemini API, Google AI Studio và Felo AI.

Gemini 3.5 Flash so sánh với Gemini 3.1 Pro như thế nào?

Trên các benchmark agentic và coding, Gemini 3.5 Flash thực sự vượt qua Gemini 3.1 Pro — ví dụ, MCP Atlas 83,6% so với 78,2%, và Terminal-Bench 2.1 76,2% so với 70,3%. Nó chạy nhanh hơn 4× với chi phí chưa đến một nửa. Đối với các tác vụ lý luận học thuật thuần túy, Gemini 3.1 Pro vẫn có lợi thế nhỏ.

Tham số thinking_level là gì và hoạt động như thế nào?

Thinking được bật mặc định trong Gemini 3.5 Flash. Tham số thinking_level mới (các giá trị: low, medium, high) thay thế thinking_budget cũ, cho phép bạn kiểm soát chiều sâu lý luận theo từng yêu cầu. Mặc định là medium, cân bằng giữa tốc độ và chiều sâu cho hầu hết các tác vụ.

Thought Preservation là gì?

Thought Preservation tự động lưu giữ lý luận trung gian qua các cuộc hội thoại nhiều lượt. Điều này cải thiện hiệu suất trên các tác vụ lặp đi lặp lại như gỡ lỗi và tái cấu trúc code, nơi ngữ cảnh từ các bước lý luận trước đó có vai trò quan trọng.

Giá của Gemini 3.5 Flash qua API là bao nhiêu?

Input: $1,50 mỗi triệu token. Output: $9,00 mỗi triệu token. Input được cache: $0,15 mỗi triệu token. Context caching giúp các tác vụ ngữ cảnh dài lặp đi lặp lại tiết kiệm chi phí đáng kể hơn.

Cửa sổ ngữ cảnh 1M token có làm chậm phản hồi không?

Không. Gemini 3.5 Flash sử dụng các tối ưu hóa streaming chuyên biệt cho input ngữ cảnh dài. Tốc độ phản hồi vẫn nhanh ngay cả khi xử lý tài liệu hoặc codebase lớn.

Tôi có thể làm gì với Gemini 3.5 Flash trên Felo?

Felo tích hợp Gemini 3.5 Flash vào các tính năng cốt lõi — tìm kiếm AI, nghiên cứu chuyên sâu và khám phá chủ đề đều sẵn sàng sử dụng ngay. Bạn cũng có thể dùng mô hình tự do trong Felo LLM Playground để trò chuyện, so sánh kết quả hoặc thử nghiệm prompt của riêng mình.

Đã GA · Ra mắt tại Google I/O 2026 · 19 tháng 5, 2026

Gemini 3.5 Flash — Miễn PhíAI Agentic Ngang Pro với Tốc Độ Flash

Gemini 3.5 Flash là mô hình frontier nhanh nhất của Google DeepMind, ra mắt ngày 19 tháng 5 năm 2026. Mang đến chiều sâu lý luận ngang Pro với cửa sổ ngữ cảnh 1M token và chạy nhanh hơn 4× so với các mô hình frontier tương đương với chi phí chưa đến một nửa — dùng thử miễn phí trên Felo AI ngay bây giờ.

Dùng thử Gemini 3.5 Flash Miễn phí

Miễn phí trên Felo AI — không cần thẻ tín dụng

81.2%

Điểm MMMU-Pro

Benchmark đa phương thức #1 thế giới

$0.50

Giá Input

$1,50 / 1M token qua API

0.2s

Lợi Thế Tốc Độ

Nhanh hơn 4× so với các mô hình tương đương

Cửa Sổ Ngữ Cảnh

Token trong một yêu cầu

Điều Gì Làm Gemini 3.5 Flash Khác Biệt

Mô hình Flash đầu tiên vượt qua chính người tiền nhiệm Pro của nó trên các benchmark agentic và coding — trong khi vẫn duy trì tốc độ và chi phí ở mức Flash.

Được Xây Dựng Cho Quy Trình Agentic

Gemini 3.5 Flash là mô hình agentic và coding có năng lực nhất của Google cho đến nay. Nó thực thi đáng tin cậy các tác vụ dài hạn kéo dài hàng giờ hoặc hàng tuần, xử lý sử dụng công cụ đa bước và điều phối các sub-agent thông qua framework Antigravity của Google — giúp các hệ thống agentic quy mô lớn trở nên khả thi về mặt kinh tế.

Dynamic Thinking — Chiều Sâu Lý Luận Có Thể Cấu Hình

Thinking được bật mặc định với tham số thinking_level mới (mặc định: medium). Gemini 3.5 Flash thực hiện lập kế hoạch đa bước nội bộ trước khi phản hồi, mang lại chiều sâu lý luận sánh ngang các mô hình Pro hàng đầu trong các tác vụ toán học, lập trình và logic — với độ sâu có thể điều chỉnh theo từng yêu cầu.

Cửa Sổ Ngữ Cảnh 1M Token

Đưa toàn bộ codebase, hàng giờ video hoặc một năm hợp đồng tài chính vào một yêu cầu duy nhất. Cửa sổ input 1M token kết hợp với 64K token output đảm bảo các tác vụ phức tạp luôn hoàn chỉnh — không có gì bị cắt bớt. Điểm MRCR v2 ngữ cảnh dài 26,6% dẫn đầu tất cả các mô hình tương đương.

Nhanh Hơn 4×, Chi Phí Chưa Đến Một Nửa

Gemini 3.5 Flash chạy nhanh hơn 4× so với các mô hình frontier tương đương với chi phí chưa đến một nửa. Ở mức $1,50 mỗi triệu token input với context caching $0,15/M, việc vận hành AI agent liên tục 24/7 trở thành lựa chọn thực tế — không chỉ là có thể về mặt kỹ thuật.

Biên Giới Pareto Mới: Tốc Độ × Trí Tuệ

Nhiều năm qua, nhanh hơn đồng nghĩa với kém năng lực hơn. Gemini 3.5 Flash phá vỡ sự đánh đổi đó — nó nằm ở góc trên bên phải của đường cong tốc độ-trí tuệ, vượt qua các mô hình có giá cao hơn nhiều.

Biểu đồ Trí Tuệ so với Tốc Độ cho thấy Gemini 3.5 Flash ở biên giới Pareto

Gemini 3.5 Flash dẫn đầu biên giới Pareto trí tuệ-tốc độ trong số các mô hình frontier. Nguồn: Artificial Analysis, tháng 5 năm 2026.

Kết Quả Benchmark Hiệu Suất

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Kết quả từ model card chính thức. Gemini 3.5 Flash dẫn đầu về hiểu đa phương thức, sử dụng công cụ agentic và truy xuất ngữ cảnh dài.

Benchmark

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Nguồn: Gemini 3.5 Flash Model Card — Google DeepMind, tháng 5 năm 2026.

Thông Số Kỹ Thuật

Mọi thứ bạn cần biết trước khi tích hợp Gemini 3.5 Flash vào ứng dụng của mình.

Cửa Sổ Ngữ Cảnh

1.048.576 token đầu vào

65.536 token đầu ra

Giá API

$1,50 / 1M token đầu vào

$9,00 / 1M token đầu ra

$0,15 / 1M token được cache

Phát Hành Chính Thức

19 tháng 5, 2026 — Google I/O

Ngưỡng Kiến Thức

Tháng 1 năm 2026

Chế Độ Suy Nghĩ

Bật mặc định. Có thể cấu hình qua thinking_level: low / medium (mặc định) / high. Thought Preservation giữ lại lý luận qua các cuộc hội thoại nhiều lượt.

Sử Dụng Công Cụ & API

Gọi hàm, đầu ra có cấu trúc, thực thi code, Google Search grounding, context caching — tất cả được hỗ trợ natively.

Các Loại Đầu Vào

Văn bản, hình ảnh, âm thanh, video, PDF — đa phương thức native, không cần tiền xử lý.

Đa Phương Thức Native — Một Mô Hình, Mọi Loại Input

Gemini 3.5 Flash xử lý văn bản, hình ảnh, âm thanh và video theo cách native — không cần pipeline riêng biệt, không cần ghép nối nhiều mô hình.

Văn Bản & PDF

Phân tích tài liệu hàng triệu từ với độ chính xác cao. Xử lý bảng phức tạp, code và dữ liệu có cấu trúc trong một lần duy nhất.

Hiểu Hình Ảnh

Điểm MMMU-Pro 83,6% — #1 thế giới. Phân tích bản vẽ kiến trúc, biểu đồ và nội dung trực quan chi tiết theo thời gian thực.

Phân Tích Video

Hỗ trợ input video lên đến 1 giờ. Nắm bắt các thay đổi quan trọng từng khung hình để tóm tắt, hỏi đáp và phân tích nội dung.

Xử Lý Âm Thanh

Nhận diện cảm xúc, âm thanh môi trường và hội thoại đa ngôn ngữ. Hỗ trợ dịch thuật thời gian thực và trợ lý giọng nói.

Có Mặt Ở Khắp Nơi Bạn Xây Dựng

Gemini 3.5 Flash được tích hợp sâu vào hệ sinh thái nhà phát triển và người dùng của Google — từ truy cập API đến mô hình mặc định phục vụ hàng tỷ người dùng.

Nền Tảng Nhà Phát Triển

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

Sản Phẩm Người Dùng

Ứng dụng Gemini — mô hình mặc định toàn cầu
Google Search AI Mode — mô hình mặc định
Gemini Spark — AI agent cá nhân
Felo AI — truy cập miễn phí qua tìm kiếm & playground

Biểu đồ Trí Tuệ so với Chi Phí cho thấy Gemini 3.5 Flash là mô hình frontier có giá trị tốt nhất

Gemini 3.5 Flash dẫn đầu biên giới trí tuệ-chi phí. Chi phí chưa đến một nửa so với các mô hình tương đương cho hiệu suất tác vụ tương đương. Nguồn: Artificial Analysis, tháng 5 năm 2026.

Ai Đang Dùng Gemini 3.5 Flash

Từ lập trình viên cá nhân đến nhóm doanh nghiệp, Gemini 3.5 Flash phù hợp ở bất cứ đâu bạn cần AI nhanh và có năng lực ở quy mô lớn.

Lập Trình Agentic

Điểm Terminal-Bench 2.1 đạt 76,2% với độ trễ thấp. Các coding agent hoàn thành tác vụ nhanh hơn với ít lỗ hổng logic hơn — tạo code lặp đi lặp lại, gỡ lỗi và A/B testing ở tốc độ Flash.

Xử Lý Tài Chính & Thuế

Xử lý toàn bộ hợp đồng và báo cáo cả năm trong một yêu cầu. Xero dùng nó để xử lý biểu mẫu thuế 1099; Ramp dùng OCR đa phương thức của nó cho xử lý hóa đơn phức tạp.

Nền Tảng Agent Doanh Nghiệp

Salesforce tích hợp vào Agentforce để tăng tốc triển khai agent doanh nghiệp. Databricks dùng nó để giám sát dữ liệu thời gian thực và chẩn đoán sự cố tự động.

Tác Vụ Kinh Doanh Dài Hạn

Shopify dùng nó để dự báo tăng trưởng cho người bán. Thực thi đáng tin cậy các quy trình phức tạp kéo dài hàng giờ hoặc hàng tuần — loại tác vụ trước đây cần giám sát của con người ở mỗi bước.

Phân Tích Nội Dung Đa Phương Thức

Phân tích video, hình ảnh và tài liệu cùng nhau trong một yêu cầu. Điểm CharXiv Reasoning 84,2% nghĩa là nó trích xuất thông tin chính xác từ biểu đồ phức tạp và nội dung đa phương tiện.

Sản Phẩm AI Tiêu Dùng

Hiện là mô hình mặc định trong ứng dụng Gemini và Google Search AI Mode — phục vụ hàng tỷ người dùng hoạt động hàng tháng. Fast Mode mang lại phản hồi gần như tức thì trên điện thoại.

Các Nhóm Nói Gì

“Hiệu suất ngữ cảnh dài của nó xuất sắc cho việc xử lý các tập dữ liệu đa phương thức phi cấu trúc quy mô lớn.”

— Bridgewater Associates

“Chúng tôi đã tích hợp Gemini 3.5 Flash vào Agentforce để tăng tốc triển khai agent doanh nghiệp — tỷ lệ tốc độ trên năng lực không giống bất cứ thứ gì chúng tôi từng thấy.”

— Salesforce

“Gemini 3.5 Flash cho phép chúng tôi giám sát thông tin thời gian thực và chẩn đoán sự cố tự động trong các quy trình agentic của mình.”

— Databricks

Hai Cách Dùng Gemini 3.5 Flash trên Felo

Felo AI Search

Mở Felo AI Search và chọn mô hình Gemini 3.5 Flash. Đặt câu hỏi, tìm kiếm web với AI và nhận câu trả lời có trích dẫn nguồn — được hỗ trợ bởi mô hình frontier nhanh nhất của Google.

Mở Felo AI Search

Felo LLM Playground

Mở Felo LLM Playground, chọn Gemini 3.5 Flash và bắt đầu trò chuyện. So sánh kết quả từ nhiều mô hình cạnh nhau để tự mình thấy sự khác biệt về tốc độ và lý luận.

Mở Playground

Câu Hỏi Thường Gặp

Dùng thử Gemini 3.5 Flash Miễn phí — Ngay Bây Giờ

Ra mắt tại Google I/O 2026. Mở Felo AI và bắt đầu sử dụng mô hình frontier nhanh nhất của Google ngay hôm nay.

Mở Gemini 3.5 Flash trên Felo

Miễn phí — không cần thẻ tín dụng