Już dostępny · Premiera na Google I/O 2026 · 19 maja 2026

Gemini 3.5 Flash — BezpłatnieAgentowe AI na Poziomie Pro z Prędkością Flash

Gemini 3.5 Flash to najszybszy model frontier Google DeepMind, zaprezentowany 19 maja 2026 roku. Oferuje głębokość rozumowania na poziomie Pro z oknem kontekstu 1M tokenów i działa 4× szybciej od porównywalnych modeli frontier przy mniej niż połowie kosztów — wypróbuj go bezpłatnie na Felo AI już teraz.

Bezpłatny dostęp na Felo AI — bez karty kredytowej

81.2%
Wynik MMMU-Pro
Globalny benchmark multimodalny #1
$0.50
Cena za Wejście
1,50 USD / 1M tokenów przez API
0.2s
Przewaga Szybkości
4× szybszy od porównywalnych modeli
1M
Okno Kontekstu
Tokeny w jednym żądaniu

Co Wyróżnia Gemini 3.5 Flash

Pierwszy model Flash, który przewyższa swojego poprzednika Pro w benchmarkach agentowych i programistycznych — zachowując przy tym prędkość i koszty charakterystyczne dla Flash.

Ikona prędkości

Stworzony do Przepływów Agentowych

Gemini 3.5 Flash to najbardziej zaawansowany model agentowy i programistyczny Google. Niezawodnie wykonuje długoterminowe zadania trwające godziny lub tygodnie, obsługuje wieloetapowe korzystanie z narzędzi i koordynuje pod-agenty za pomocą frameworka Antigravity Google — czyniąc wielkoskalowe systemy agentowe ekonomicznie opłacalnymi.

Ikona myślenia

Dynamiczne Myślenie — Konfigurowalna Głębokość Rozumowania

Myślenie jest domyślnie włączone dzięki nowemu parametrowi thinking_level (domyślnie: medium). Gemini 3.5 Flash przeprowadza wewnętrzne wieloetapowe planowanie przed udzieleniem odpowiedzi, oferując głębokość rozumowania rywalizującą z flagowymi modelami Pro w zadaniach matematycznych, programistycznych i logicznych — z możliwością dostosowania głębokości dla każdego żądania.

Ikona kontekstu

Okno Kontekstu 1M Tokenów

Prześlij całą bazę kodu, godziny wideo lub roczny zbiór umów finansowych w jednym żądaniu. Okno wejściowe 1M tokenów w połączeniu z 64K tokenami wyjściowymi oznacza, że złożone zadania pozostają kompletne — nic nie zostaje obcięte. Wynik MRCR v2 dla długich kontekstów wynoszący 26,6% przewyższa wszystkie porównywalne modele.

Ikona kosztów

4× Szybszy, Mniej Niż Połowa Kosztów

Gemini 3.5 Flash działa 4× szybciej od porównywalnych modeli frontier przy mniej niż połowie kosztów. Przy cenie 1,50 USD za milion tokenów wejściowych i buforowaniu kontekstu za 0,15 USD/M, całodobowe uruchamianie agentów AI staje się praktyczną opcją — nie tylko technicznie możliwą.

Nowa Granica Pareto: Prędkość × Inteligencja

Przez lata szybszy oznaczał mniej zdolny. Gemini 3.5 Flash przełamuje ten kompromis — zajmuje pozycję w prawym górnym rogu krzywej prędkość-inteligencja, wyprzedzając modele kosztujące znacznie więcej.

Wykres Intelligence vs Speed pokazujący Gemini 3.5 Flash na granicy Pareto

Gemini 3.5 Flash prowadzi na granicy Pareto intelligence-vs-speed wśród modeli frontier. Źródło: Artificial Analysis, maj 2026.

Benchmarki Wydajności

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Oficjalne wyniki z karty modelu. Gemini 3.5 Flash prowadzi w rozumieniu multimodalnym, agentowym korzystaniu z narzędzi i wyszukiwaniu w długich kontekstach.

Benchmark
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Źródło: Karta Modelu Gemini 3.5 Flash — Google DeepMind, maj 2026.

Specyfikacje Techniczne

Wszystko, co musisz wiedzieć przed integracją Gemini 3.5 Flash w swojej aplikacji.

Okno Kontekstu

1 048 576 tokenów wejściowych
65 536 tokenów wyjściowych

Cennik API

1,50 USD / 1M tokenów wejściowych
9,00 USD / 1M tokenów wyjściowych
0,15 USD / 1M buforowanych tokenów

Ogólna Dostępność

19 maja 2026 — Google I/O

Data Graniczna Wiedzy

Styczeń 2026

Tryb Myślenia

Domyślnie włączony. Konfigurowalny przez thinking_level: low / medium (domyślnie) / high. Thought Preservation zachowuje rozumowanie w wieloturowych rozmowach.

Korzystanie z Narzędzi i API

Wywoływanie funkcji, ustrukturyzowane wyjście, wykonywanie kodu, uziemienie Google Search, buforowanie kontekstu — wszystko obsługiwane natywnie.

Modalności Wejściowe

Tekst, obrazy, audio, wideo, PDF — natywna multimodalność, bez wymaganego wstępnego przetwarzania.

Natywna Multimodalność — Jeden Model, Każdy Typ Wejścia

Gemini 3.5 Flash przetwarza tekst, obrazy, audio i wideo natywnie — bez oddzielnych potoków, bez łączenia wielu modeli.

Tekst i PDF

Analizuje dokumenty liczące milion słów z wysoką dokładnością. Obsługuje złożone tabele, kod i dane strukturalne w jednym przebiegu.

Rozumienie Obrazów

Wynik MMMU-Pro 83,6% — globalny #1. Analizuje projekty architektoniczne, wykresy i szczegółowe treści wizualne w czasie rzeczywistym.

Analiza Wideo

Obsługuje do 1 godziny wejścia wideo. Rejestruje kluczowe zmiany klatka po klatce do streszczania, pytań i odpowiedzi oraz analizy treści.

Przetwarzanie Audio

Rozpoznaje emocje, dźwięki otoczenia i wielojęzyczne rozmowy. Zasila tłumaczenie w czasie rzeczywistym i asystentów głosowych.

Dostępny Wszędzie, Gdzie Budujesz

Gemini 3.5 Flash jest głęboko zintegrowany w ekosystemie deweloperskim i konsumenckim Google — od dostępu przez API po domyślny model zasilający miliardy użytkowników.

Platformy Deweloperskie

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Produkty Konsumenckie

  • Aplikacja Gemini — globalny domyślny model
  • Google Search AI Mode — domyślny model
  • Gemini Spark — osobisty agent AI
  • Felo AI — bezpłatny dostęp przez wyszukiwarkę i playground
Wykres Intelligence vs Cost pokazujący Gemini 3.5 Flash jako model frontier o najlepszym stosunku jakości do ceny

Gemini 3.5 Flash prowadzi na granicy intelligence-vs-cost. Mniej niż połowa kosztów porównywalnych modeli przy równoważnej wydajności zadań. Źródło: Artificial Analysis, maj 2026.

Kto Używa Gemini 3.5 Flash

Od indywidualnych deweloperów po zespoły korporacyjne — Gemini 3.5 Flash sprawdza się wszędzie tam, gdzie potrzebna jest szybka i wydajna AI na dużą skalę.

Programowanie Agentowe

Wynik Terminal-Bench 2.1 wynoszący 76,2% przy niskich opóźnieniach. Agenty programistyczne wykonują zadania szybciej z mniejszą liczbą luk logicznych — iteracyjne generowanie kodu, debugowanie i testy A/B z prędkością Flash.

Przetwarzanie Finansowe i Podatkowe

Przetwarzaj pełny rok umów i zestawień w jednym żądaniu. Xero używa go do obsługi formularzy podatkowych 1099; Ramp korzysta z jego multimodalnego OCR do złożonego przetwarzania faktur.

Korporacyjne Platformy Agentowe

Salesforce integruje go z Agentforce, aby przyspieszyć wdrażanie agentów korporacyjnych. Databricks używa go do monitorowania danych w czasie rzeczywistym i autonomicznego diagnozowania problemów.

Długoterminowe Zadania Biznesowe

Shopify używa go do prognozowania wzrostu sprzedawców. Niezawodnie wykonuje złożone przepływy pracy trwające godziny lub tygodnie — zadania, które wcześniej wymagały nadzoru człowieka na każdym etapie.

Multimodalna Analiza Treści

Analizuj wideo, obrazy i dokumenty razem w jednym żądaniu. Wynik CharXiv Reasoning wynoszący 84,2% oznacza dokładne wyciąganie wniosków ze złożonych wykresów i treści mieszanych.

Konsumenckie Produkty AI

Teraz domyślny model w aplikacji Gemini i trybie AI Google Search — obsługujący miliardy aktywnych użytkowników miesięcznie. Tryb Szybki zapewnia niemal natychmiastowe odpowiedzi na urządzeniach mobilnych.

Co Mówią Zespoły

Jego wydajność przy długich kontekstach jest wyjątkowa do przetwarzania wielkoskalowych nieustrukturyzowanych multimodalnych zbiorów danych.

Bridgewater Associates

Zintegrowaliśmy Gemini 3.5 Flash z Agentforce, aby przyspieszyć wdrażanie agentów korporacyjnych — stosunek prędkości do możliwości jest niepodobny do niczego, co wcześniej widzieliśmy.

Salesforce

Gemini 3.5 Flash pozwala nam monitorować informacje w czasie rzeczywistym i autonomicznie diagnozować problemy w naszych przepływach agentowych.

Databricks

Dwa Sposoby Korzystania z Gemini 3.5 Flash na Felo

Felo AI Search

Otwórz Felo AI Search i wybierz model Gemini 3.5 Flash. Zadawaj pytania, przeszukuj internet z AI i otrzymuj odpowiedzi z cytatami — zasilane najszybszym modelem frontier Google.

Otwórz Felo AI Search

Felo LLM Playground

Otwórz Felo LLM Playground, wybierz Gemini 3.5 Flash i zacznij rozmawiać. Porównuj wyniki wielu modeli obok siebie, by na własne oczy zobaczyć różnicę w prędkości i rozumowaniu.

Otwórz Playground

Często Zadawane Pytania

Wypróbuj Gemini 3.5 Flash Bezpłatnie — Już Teraz

Premiera na Google I/O 2026. Otwórz Felo AI i zacznij korzystać z najszybszego modelu frontier Google już dziś.

Otwórz Gemini 3.5 Flash na Felo

Bezpłatny dostęp — bez karty kredytowej