Czy mogę wypróbować Gemini 3.5 Flash za darmo na Felo AI?

Tak. Felo AI oferuje bezpłatny dostęp do Gemini 3.5 Flash. Zarejestruj darmowe konto, aby zacząć — bez karty kredytowej.

Kiedy Gemini 3.5 Flash został oficjalnie wydany?

Gemini 3.5 Flash został oficjalnie uruchomiony (GA) 19 maja 2026 roku na Google I/O. Jest teraz dostępny przez Gemini API, Google AI Studio i Felo AI.

Jak Gemini 3.5 Flash wypada w porównaniu z Gemini 3.1 Pro?

W benchmarkach agentowych i programistycznych Gemini 3.5 Flash faktycznie przewyższa Gemini 3.1 Pro — na przykład MCP Atlas 83,6% vs 78,2% oraz Terminal-Bench 2.1 76,2% vs 70,3%. Działa 4× szybciej przy mniej niż połowie kosztów. W przypadku czysto akademicznych zadań rozumowania Gemini 3.1 Pro nadal zachowuje niewielką przewagę.

Czym jest parametr thinking_level i jak działa?

Myślenie jest domyślnie włączone w Gemini 3.5 Flash. Nowy parametr thinking_level (wartości: low, medium, high) zastępuje stary thinking_budget, pozwalając kontrolować głębokość rozumowania dla każdego żądania. Domyślna wartość to medium, która równoważy prędkość i głębokość dla większości zadań.

Czym jest Thought Preservation?

Thought Preservation automatycznie zachowuje pośrednie rozumowanie w wieloturowych rozmowach. Poprawia to wydajność w iteracyjnych zadaniach, takich jak debugowanie i refaktoryzacja kodu, gdzie kontekst z wcześniejszych etapów rozumowania ma znaczenie.

Jakie są ceny Gemini 3.5 Flash przez API?

Wejście: 1,50 USD za milion tokenów. Wyjście: 9,00 USD za milion tokenów. Buforowane wejście: 0,15 USD za milion tokenów. Buforowanie kontekstu sprawia, że powtarzające się zadania z długim kontekstem są znacznie bardziej opłacalne.

Czy okno kontekstu 1M tokenów spowalnia odpowiedzi?

Nie. Gemini 3.5 Flash używa specjalistycznych optymalizacji strumieniowania dla długich kontekstów. Prędkość odpowiedzi pozostaje wysoka nawet podczas przetwarzania dużych dokumentów lub baz kodu.

Co mogę zrobić z Gemini 3.5 Flash na Felo?

Felo integruje Gemini 3.5 Flash w swoich głównych funkcjach — wyszukiwanie AI, dogłębne badania i eksploracja tematów są gotowe do użycia od razu. Możesz też swobodnie korzystać z modelu w Felo LLM Playground, aby rozmawiać, porównywać wyniki lub testować własne prompty.

Już dostępny · Premiera na Google I/O 2026 · 19 maja 2026

Gemini 3.5 Flash — BezpłatnieAgentowe AI na Poziomie Pro z Prędkością Flash

Gemini 3.5 Flash to najszybszy model frontier Google DeepMind, zaprezentowany 19 maja 2026 roku. Oferuje głębokość rozumowania na poziomie Pro z oknem kontekstu 1M tokenów i działa 4× szybciej od porównywalnych modeli frontier przy mniej niż połowie kosztów — wypróbuj go bezpłatnie na Felo AI już teraz.

Wypróbuj Gemini 3.5 Flash Bezpłatnie

Bezpłatny dostęp na Felo AI — bez karty kredytowej

81.2%

Wynik MMMU-Pro

Globalny benchmark multimodalny #1

$0.50

Cena za Wejście

1,50 USD / 1M tokenów przez API

0.2s

Przewaga Szybkości

4× szybszy od porównywalnych modeli

Okno Kontekstu

Tokeny w jednym żądaniu

Co Wyróżnia Gemini 3.5 Flash

Pierwszy model Flash, który przewyższa swojego poprzednika Pro w benchmarkach agentowych i programistycznych — zachowując przy tym prędkość i koszty charakterystyczne dla Flash.

Stworzony do Przepływów Agentowych

Gemini 3.5 Flash to najbardziej zaawansowany model agentowy i programistyczny Google. Niezawodnie wykonuje długoterminowe zadania trwające godziny lub tygodnie, obsługuje wieloetapowe korzystanie z narzędzi i koordynuje pod-agenty za pomocą frameworka Antigravity Google — czyniąc wielkoskalowe systemy agentowe ekonomicznie opłacalnymi.

Dynamiczne Myślenie — Konfigurowalna Głębokość Rozumowania

Myślenie jest domyślnie włączone dzięki nowemu parametrowi thinking_level (domyślnie: medium). Gemini 3.5 Flash przeprowadza wewnętrzne wieloetapowe planowanie przed udzieleniem odpowiedzi, oferując głębokość rozumowania rywalizującą z flagowymi modelami Pro w zadaniach matematycznych, programistycznych i logicznych — z możliwością dostosowania głębokości dla każdego żądania.

Okno Kontekstu 1M Tokenów

Prześlij całą bazę kodu, godziny wideo lub roczny zbiór umów finansowych w jednym żądaniu. Okno wejściowe 1M tokenów w połączeniu z 64K tokenami wyjściowymi oznacza, że złożone zadania pozostają kompletne — nic nie zostaje obcięte. Wynik MRCR v2 dla długich kontekstów wynoszący 26,6% przewyższa wszystkie porównywalne modele.

4× Szybszy, Mniej Niż Połowa Kosztów

Gemini 3.5 Flash działa 4× szybciej od porównywalnych modeli frontier przy mniej niż połowie kosztów. Przy cenie 1,50 USD za milion tokenów wejściowych i buforowaniu kontekstu za 0,15 USD/M, całodobowe uruchamianie agentów AI staje się praktyczną opcją — nie tylko technicznie możliwą.

Nowa Granica Pareto: Prędkość × Inteligencja

Przez lata szybszy oznaczał mniej zdolny. Gemini 3.5 Flash przełamuje ten kompromis — zajmuje pozycję w prawym górnym rogu krzywej prędkość-inteligencja, wyprzedzając modele kosztujące znacznie więcej.

Wykres Intelligence vs Speed pokazujący Gemini 3.5 Flash na granicy Pareto

Gemini 3.5 Flash prowadzi na granicy Pareto intelligence-vs-speed wśród modeli frontier. Źródło: Artificial Analysis, maj 2026.

Benchmarki Wydajności

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Oficjalne wyniki z karty modelu. Gemini 3.5 Flash prowadzi w rozumieniu multimodalnym, agentowym korzystaniu z narzędzi i wyszukiwaniu w długich kontekstach.

Benchmark

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Źródło: Karta Modelu Gemini 3.5 Flash — Google DeepMind, maj 2026.

Specyfikacje Techniczne

Wszystko, co musisz wiedzieć przed integracją Gemini 3.5 Flash w swojej aplikacji.

Okno Kontekstu

1 048 576 tokenów wejściowych

65 536 tokenów wyjściowych

Cennik API

1,50 USD / 1M tokenów wejściowych

9,00 USD / 1M tokenów wyjściowych

0,15 USD / 1M buforowanych tokenów

Ogólna Dostępność

19 maja 2026 — Google I/O

Data Graniczna Wiedzy

Styczeń 2026

Tryb Myślenia

Domyślnie włączony. Konfigurowalny przez thinking_level: low / medium (domyślnie) / high. Thought Preservation zachowuje rozumowanie w wieloturowych rozmowach.

Korzystanie z Narzędzi i API

Wywoływanie funkcji, ustrukturyzowane wyjście, wykonywanie kodu, uziemienie Google Search, buforowanie kontekstu — wszystko obsługiwane natywnie.

Modalności Wejściowe

Tekst, obrazy, audio, wideo, PDF — natywna multimodalność, bez wymaganego wstępnego przetwarzania.

Natywna Multimodalność — Jeden Model, Każdy Typ Wejścia

Gemini 3.5 Flash przetwarza tekst, obrazy, audio i wideo natywnie — bez oddzielnych potoków, bez łączenia wielu modeli.

Tekst i PDF

Analizuje dokumenty liczące milion słów z wysoką dokładnością. Obsługuje złożone tabele, kod i dane strukturalne w jednym przebiegu.

Rozumienie Obrazów

Wynik MMMU-Pro 83,6% — globalny #1. Analizuje projekty architektoniczne, wykresy i szczegółowe treści wizualne w czasie rzeczywistym.

Analiza Wideo

Obsługuje do 1 godziny wejścia wideo. Rejestruje kluczowe zmiany klatka po klatce do streszczania, pytań i odpowiedzi oraz analizy treści.

Przetwarzanie Audio

Rozpoznaje emocje, dźwięki otoczenia i wielojęzyczne rozmowy. Zasila tłumaczenie w czasie rzeczywistym i asystentów głosowych.

Dostępny Wszędzie, Gdzie Budujesz

Gemini 3.5 Flash jest głęboko zintegrowany w ekosystemie deweloperskim i konsumenckim Google — od dostępu przez API po domyślny model zasilający miliardy użytkowników.

Platformy Deweloperskie

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

Produkty Konsumenckie

Aplikacja Gemini — globalny domyślny model
Google Search AI Mode — domyślny model
Gemini Spark — osobisty agent AI
Felo AI — bezpłatny dostęp przez wyszukiwarkę i playground

Wykres Intelligence vs Cost pokazujący Gemini 3.5 Flash jako model frontier o najlepszym stosunku jakości do ceny

Gemini 3.5 Flash prowadzi na granicy intelligence-vs-cost. Mniej niż połowa kosztów porównywalnych modeli przy równoważnej wydajności zadań. Źródło: Artificial Analysis, maj 2026.

Kto Używa Gemini 3.5 Flash

Od indywidualnych deweloperów po zespoły korporacyjne — Gemini 3.5 Flash sprawdza się wszędzie tam, gdzie potrzebna jest szybka i wydajna AI na dużą skalę.

Programowanie Agentowe

Wynik Terminal-Bench 2.1 wynoszący 76,2% przy niskich opóźnieniach. Agenty programistyczne wykonują zadania szybciej z mniejszą liczbą luk logicznych — iteracyjne generowanie kodu, debugowanie i testy A/B z prędkością Flash.

Przetwarzanie Finansowe i Podatkowe

Przetwarzaj pełny rok umów i zestawień w jednym żądaniu. Xero używa go do obsługi formularzy podatkowych 1099; Ramp korzysta z jego multimodalnego OCR do złożonego przetwarzania faktur.

Korporacyjne Platformy Agentowe

Salesforce integruje go z Agentforce, aby przyspieszyć wdrażanie agentów korporacyjnych. Databricks używa go do monitorowania danych w czasie rzeczywistym i autonomicznego diagnozowania problemów.

Długoterminowe Zadania Biznesowe

Shopify używa go do prognozowania wzrostu sprzedawców. Niezawodnie wykonuje złożone przepływy pracy trwające godziny lub tygodnie — zadania, które wcześniej wymagały nadzoru człowieka na każdym etapie.

Multimodalna Analiza Treści

Analizuj wideo, obrazy i dokumenty razem w jednym żądaniu. Wynik CharXiv Reasoning wynoszący 84,2% oznacza dokładne wyciąganie wniosków ze złożonych wykresów i treści mieszanych.

Konsumenckie Produkty AI

Teraz domyślny model w aplikacji Gemini i trybie AI Google Search — obsługujący miliardy aktywnych użytkowników miesięcznie. Tryb Szybki zapewnia niemal natychmiastowe odpowiedzi na urządzeniach mobilnych.

Co Mówią Zespoły

“Jego wydajność przy długich kontekstach jest wyjątkowa do przetwarzania wielkoskalowych nieustrukturyzowanych multimodalnych zbiorów danych.”

— Bridgewater Associates

“Zintegrowaliśmy Gemini 3.5 Flash z Agentforce, aby przyspieszyć wdrażanie agentów korporacyjnych — stosunek prędkości do możliwości jest niepodobny do niczego, co wcześniej widzieliśmy.”

— Salesforce

“Gemini 3.5 Flash pozwala nam monitorować informacje w czasie rzeczywistym i autonomicznie diagnozować problemy w naszych przepływach agentowych.”

— Databricks

Dwa Sposoby Korzystania z Gemini 3.5 Flash na Felo

Felo AI Search

Otwórz Felo AI Search i wybierz model Gemini 3.5 Flash. Zadawaj pytania, przeszukuj internet z AI i otrzymuj odpowiedzi z cytatami — zasilane najszybszym modelem frontier Google.

Otwórz Felo AI Search

Felo LLM Playground

Otwórz Felo LLM Playground, wybierz Gemini 3.5 Flash i zacznij rozmawiać. Porównuj wyniki wielu modeli obok siebie, by na własne oczy zobaczyć różnicę w prędkości i rozumowaniu.

Otwórz Playground

Często Zadawane Pytania

Wypróbuj Gemini 3.5 Flash Bezpłatnie — Już Teraz

Premiera na Google I/O 2026. Otwórz Felo AI i zacznij korzystać z najszybszego modelu frontier Google już dziś.

Otwórz Gemini 3.5 Flash na Felo

Bezpłatny dostęp — bez karty kredytowej