Вже доступна · Представлена на Google I/O 2026 · 19 травня 2026

Gemini 3.5 Flash — БезкоштовноАгентний AI Рівня Pro зі Швидкістю Flash

Gemini 3.5 Flash — найшвидша frontier-модель Google DeepMind, представлена 19 травня 2026 року. Вона забезпечує глибину міркувань рівня Pro з вікном контексту 1M токенів і працює у 4 рази швидше за аналогічні frontier-моделі за менш ніж половину вартості — спробуйте безкоштовно на Felo AI прямо зараз.

Безкоштовний доступ на Felo AI — банківська картка не потрібна

81.2%
Оцінка MMMU-Pro
Глобальний мультимодальний бенчмарк №1
$0.50
Вхідна Ціна
$1,50 / 1M токенів через API
0.2s
Перевага у Швидкості
У 4 рази швидше за аналогічні моделі
1M
Вікно Контексту
Токени в одному запиті

Чим Відрізняється Gemini 3.5 Flash

Перша модель Flash, що перевершила свого попередника Pro в агентних і кодових бенчмарках — зберігаючи при цьому швидкість і вартість рівня Flash.

Іконка швидкості

Створена для Агентних Робочих Процесів

Gemini 3.5 Flash — найпотужніша агентна та кодова модель Google на сьогодні. Вона надійно виконує тривалі завдання тривалістю годинами або тижнями, обробляє багатоетапне використання інструментів і координує субагентів через фреймворк Google Antigravity — роблячи великомасштабні агентні системи економічно доцільними.

Іконка мислення

Динамічне Мислення — Налаштовувана Глибина Міркувань

Мислення увімкнено за замовчуванням із новим параметром thinking_level (за замовчуванням: medium). Gemini 3.5 Flash виконує внутрішнє багатоетапне планування перед відповіддю, забезпечуючи глибину міркувань, що змагається з флагманськими моделями Pro у задачах математики, програмування та логіки — з можливістю налаштування глибини для кожного запиту.

Іконка контексту

Вікно Контексту 1M Токенів

Завантажте цілу кодову базу, години відео або річний архів фінансових контрактів в одному запиті. Вікно вхідних даних 1M токенів у поєднанні з 64K вихідних токенів означає, що складні завдання залишаються повними — нічого не обрізається. Оцінка MRCR v2 для довгого контексту — 26,6%, що є найкращим результатом серед аналогічних моделей.

Іконка вартості

У 4 Рази Швидше, Менш ніж Половина Вартості

Gemini 3.5 Flash працює у 4 рази швидше за аналогічні frontier-моделі за менш ніж половину вартості. За $1,50 за мільйон вхідних токенів із кешуванням контексту за $0,15/M цілодобова робота AI-агентів стає практично реалізованою — не лише технічно можливою.

Нова Межа Парето: Швидкість × Інтелект

Роками швидше означало менш здатне. Gemini 3.5 Flash руйнує цей компроміс — він знаходиться у правому верхньому куті кривої швидкість-інтелект, випереджаючи моделі, що коштують значно більше.

Графік інтелекту проти швидкості, що показує Gemini 3.5 Flash на межі Парето

Gemini 3.5 Flash очолює межу Парето інтелект-швидкість серед frontier-моделей. Джерело: Artificial Analysis, травень 2026.

Бенчмарки Продуктивності

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Офіційні результати картки моделі. Gemini 3.5 Flash лідирує в мультимодальному розумінні, агентному використанні інструментів і пошуку в довгому контексті.

Бенчмарк
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Джерело: картка моделі Gemini 3.5 Flash — Google DeepMind, травень 2026.

Технічні Характеристики

Все, що вам потрібно знати перед інтеграцією Gemini 3.5 Flash у ваш застосунок.

Вікно Контексту

1 048 576 токенів вхідних даних
65 536 токенів вихідних даних

Ціни API

$1,50 / 1M вхідних токенів
$9,00 / 1M вихідних токенів
$0,15 / 1M кешованих токенів

Загальна Доступність

19 травня 2026 — Google I/O

Дата Зрізу Знань

Січень 2026

Режим Мислення

Увімкнено за замовчуванням. Налаштовується через thinking_level: low / medium (за замовчуванням) / high. Thought Preservation зберігає міркування в багатоходових розмовах.

Використання Інструментів і API

Виклик функцій, структурований вивід, виконання коду, Google Search grounding, кешування контексту — все підтримується нативно.

Вхідні Модальності

Текст, ��ображення, аудіо, відео, PDF — нативна мультимодальність, попередня обробка не потрібна.

Нативна Мультимодальність — Одна Модель, Будь-який Тип Вхідних Даних

Gemini 3.5 Flash обробляє текст, зображення, аудіо та відео нативно — без окремих конвеєрів, без об'єднання кількох моделей.

Текст і PDF

Аналізує документи обсягом мільйон слів із високою точністю. Обробляє складні таблиці, код і структуровані дані за один прохід.

Розуміння Зображень

Оцінка MMMU-Pro — 83,6%: глобальний №1. Аналізує архітектурні креслення, графіки та детальний візуальний контент у реальному часі.

Аналіз Відео

Підтримує до 1 години відеовхідних даних. Фіксує ключові зміни кадр за кадром для резюмування, запитань і відповідей та аналізу контенту.

Обробка Аудіо

Розпізнає емоції, фонові звуки та багатомовні розмови. Забезпечує переклад у реальному часі та роботу голосових асистентів.

Доступна Скрізь, Де Ви Будуєте

Gemini 3.5 Flash глибоко інтегрована в екосистему розробників і споживачів Google — від доступу через API до моделі за замовчуванням, що обслуговує мільярди користувачів.

Платформи для Розробників

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Споживчі Продукти

  • Застосунок Gemini — глобальна модель за замовчуванням
  • Google Search AI Mode — модель за замовчуванням
  • Gemini Spark — персональний AI-агент
  • Felo AI — безкоштовний доступ через пошук і playground
Графік інтелекту проти вартості, що показує Gemini 3.5 Flash як найвигіднішу frontier-модель

Gemini 3.5 Flash очолює межу інтелект-вартість. Менш ніж половина вартості аналогічних моделей за еквівалентну продуктивність завдань. Джерело: Artificial Analysis, травень 2026.

Хто Використовує Gemini 3.5 Flash

Від індивідуальних розробників до корпоративних команд — Gemini 3.5 Flash підходить скрізь, де потрібен швидкий і потужний AI у масштабі.

Агентне Програмування

Оцінка Terminal-Bench 2.1 — 76,2% при низькій затримці. Агенти програмування виконують завдання швидше з меншою кількістю логічних прогалин — ітеративна генерація коду, налагодження та A/B-тестування зі швидкістю Flash.

Фінансова та Податкова Обробка

Обробляйте повний річний архів контрактів і звітів в одному запиті. Xero використовує його для обробки форм 1099; Ramp застосовує мультимодальний OCR для складної обробки рахунків-фактур.

Корпоративні Агентні Платформи

Salesforce інтегрує його в Agentforce для прискорення розгортання корпоративних агентів. Databricks використовує його для моніторингу даних у реальному часі та автономної діагностики проблем.

Тривалі Бізнес-Завдання

Shopify використовує його для прогнозування зростання продавців. Надійно виконує складні робочі процеси тривалістю годинами або тижнями — завдання, які раніше вимагали людського контролю на кожному кроці.

Мультимодальний Аналіз Контенту

Аналізуйте відео, зображення та документи разом в одному запиті. Оцінка CharXiv Reasoning — 84,2%, що означає точне вилучення інсайтів із складних графіків і змішаного медіаконтенту.

Споживчі AI-Продукти

Тепер є моделлю за замовчуванням у застосунку Gemini та режимі AI Google Search — обслуговує мільярди активних користувачів щомісяця. Швидкий режим забезпечує майже миттєві відповіді на мобільних пристроях.

Що Кажуть Команди

Продуктивність на довгих контекстах є винятковою для обробки великомасштабних неструктурованих мультимодальних наборів даних.

Bridgewater Associates

Ми інтегрували Gemini 3.5 Flash в Agentforce для прискорення розгортання корпоративних агентів — співвідношення швидкості та можливостей є унікальним.

Salesforce

Gemini 3.5 Flash дозволяє нам моніторити інформацію в реальному часі та автономно діагностувати проблеми в наших агентних робочих процесах.

Databricks

Два Способи Використання Gemini 3.5 Flash на Felo

Felo AI Search

Відкрийте Felo AI Search і виберіть модель Gemini 3.5 Flash. Ставте запитання, шукайте в інтернеті з AI та отримуйте відповіді з посиланнями — на основі найшвидшої frontier-моделі Google.

Відкрити Felo AI Search

Felo LLM Playground

Відкрийте Felo LLM Playground, виберіть Gemini 3.5 Flash і почніть спілкуватися. Порівнюйте результати кількох моделей поруч, щоб особисто переконатися в різниці швидкості та якості міркувань.

Відкрити Playground

Часті Запитання

Спробуйте Gemini 3.5 Flash Безкоштовно — Прямо Зараз

Представлена на Google I/O 2026. Відкрийте Felo AI і почніть користуватися найшвидшою frontier-моделлю Google вже сьогодні.

Відкрити Gemini 3.5 Flash на Felo

Безкоштовний доступ — банківська картка не потрібна