Официальный релиз · Запущена на Google I/O 2026 · 19 мая 2026 г.

Gemini 3.5 Flash — БесплатноАгентный ИИ уровня Pro на скорости Flash

Gemini 3.5 Flash — самая быстрая frontier-модель Google DeepMind, запущенная 19 мая 2026 года. Она обеспечивает глубину рассуждений уровня Pro с контекстным окном в 1M токенов и работает в 4× быстрее аналогичных frontier-моделей при менее чем половине стоимости — попробуйте бесплатно на Felo AI прямо сейчас.

Бесплатный доступ на Felo AI — банковская карта не нужна

81.2%
Оценка MMMU-Pro
№1 в мире по мультимодальному бенчмарку
$0.50
Цена входных токенов
$1,50 / 1M токенов через API
0.2s
Преимущество по скорости
В 4× быстрее аналогичных моделей
1M
Контекстное окно
Токенов в одном запросе

Чем Gemini 3.5 Flash отличается от других

Первая Flash-модель, превзошедшая собственную Pro-версию на агентных и кодовых бенчмарках — при сохранении скорости и стоимости уровня Flash.

Иконка скорости

Создана для агентных рабочих процессов

Gemini 3.5 Flash — самая мощная агентная и кодовая модель Google на сегодняшний день. Она надёжно выполняет долгосрочные задачи продолжительностью часы или недели, обрабатывает многошаговое использование инструментов и координирует субагентов через фреймворк Google Antigravity — делая крупномасштабные агентные системы экономически жизнеспособными.

Иконка мышления

Динамическое мышление — настраиваемая глубина рассуждений

Режим Thinking включён по умолчанию с новым параметром thinking_level (по умолчанию: medium). Gemini 3.5 Flash выполняет внутреннее многошаговое планирование перед ответом, обеспечивая глубину рассуждений, сопоставимую с флагманскими Pro-моделями в задачах математики, программирования и логики — с возможностью настройки глубины для каждого запроса.

Иконка контекста

Контекстное окно в 1M токенов

Загружайте целую кодовую базу, часы видео или годовой архив финансовых контрактов в одном запросе. Окно в 1M входных токенов в сочетании с 64K выходных токенов гарантирует полноту обработки сложных задач — ничего не обрезается. Оценка MRCR v2 по длинному контексту — 26,6%: лучший результат среди аналогичных моделей.

Иконка стоимости

В 4× быстрее при менее чем половине стоимости

Gemini 3.5 Flash работает в 4× быстрее аналогичных frontier-моделей при менее чем половине стоимости. При цене $1,50 за миллион входных токенов и кешировании контекста по $0,15/M круглосуточная работа ИИ-агентов становится практически реализуемой — не только технически возможной.

Новая граница Парето: Скорость × Интеллект

Годами быстрее означало менее способный. Gemini 3.5 Flash разрушает этот компромисс — он находится в правом верхнем углу кривой скорость-интеллект, опережая модели, которые стоят значительно дороже.

График «Интеллект vs Скорость», показывающий Gemini 3.5 Flash на границе Парето

Gemini 3.5 Flash возглавляет границу Парето «интеллект-скорость» среди frontier-моделей. Источник: Artificial Analysis, май 2026 г.

Сравнительные тесты производительности

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Официальные результаты модельной карты. Gemini 3.5 Flash лидирует в мультимодальном понимании, агентном использовании инструментов и извлечении данных из длинного контекста.

Бенчмарк
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

Источник: модельная карта Gemini 3.5 Flash — Google DeepMind, май 2026 г.

Технические характеристики

Всё, что нужно знать перед интеграцией Gemini 3.5 Flash в ваше приложение.

Контекстное окно

1 048 576 входных токенов
65 536 выходных токенов

Цены API

$1,50 / 1M входных токенов
$9,00 / 1M выходных токенов
$0,15 / 1M кешированных токенов

Общая доступность

19 мая 2026 г. — Google I/O

Дата среза знаний

Январь 2026 г.

Режим мышления

Включён по умолчанию. Настраивается через thinking_level: low / medium (по умолчанию) / high. Thought Preservation сохраняет рассуждения в ходе многоходовых диалогов.

Использование инструментов и API

Вызов функций, структурированный вывод, выполнение кода, заземление через Google Search, кеширование контекста — всё поддерживается нативно.

Входные модальности

Текст, изображения, аудио, видео, PDF — нативная мультимодальность, предобработка не требуется.

Нативная мультимодальность — одна модель для всех типов данных

Gemini 3.5 Flash нативно обрабатывает текст, изображения, аудио и видео — без отдельных пайплайнов и объединения нескольких моделей.

Текст и PDF

Обрабатывает документы объёмом в миллионы слов с высокой точностью. Справляется со сложными таблицами, кодом и структурированными данными за один проход.

Понимание изображений

Оценка MMMU-Pro — 83,6%: №1 в мире. Анализирует архитектурные чертежи, графики и детальный визуальный контент в реальном времени.

Анализ видео

Поддерживает до 1 часа видео на входе. Фиксирует ключевые изменения покадрово для создания резюме, ответов на вопросы и анализа контента.

Обработка аудио

Распознаёт эмоции, фоновые звуки и многоязычные разговоры. Обеспечивает перевод в реальном времени и работу голосовых ассистентов.

Доступна везде, где вы создаёте

Gemini 3.5 Flash глубоко интегрирована в экосистему разработчиков и потребителей Google — от доступа через API до модели по умолчанию, обслуживающей миллиарды пользователей.

Платформы для разработчиков

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

Потребительские продукты

  • Приложение Gemini — глобальная модель по умолчанию
  • Google Search AI Mode — модель по умолчанию
  • Gemini Spark — персональный ИИ-агент
  • Felo AI — бесплатный доступ через поиск и playground
График «Интеллект vs Стоимость», показывающий Gemini 3.5 Flash как наиболее выгодную frontier-модель

Gemini 3.5 Flash возглавляет границу «интеллект-стоимость». Менее половины стоимости аналогичных моделей при эквивалентной производительности задач. Источник: Artificial Analysis, май 2026 г.

Кто использует Gemini 3.5 Flash

От независимых разработчиков до корпоративных команд — Gemini 3.5 Flash подходит везде, где нужен быстрый и мощный ИИ в масштабе.

Агентное программирование

Оценка Terminal-Bench 2.1 — 76,2% при низкой задержке. Агенты кода выполняют задачи быстрее с меньшим числом логических пробелов — итеративная генерация кода, отладка и A/B-тестирование на скорости Flash.

Финансовая и налоговая обработка

Обрабатывайте годовой архив контрактов и выписок в одном запросе. Xero использует модель для обработки налоговых форм 1099; Ramp применяет её мультимодальный OCR для сложной обработки счетов-фактур.

Корпоративные агентные платформы

Salesforce интегрировала модель в Agentforce для ускорения развёртывания корпоративных агентов. Databricks использует её для мониторинга данных в реальном времени и автономной диагностики проблем.

Долгосрочные бизнес-задачи

Shopify использует модель для прогнозирования роста продавцов. Надёжно выполняет сложные рабочие процессы продолжительностью часы или недели — задачи, которые раньше требовали человеческого контроля на каждом шаге.

Мультимодальный анализ контента

Анализируйте видео, изображения и документы вместе в одном запросе. Оценка CharXiv Reasoning — 84,2%: точное извлечение инсайтов из сложных графиков и смешанного медиаконтента.

Потребительские ИИ-продукты

Теперь модель по умолчанию в приложении Gemini и режиме Google Search AI Mode — обслуживает миллиарды активных пользователей в месяц. Fast Mode обеспечивает практически мгновенные ответы на мобильных устройствах.

Отзывы команд

Производительность на длинных контекстах исключительна для обработки крупномасштабных неструктурированных мультимодальных датасетов.

Bridgewater Associates

Мы интегрировали Gemini 3.5 Flash в Agentforce для ускорения развёртывания корпоративных агентов — соотношение скорости и возможностей не имеет аналогов.

Salesforce

Gemini 3.5 Flash позволяет нам отслеживать информацию в реальном времени и автономно диагностировать проблемы в наших агентных рабочих процессах.

Databricks

Два способа использовать Gemini 3.5 Flash на Felo

Felo AI Search

Откройте Felo AI Search и выберите модель Gemini 3.5 Flash. Задавайте вопросы, ищите в интернете с помощью ИИ и получайте ответы с источниками — на базе самой быстрой frontier-модели Google.

Открыть Felo AI Search

Felo LLM Playground

Откройте Felo LLM Playground, выберите Gemini 3.5 Flash и начните общение. Сравнивайте ответы нескольких моделей бок о бок, чтобы лично убедиться в разнице скоростей и качества рассуждений.

Открыть Playground

Часто задаваемые вопросы

Попробуйте Gemini 3.5 Flash бесплатно — прямо сейчас

Запущена на Google I/O 2026. Откройте Felo AI и начните использовать самую быструю frontier-модель Google уже сегодня.

Открыть Gemini 3.5 Flash на Felo

Бесплатный доступ — банковская карта не нужна