Gemini 3.5 Flash — БесплатноАгентный ИИ уровня Pro на скорости Flash
Gemini 3.5 Flash — самая быстрая frontier-модель Google DeepMind, запущенная 19 мая 2026 года. Она обеспечивает глубину рассуждений уровня Pro с контекстным окном в 1M токенов и работает в 4× быстрее аналогичных frontier-моделей при менее чем половине стоимости — попробуйте бесплатно на Felo AI прямо сейчас.
Бесплатный доступ на Felo AI — банковская карта не нужна
Чем Gemini 3.5 Flash отличается от других
Первая Flash-модель, превзошедшая собственную Pro-версию на агентных и кодовых бенчмарках — при сохранении скорости и стоимости уровня Flash.
Создана для агентных рабочих процессов
Gemini 3.5 Flash — самая мощная агентная и кодовая модель Google на сегодняшний день. Она надёжно выполняет долгосрочные задачи продолжительностью часы или недели, обрабатывает многошаговое использование инструментов и координирует субагентов через фреймворк Google Antigravity — делая крупномасштабные агентные системы экономически жизнеспособными.
Динамическое мышление — настраиваемая глубина рассуждений
Режим Thinking включён по умолчанию с новым параметром thinking_level (по умолчанию: medium). Gemini 3.5 Flash выполняет внутреннее многошаговое планирование перед ответом, обеспечивая глубину рассуждений, сопоставимую с флагманскими Pro-моделями в задачах математики, программирования и логики — с возможностью настройки глубины для каждого запроса.
Контекстное окно в 1M токенов
Загружайте целую кодовую базу, часы видео или годовой архив финансовых контрактов в одном запросе. Окно в 1M входных токенов в сочетании с 64K выходных токенов гарантирует полноту обработки сложных задач — ничего не обрезается. Оценка MRCR v2 по длинному контексту — 26,6%: лучший результат среди аналогичных моделей.
В 4× быстрее при менее чем половине стоимости
Gemini 3.5 Flash работает в 4× быстрее аналогичных frontier-моделей при менее чем половине стоимости. При цене $1,50 за миллион входных токенов и кешировании контекста по $0,15/M круглосуточная работа ИИ-агентов становится практически реализуемой — не только технически возможной.
Новая граница Парето: Скорость × Интеллект
Годами быстрее означало менее способный. Gemini 3.5 Flash разрушает этот компромисс — он находится в правом верхнем углу кривой скорость-интеллект, опережая модели, которые стоят значительно дороже.

Gemini 3.5 Flash возглавляет границу Парето «интеллект-скорость» среди frontier-моделей. Источник: Artificial Analysis, май 2026 г.
Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5
Официальные результаты модельной карты. Gemini 3.5 Flash лидирует в мультимодальном понимании, агентном использовании инструментов и извлечении данных из длинного контекста.
Источник: модельная карта Gemini 3.5 Flash — Google DeepMind, май 2026 г.
Технические характеристики
Всё, что нужно знать перед интеграцией Gemini 3.5 Flash в ваше приложение.
Контекстное окно
Цены API
Общая доступность
19 мая 2026 г. — Google I/O
Дата среза знаний
Январь 2026 г.
Режим мышления
Включён по умолчанию. Настраивается через thinking_level: low / medium (по умолчанию) / high. Thought Preservation сохраняет рассуждения в ходе многоходовых диалогов.
Использование инструментов и API
Вызов функций, структурированный вывод, выполнение кода, заземление через Google Search, кеширование контекста — всё поддерживается нативно.
Входные модальности
Текст, изображения, аудио, видео, PDF — нативная мультимодальность, предобработка не требуется.
Нативная мультимодальность — одна модель для всех типов данных
Gemini 3.5 Flash нативно обрабатывает текст, изображения, аудио и видео — без отдельных пайплайнов и объединения нескольких моделей.
Текст и PDF
Обрабатывает документы объёмом в миллионы слов с высокой точностью. Справляется со сложными таблицами, кодом и структурированными данными за один проход.
Понимание изображений
Оценка MMMU-Pro — 83,6%: №1 в мире. Анализирует архитектурные чертежи, графики и детальный визуальный контент в реальном времени.
Анализ видео
Поддерживает до 1 часа видео на входе. Фиксирует ключевые изменения покадрово для создания резюме, ответов на вопросы и анализа контента.
Обработка аудио
Распознаёт эмоции, фоновые звуки и многоязычные разговоры. Обеспечивает перевод в реальном времени и работу голосовых ассистентов.
Доступна везде, где вы создаёте
Gemini 3.5 Flash глубоко интегрирована в экосистему разработчиков и потребителей Google — от доступа через API до модели по умолчанию, обслуживающей миллиарды пользователей.
Платформы для разработчиков
- Gemini API
- Google AI Studio
- Android Studio
- Google Antigravity
- Gemini Enterprise Agent Platform (Vertex AI)
Потребительские продукты
- Приложение Gemini — глобальная модель по умолчанию
- Google Search AI Mode — модель по умолчанию
- Gemini Spark — персональный ИИ-агент
- Felo AI — бесплатный доступ через поиск и playground

Gemini 3.5 Flash возглавляет границу «интеллект-стоимость». Менее половины стоимости аналогичных моделей при эквивалентной производительности задач. Источник: Artificial Analysis, май 2026 г.
Кто использует Gemini 3.5 Flash
От независимых разработчиков до корпоративных команд — Gemini 3.5 Flash подходит везде, где нужен быстрый и мощный ИИ в масштабе.

Агентное программирование
Оценка Terminal-Bench 2.1 — 76,2% при низкой задержке. Агенты кода выполняют задачи быстрее с меньшим числом логических пробелов — итеративная генерация кода, отладка и A/B-тестирование на скорости Flash.

Финансовая и налоговая обработка
Обрабатывайте годовой архив контрактов и выписок в одном запросе. Xero использует модель для обработки налоговых форм 1099; Ramp применяет её мультимодальный OCR для сложной обработки счетов-фактур.

Корпоративные агентные платформы
Salesforce интегрировала модель в Agentforce для ускорения развёртывания корпоративных агентов. Databricks использует её для мониторинга данных в реальном времени и автономной диагностики проблем.

Долгосрочные бизнес-задачи
Shopify использует модель для прогнозирования роста продавцов. Надёжно выполняет сложные рабочие процессы продолжительностью часы или недели — задачи, которые раньше требовали человеческого контроля на каждом шаге.

Мультимодальный анализ контента
Анализируйте видео, изображения и документы вместе в одном запросе. Оценка CharXiv Reasoning — 84,2%: точное извлечение инсайтов из сложных графиков и смешанного медиаконтента.

Потребительские ИИ-продукты
Теперь модель по умолчанию в приложении Gemini и режиме Google Search AI Mode — обслуживает миллиарды активных пользователей в месяц. Fast Mode обеспечивает практически мгновенные ответы на мобильных устройствах.
Отзывы команд
“Производительность на длинных контекстах исключительна для обработки крупномасштабных неструктурированных мультимодальных датасетов.”
— Bridgewater Associates
“Мы интегрировали Gemini 3.5 Flash в Agentforce для ускорения развёртывания корпоративных агентов — соотношение скорости и возможностей не имеет аналогов.”
— Salesforce
“Gemini 3.5 Flash позволяет нам отслеживать информацию в реальном времени и автономно диагностировать проблемы в наших агентных рабочих процессах.”
— Databricks
Два способа использовать Gemini 3.5 Flash на Felo
Felo AI Search
Откройте Felo AI Search и выберите модель Gemini 3.5 Flash. Задавайте вопросы, ищите в интернете с помощью ИИ и получайте ответы с источниками — на базе самой быстрой frontier-модели Google.
Открыть Felo AI SearchFelo LLM Playground
Откройте Felo LLM Playground, выберите Gemini 3.5 Flash и начните общение. Сравнивайте ответы нескольких моделей бок о бок, чтобы лично убедиться в разнице скоростей и качества рассуждений.
Открыть PlaygroundЧасто задаваемые вопросы
Попробуйте Gemini 3.5 Flash бесплатно — прямо сейчас
Запущена на Google I/O 2026. Откройте Felo AI и начните использовать самую быструю frontier-модель Google уже сегодня.
Открыть Gemini 3.5 Flash на FeloБесплатный доступ — банковская карта не нужна