Можно ли бесплатно попробовать Gemini 3.5 Flash на Felo AI?

Да. Felo AI предлагает бесплатный доступ к Gemini 3.5 Flash. Просто зарегистрируйте бесплатный аккаунт, чтобы начать — банковская карта не нужна.

Когда Gemini 3.5 Flash официально вышла?

Gemini 3.5 Flash официально запущена (GA) 19 мая 2026 года на Google I/O. Модель доступна через Gemini API, Google AI Studio и Felo AI.

Как Gemini 3.5 Flash соотносится с Gemini 3.1 Pro?

На агентных и кодовых бенчмарках Gemini 3.5 Flash фактически превосходит Gemini 3.1 Pro — например, MCP Atlas 83,6% против 78,2% и Terminal-Bench 2.1 76,2% против 70,3%. Работает в 4× быстрее при менее чем половине стоимости. Для задач чисто академических рассуждений Gemini 3.1 Pro сохраняет небольшое преимущество.

Что такое параметр thinking_level и как он работает?

Режим Thinking включён по умолчанию в Gemini 3.5 Flash. Новый параметр thinking_level (значения: low, medium, high) заменяет прежний thinking_budget, позволяя управлять глубиной рассуждений для каждого запроса. По умолчанию установлено medium — оптимальный баланс скорости и глубины для большинства задач.

Что такое Thought Preservation?

Thought Preservation автоматически сохраняет промежуточные рассуждения в ходе многоходовых диалогов. Это улучшает результаты на итеративных задачах — таких как отладка и рефакторинг кода, где важен контекст из предыдущих шагов рассуждения.

Какова стоимость Gemini 3.5 Flash через API?

Входные токены: $1,50 за миллион. Выходные токены: $9,00 за миллион. Кешированные входные токены: $0,15 за миллион. Кеширование контекста делает повторяющиеся задачи с длинным контекстом значительно более экономичными.

Замедляет ли контекстное окно в 1M токенов ответы?

Нет. Gemini 3.5 Flash использует с��ец��ализированные оптимизации потоковой передачи для длинных контекстов. Скорость ответа остаётся высокой даже при обработке объёмных документов или кодовых баз.

Что можно делать с Gemini 3.5 Flash на Felo?

Felo интегрирует Gemini 3.5 Flash в основные функции — ИИ-поиск, глубокие исследования и изучение тем доступны сразу из коробки. Вы также можете свободно использовать модель в Felo LLM Playground для общения, сравнения ответов или тестирования собственных промптов.

Официальный релиз · Запущена на Google I/O 2026 · 19 мая 2026 г.

Gemini 3.5 Flash — БесплатноАгентный ИИ уровня Pro на скорости Flash

Gemini 3.5 Flash — самая быстрая frontier-модель Google DeepMind, запущенная 19 мая 2026 года. Она обеспечивает глубину рассуждений уровня Pro с контекстным окном в 1M токенов и работает в 4× быстрее аналогичных frontier-моделей при менее чем половине стоимости — попробуйте бесплатно на Felo AI прямо сейчас.

Попробовать Gemini 3.5 Flash бесплатно

Бесплатный доступ на Felo AI — банковская карта не нужна

81.2%

Оценка MMMU-Pro

№1 в мире по мультимодальному бенчмарку

$0.50

Цена входных токенов

$1,50 / 1M токенов через API

0.2s

Преимущество по скорости

В 4× быстрее аналогичных моделей

Контекстное окно

Токенов в одном запросе

Чем Gemini 3.5 Flash отличается от других

Первая Flash-модель, превзошедшая собственную Pro-версию на агентных и кодовых бенчмарках — при сохранении скорости и стоимости уровня Flash.

Создана для агентных рабочих процессов

Gemini 3.5 Flash — самая мощная агентная и кодовая модель Google на сегодняшний день. Она надёжно выполняет долгосрочные задачи продолжительностью часы или недели, обрабатывает многошаговое использование инструментов и координирует субагентов через фреймворк Google Antigravity — делая крупномасштабные агентные системы экономически жизнеспособными.

Динамическое мышление — настраиваемая глубина рассуждений

Режим Thinking включён по умолчанию с новым параметром thinking_level (по умолчанию: medium). Gemini 3.5 Flash выполняет внутреннее многошаговое планирование перед ответом, обеспечивая глубину рассуждений, сопоставимую с флагманскими Pro-моделями в задачах математики, программирования и логики — с возможностью настройки глубины для каждого запроса.

Контекстное окно в 1M токенов

Загружайте целую кодовую базу, часы видео или годовой архив финансовых контрактов в одном запросе. Окно в 1M входных токенов в сочетании с 64K выходных токенов гарантирует полноту обработки сложных задач — ничего не обрезается. Оценка MRCR v2 по длинному контексту — 26,6%: лучший результат среди аналогичных моделей.

В 4× быстрее при менее чем половине стоимости

Gemini 3.5 Flash работает в 4× быстрее аналогичных frontier-моделей при менее чем половине стоимости. При цене $1,50 за миллион входных токенов и кешировании контекста по $0,15/M круглосуточная работа ИИ-агентов становится практически реализуемой — не только технически возможной.

Новая граница Парето: Скорость × Интеллект

Годами быстрее означало менее способный. Gemini 3.5 Flash разрушает этот компромисс — он находится в правом верхнем углу кривой скорость-интеллект, опережая модели, которые стоят значительно дороже.

График «Интеллект vs Скорость», показывающий Gemini 3.5 Flash на границе Парето

Gemini 3.5 Flash возглавляет границу Парето «интеллект-скорость» среди frontier-моделей. Источник: Artificial Analysis, май 2026 г.

Сравнительные тесты производительности

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

Официальные результаты модельной карты. Gemini 3.5 Flash лидирует в мультимодальном понимании, агентном использовании инструментов и извлечении данных из длинного контекста.

Бенчмарк

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

Источник: модельная карта Gemini 3.5 Flash — Google DeepMind, май 2026 г.

Технические характеристики

Всё, что нужно знать перед интеграцией Gemini 3.5 Flash в ваше приложение.

Контекстное окно

1 048 576 входных токенов

65 536 выходных токенов

Цены API

$1,50 / 1M входных токенов

$9,00 / 1M выходных токенов

$0,15 / 1M кешированных токенов

Общая доступность

19 мая 2026 г. — Google I/O

Дата среза знаний

Январь 2026 г.

Режим мышления

Включён по умолчанию. Настраивается через thinking_level: low / medium (по умолчанию) / high. Thought Preservation сохраняет рассуждения в ходе многоходовых диалогов.

Использование инструментов и API

Вызов функций, структурированный вывод, выполнение кода, заземление через Google Search, кеширование контекста — всё поддерживается нативно.

Входные модальности

Текст, изображения, аудио, видео, PDF — нативная мультимодальность, предобработка не требуется.

Нативная мультимодальность — одна модель для всех типов данных

Gemini 3.5 Flash нативно обрабатывает текст, изображения, аудио и видео — без отдельных пайплайнов и объединения нескольких моделей.

Текст и PDF

Обрабатывает документы объёмом в миллионы слов с высокой точностью. Справляется со сложными таблицами, кодом и структурированными данными за один проход.

Понимание изображений

Оценка MMMU-Pro — 83,6%: №1 в мире. Анализирует архитектурные чертежи, графики и детальный визуальный контент в реальном времени.

Анализ видео

Поддерживает до 1 часа видео на входе. Фиксирует ключевые изменения покадрово для создания резюме, ответов на вопросы и анализа контента.

Обработка аудио

Распознаёт эмоции, фоновые звуки и многоязычные разговоры. Обеспечивает перевод в реальном времени и работу голосовых ассистентов.

Доступна везде, где вы создаёте

Gemini 3.5 Flash глубоко интегрирована в экосистему разработчиков и потребителей Google — от доступа через API до модели по умолчанию, обслуживающей миллиарды пользователей.

Платформы для разработчиков

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

Потребительские продукты

Приложение Gemini — глобальная модель по умолчанию
Google Search AI Mode — модель по умолчанию
Gemini Spark — персональный ИИ-агент
Felo AI — бесплатный доступ через поиск и playground

График «Интеллект vs Стоимость», показывающий Gemini 3.5 Flash как наиболее выгодную frontier-модель

Gemini 3.5 Flash возглавляет границу «интеллект-стоимость». Менее половины стоимости аналогичных моделей при эквивалентной производительности задач. Источник: Artificial Analysis, май 2026 г.

Кто использует Gemini 3.5 Flash

От независимых разработчиков до корпоративных команд — Gemini 3.5 Flash подходит везде, где нужен быстрый и мощный ИИ в масштабе.

Агентное программирование

Оценка Terminal-Bench 2.1 — 76,2% при низкой задержке. Агенты кода выполняют задачи быстрее с меньшим числом логических пробелов — итеративная генерация кода, отладка и A/B-тестирование на скорости Flash.

Финансовая и налоговая обработка

Обрабатывайте годовой архив контрактов и выписок в одном запросе. Xero использует модель для обработки налоговых форм 1099; Ramp применяет её мультимодальный OCR для сложной обработки счетов-фактур.

Корпоративные агентные платформы

Salesforce интегрировала модель в Agentforce для ускорения развёртывания корпоративных агентов. Databricks использует её для мониторинга данных в реальном времени и автономной диагностики проблем.

Долгосрочные бизнес-задачи

Shopify использует модель для прогнозирования роста продавцов. Надёжно выполняет сложные рабочие процессы продолжительностью часы или недели — задачи, которые раньше требовали человеческого контроля на каждом шаге.

Мультимодальный анализ контента

Анализируйте видео, изображения и документы вместе в одном запросе. Оценка CharXiv Reasoning — 84,2%: точное извлечение инсайтов из сложных графиков и смешанного медиаконтента.

Потребительские ИИ-продукты

Теперь модель по умолчанию в приложении Gemini и режиме Google Search AI Mode — обслуживает миллиарды активных пользователей в месяц. Fast Mode обеспечивает практически мгновенные ответы на мобильных устройствах.

Отзывы команд

“Производительность на длинных контекстах исключительна для обработки крупномасштабных неструктурированных мультимодальных датасетов.”

— Bridgewater Associates

“Мы интегрировали Gemini 3.5 Flash в Agentforce для ускорения развёртывания корпоративных агентов — соотношение скорости и возможностей не имеет аналогов.”

— Salesforce

“Gemini 3.5 Flash позволяет нам отслеживать информацию в реальном времени и автономно диагностировать проблемы в наших агентных рабочих процессах.”

— Databricks

Два способа использовать Gemini 3.5 Flash на Felo

Felo AI Search

Откройте Felo AI Search и выберите модель Gemini 3.5 Flash. Задавайте вопросы, ищите в интернете с помощью ИИ и получайте ответы с источниками — на базе самой быстрой frontier-модели Google.

Открыть Felo AI Search

Felo LLM Playground

Откройте Felo LLM Playground, выберите Gemini 3.5 Flash и начните общение. Сравнивайте ответы нескольких моделей бок о бок, чтобы лично убедиться в разнице скоростей и качества рассуждений.

Открыть Playground

Часто задаваемые вопросы

Попробуйте Gemini 3.5 Flash бесплатно — прямо сейчас

Запущена на Google I/O 2026. Откройте Felo AI и начните использовать самую быструю frontier-модель Google уже сегодня.

Открыть Gemini 3.5 Flash на Felo

Бесплатный доступ — банковская карта не нужна