정식 출시 · Google I/O 2026 · 2026년 5월 19일

Gemini 3.5 Flash — 무료로 사용플래시 속도로 Pro급 에이전트 AI를

Gemini 3.5 Flash는 2026년 5월 19일 출시된 Google DeepMind의 가장 빠른 프론티어 모델입니다. Pro급 추론 깊이와 100만 토큰 컨텍스트 윈도우를 갖추고, 동급 프론티어 모델 대비 4배 빠른 속도로 절반 이하의 비용에 구동됩니다 — 지금 바로 Felo AI에서 무료로 체험해 보세요.

Felo AI에서 무료 이용 — 신용카드 불필요

81.2%
MMMU-Pro 점수
멀티모달 벤치마크 글로벌 1위
$0.50
입력 가격
API 기준 100만 토큰당 $1.50
0.2s
속도 우위
동급 모델 대비 4배 빠름
1M
컨텍스트 윈도우
단일 요청당 토큰 수

Gemini 3.5 Flash가 다른 이유

에이전트 및 코딩 벤치마크에서 자체 Pro 전작을 처음으로 능가한 Flash 모델 — Flash 수준의 속도와 비용은 그대로 유지합니다.

속도 아이콘

에이전트 워크플로우를 위해 설계

Gemini 3.5 Flash는 Google의 역대 가장 강력한 에이전트 및 코딩 모델입니다. 수 시간 또는 수 주에 걸친 장기 작업을 안정적으로 수행하고, 다단계 도구 사용을 처리하며, Google의 Antigravity 프레임워크를 통해 서브 에이전트를 조율합니다 — 대규모 에이전트 시스템을 경제적으로 실현 가능하게 만듭니다.

사고 아이콘

동적 사고 — 설정 가능한 추론 깊이

사고 기능이 기본으로 활성화되며, 새로운 thinking_level 파라미터(기본값: medium)가 도입되었습니다. Gemini 3.5 Flash는 응답 전 내부적으로 다단계 계획을 수립하여 수학, 코딩, 논리 과제에서 플래그십 Pro 모델에 필적하는 추론 깊이를 발휘하며, 요청별로 깊이를 조절할 수 있습니다.

컨텍스트 아이콘

100만 토큰 컨텍스트 윈도우

전체 코드베이스, 수 시간 분량의 동영상, 1년치 금융 계약서를 단일 요청으로 처리할 수 있습니다. 100만 입력 토큰과 6.4만 출력 토큰의 조합으로 복잡한 작업도 잘리지 않고 완전하게 처리됩니다. MRCR v2 장문 컨텍스트 점수 26.6%로 동급 모델 중 1위입니다.

비용 아이콘

4배 빠르고, 절반 이하의 비용

Gemini 3.5 Flash는 동급 프론티어 모델 대비 4배 빠른 속도로 절반 이하의 비용에 구동됩니다. 100만 입력 토큰당 $1.50, 컨텍스트 캐싱 시 $0.15/M으로 AI 에이전트를 24시간 운영하는 것이 기술적으로 가능할 뿐만 아니라 현실적인 선택이 됩니다.

새로운 파레토 프론티어: 속도 × 지능

오랫동안 빠를수록 성능이 낮다는 공식이 통했습니다. Gemini 3.5 Flash는 그 트레이드오프를 깨뜨립니다 — 훨씬 비싼 모델들을 능가하면서 속도-지능 곡선의 최상단에 위치합니다.

Gemini 3.5 Flash가 파레토 프론티어에 위치한 지능 대 속도 차트

Gemini 3.5 Flash는 프론티어 모델 중 지능-속도 파레토 프론티어를 선도합니다. 출처: Artificial Analysis, 2026년 5월.

성능 벤치마크

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

공식 모델 카드 결과. Gemini 3.5 Flash는 멀티모달 이해, 에이전트 도구 사용, 장문 컨텍스트 검색에서 앞서 있습니다.

벤치마크
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

출처: Gemini 3.5 Flash 모델 카드 — Google DeepMind, 2026년 5월.

기술 사양

Gemini 3.5 Flash를 애플리케이션에 통합하기 전에 알아야 할 모든 정보입니다.

컨텍스트 윈도우

입력 1,048,576 토큰
출력 65,536 토큰

API 가격

입력 100만 토큰당 $1.50
출력 100만 토큰당 $9.00
캐시 100만 토큰당 $0.15

정식 출시

2026년 5월 19일 — Google I/O

지식 기준일

2026년 1월

사고 모드

기본으로 활성화. thinking_level: low / medium(기본값) / high로 설정 가능. Thought Preservation이 다중 턴 대화에서 추론 과정을 유지합니다.

도구 사용 및 API

함수 호출, 구조화된 출력, 코드 실행, Google 검색 그라운딩, 컨텍스트 캐싱 — 모두 네이티브로 지원됩니다.

입력 모달리티

텍스트, 이미지, 오디오, 동영상, PDF — 네이티브 멀티모달, 전처리 불필요.

네이티브 멀티모달 — 하나의 모델로 모든 입력 유형 처리

Gemini 3.5 Flash는 텍스트, 이미지, 오디오, 동영상을 네이티브로 처리합니다 — 별도 파이프라인이나 여러 모델을 연결할 필요가 없습니다.

텍스트 및 PDF

수백만 단어 문서를 높은 정확도로 파싱. 복잡한 표, 코드, 구조화된 데이터를 단일 패스로 처리.

이미지 이해

MMMU-Pro 점수 83.6% — 글로벌 1위. 건축 도면, 차트, 상세한 시각 콘텐츠를 실시간으로 분석.

동영상 분석

최대 1시간 분량의 동영상 입력을 지원. 요약, QA, 콘텐츠 분석을 위해 프레임별 주요 변화를 포착.

오디오 처리

감정, 주변 소리, 다국어 대화를 인식. 실시간 번역과 음성 어시스턴트를 지원.

어디서든 개발 가능

Gemini 3.5 Flash는 Google의 개발자 및 소비자 생태계 전반에 깊이 통합되어 있습니다 — API 접근부터 수십억 사용자를 지원하는 기본 모델까지.

개발자 플랫폼

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

소비자 제품

  • Gemini 앱 — 글로벌 기본 모델
  • Google 검색 AI 모드 — 기본 모델
  • Gemini Spark — 개인 AI 에이전트
  • Felo AI — 검색 및 플레이그라운드를 통한 무료 이용
Gemini 3.5 Flash가 최고의 가성비 프론티어 모델임을 보여주는 지능 대 비용 차트

Gemini 3.5 Flash는 지능-비용 프론티어를 선도합니다. 동급 모델 대비 절반 이하의 비용으로 동등한 작업 성능을 제공합니다. 출처: Artificial Analysis, 2026년 5월.

Gemini 3.5 Flash 활용 분야

개인 개발자부터 기업 팀까지, 대규모로 빠르고 강력한 AI가 필요한 모든 곳에 Gemini 3.5 Flash가 적합합니다.

에이전트 코딩

Terminal-Bench 2.1 점수 76.2%와 저지연의 조합으로 코딩 에이전트가 더 빠르고 논리적 오류 없이 작업을 완료 — 반복적인 코드 생성, 디버깅, A/B 테스트를 Flash 속도로 처리.

재무 및 세무 처리

1년치 계약서와 재무제표를 단일 요청으로 처리. Xero는 1099 세금 양식 처리에, Ramp는 복잡한 인보이스 처리를 위한 멀티모달 OCR에 활용합니다.

기업 에이전트 플랫폼

Salesforce는 Agentforce에 통합하여 기업 에이전트 배포를 가속화합니다. Databricks는 실시간 데이터 모니터링과 자율적인 문제 진단에 활용합니다.

장기 비즈니스 작업

Shopify는 판매자 성장 예측에 활용합니다. 수 시간 또는 수 주에 걸친 복잡한 워크플로우를 안정적으로 수행 — 이전에는 매 단계마다 사람의 감독이 필요했던 작업들입니다.

멀티모달 콘텐츠 분석

동영상, 이미지, 문서를 단일 요청으로 함께 분석. CharXiv Reasoning 점수 84.2%로 복잡한 차트와 혼합 미디어 콘텐츠에서 정확하게 인사이트를 추출.

소비자 AI 제품

현재 Gemini 앱과 Google 검색 AI 모드의 기본 모델로 월간 수십억 명의 활성 사용자에게 서비스 중. 빠른 모드로 모바일에서도 거의 즉각적인 응답을 제공.

도입 팀의 이야기

대규모 비정형 멀티모달 데이터셋 처리에서 장문 컨텍스트 성능이 탁월합니다.

Bridgewater Associates

Gemini 3.5 Flash를 Agentforce에 통합하여 기업 에이전트 배포를 가속화했습니다 — 속도 대비 성능 비율은 지금까지 본 것 중 가장 뛰어납니다.

Salesforce

Gemini 3.5 Flash 덕분에 에이전트 워크플로우에서 실시간 정보를 모니터링하고 문제를 자율적으로 진단할 수 있게 되었습니다.

Databricks

Felo에서 Gemini 3.5 Flash를 사용하는 두 가지 방법

Felo AI 검색

Felo AI 검색을 열고 Gemini 3.5 Flash 모델을 선택하세요. 질문하고, AI로 웹을 검색하고, 출처가 인용된 답변을 받아보세요 — Google의 가장 빠른 프론티어 모델이 지원합니다.

Felo AI 검색 열기

Felo LLM Playground

Felo LLM Playground를 열고 Gemini 3.5 Flash를 선택해 대화를 시작하세요. 여러 모델의 출력을 나란히 비교하며 속도와 추론 차이를 직접 확인해 보세요.

플레이그라운드 열기

자주 묻는 질문

지금 바로 Gemini 3.5 Flash를 무료로 체험하세요

Google I/O 2026에서 출시. Felo AI를 열고 Google의 가장 빠른 프론티어 모델을 오늘 바로 사용해 보세요.

Felo에서 Gemini 3.5 Flash 열기

무료 이용 — 신용카드 불필요