Felo AI에서 Gemini 3.5 Flash를 무료로 체험할 수 있나요?

네. Felo AI는 Gemini 3.5 Flash 무료 체험을 제공합니다. 무료 계정을 등록하면 바로 시작할 수 있으며, 신용카드는 필요하지 않습니다.

Gemini 3.5 Flash는 언제 공식 출시되었나요?

Gemini 3.5 Flash는 2026년 5월 19일 Google I/O에서 정식(GA) 출시되었습니다. 현재 Gemini API, Google AI Studio, Felo AI를 통해 이용 가능합니다.

Gemini 3.5 Flash와 Gemini 3.1 Pro를 비교하면 어떤가요?

에이전트 및 코딩 벤치마크에서 Gemini 3.5 Flash는 실제로 Gemini 3.1 Pro를 능가합니다 — 예를 들어 MCP Atlas 83.6% 대 78.2%, Terminal-Bench 2.1 76.2% 대 70.3%입니다. 동급 모델 대비 4배 빠른 속도로 절반 이하의 비용에 구동됩니다. 순수 학술적 추론 과제에서는 Gemini 3.1 Pro가 여전히 약간의 우위를 유지합니다.

thinking_level 파라미터란 무엇이며 어떻게 작동하나요?

Gemini 3.5 Flash에서는 사고 기능이 기본으로 활성화됩니다. 새로운 thinking_level 파라미터(값: low, medium, high)가 기존의 thinking_budget을 대체하여 요청별로 추론 깊이를 조절할 수 있습니다. 기본값은 medium으로, 대부분의 작업에서 속도와 깊이의 균형을 맞춥니다.

Thought Preservation이란 무엇인가요?

Thought Preservation은 다중 턴 대화에서 중간 추론 과정을 자동으로 유지하는 기능입니다. 이전 추론 단계의 컨텍스트가 중요한 디버깅, 코드 리팩토링 등 반복적인 작업에서 성능을 향상시킵니다.

API를 통한 Gemini 3.5 Flash의 가격은 어떻게 되나요?

입력: 100만 토큰당 $1.50. 출력: 100만 토큰당 $9.00. 캐시된 입력: 100만 토큰당 $0.15. 컨텍스트 캐싱을 통해 반복적인 장문 컨텍스트 작업의 비용 효율성이 크게 향상됩니다.

100만 토큰 컨텍스트 윈도우가 응답 속도를 느리게 하지 않나요?

아닙니다. Gemini 3.5 Flash는 장문 컨텍스트 입력을 위한 전용 스트리밍 최적화를 사용합니다. 대용량 문서나 코드베이스를 처리할 때도 응답 속도는 빠르게 유지됩니다.

Felo에서 Gemini 3.5 Flash로 무엇을 할 수 있나요?

Felo는 Gemini 3.5 Flash를 핵심 기능 전반에 통합했습니다 — AI 검색, 심층 리서치, 주제 탐색 등을 바로 사용할 수 있습니다. Felo LLM Playground에서 모델을 자유롭게 호출해 대화하거나 출력을 비교하고 직접 프롬프트를 테스트할 수도 있습니다.

정식 출시 · Google I/O 2026 · 2026년 5월 19일

Gemini 3.5 Flash — 무료로 사용플래시 속도로 Pro급 에이전트 AI를

Gemini 3.5 Flash는 2026년 5월 19일 출시된 Google DeepMind의 가장 빠른 프론티어 모델입니다. Pro급 추론 깊이와 100만 토큰 컨텍스트 윈도우를 갖추고, 동급 프론티어 모델 대비 4배 빠른 속도로 절반 이하의 비용에 구동됩니다 — 지금 바로 Felo AI에서 무료로 체험해 보세요.

Gemini 3.5 Flash 무료 체험

Felo AI에서 무료 이용 — 신용카드 불필요

81.2%

MMMU-Pro 점수

멀티모달 벤치마크 글로벌 1위

$0.50

입력 가격

API 기준 100만 토큰당 $1.50

0.2s

속도 우위

동급 모델 대비 4배 빠름

컨텍스트 윈도우

단일 요청당 토큰 수

Gemini 3.5 Flash가 다른 이유

에이전트 및 코딩 벤치마크에서 자체 Pro 전작을 처음으로 능가한 Flash 모델 — Flash 수준의 속도와 비용은 그대로 유지합니다.

에이전트 워크플로우를 위해 설계

Gemini 3.5 Flash는 Google의 역대 가장 강력한 에이전트 및 코딩 모델입니다. 수 시간 또는 수 주에 걸친 장기 작업을 안정적으로 수행하고, 다단계 도구 사용을 처리하며, Google의 Antigravity 프레임워크를 통해 서브 에이전트를 조율합니다 — 대규모 에이전트 시스템을 경제적으로 실현 가능하게 만듭니다.

동적 사고 — 설정 가능한 추론 깊이

사고 기능이 기본으로 활성화되며, 새로운 thinking_level 파라미터(기본값: medium)가 도입되었습니다. Gemini 3.5 Flash는 응답 전 내부적으로 다단계 계획을 수립하여 수학, 코딩, 논리 과제에서 플래그십 Pro 모델에 필적하는 추론 깊이를 발휘하며, 요청별로 깊이를 조절할 수 있습니다.

100만 토큰 컨텍스트 윈도우

전체 코드베이스, 수 시간 분량의 동영상, 1년치 금융 계약서를 단일 요청으로 처리할 수 있습니다. 100만 입력 토큰과 6.4만 출력 토큰의 조합으로 복잡한 작업도 잘리지 않고 완전하게 처리됩니다. MRCR v2 장문 컨텍스트 점수 26.6%로 동급 모델 중 1위입니다.

4배 빠르고, 절반 이하의 비용

Gemini 3.5 Flash는 동급 프론티어 모델 대비 4배 빠른 속도로 절반 이하의 비용에 구동됩니다. 100만 입력 토큰당 $1.50, 컨텍스트 캐싱 시 $0.15/M으로 AI 에이전트를 24시간 운영하는 것이 기술적으로 가능할 뿐만 아니라 현실적인 선택이 됩니다.

새로운 파레토 프론티어: 속도 × 지능

오랫동안 빠를수록 성능이 낮다는 공식이 통했습니다. Gemini 3.5 Flash는 그 트레이드오프를 깨뜨립니다 — 훨씬 비싼 모델들을 능가하면서 속도-지능 곡선의 최상단에 위치합니다.

Gemini 3.5 Flash가 파레토 프론티어에 위치한 지능 대 속도 차트

Gemini 3.5 Flash는 프론티어 모델 중 지능-속도 파레토 프론티어를 선도합니다. 출처: Artificial Analysis, 2026년 5월.

성능 벤치마크

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

공식 모델 카드 결과. Gemini 3.5 Flash는 멀티모달 이해, 에이전트 도구 사용, 장문 컨텍스트 검색에서 앞서 있습니다.

벤치마크

Gemini 3.5 Flash

Claude Opus 4.7

GPT-5.5

MMMU-Pro

83.6%

75.2%

81.2%

CharXiv Reasoning

84.2%

82.1%

84.1%

MCP Atlas

83.6%

79.1%

75.3%

Terminal-Bench 2.1

76.2%

66.1%

78.2%

OSWorld-Verified

78.4%

78.0%

78.7%

MRCR v2 (1M ctx)

26.6%

—

출처: Gemini 3.5 Flash 모델 카드 — Google DeepMind, 2026년 5월.

기술 사양

Gemini 3.5 Flash를 애플리케이션에 통합하기 전에 알아야 할 모든 정보입니다.

컨텍스트 윈도우

입력 1,048,576 토큰

출력 65,536 토큰

API 가격

입력 100만 토큰당 $1.50

출력 100만 토큰당 $9.00

캐시 100만 토큰당 $0.15

정식 출시

2026년 5월 19일 — Google I/O

지식 기준일

2026년 1월

사고 모드

기본으로 활성화. thinking_level: low / medium(기본값) / high로 설정 가능. Thought Preservation이 다중 턴 대화에서 추론 과정을 유지합니다.

도구 사용 및 API

함수 호출, 구조화된 출력, 코드 실행, Google 검색 그라운딩, 컨텍스트 캐싱 — 모두 네이티브로 지원됩니다.

입력 모달리티

텍스트, 이미지, 오디오, 동영상, PDF — 네이티브 멀티모달, 전처리 불필요.

네이티브 멀티모달 — 하나의 모델로 모든 입력 유형 처리

Gemini 3.5 Flash는 텍스트, 이미지, 오디오, 동영상을 네이티브로 처리합니다 — 별도 파이프라인이나 여러 모델을 연결할 필요가 없습니다.

텍스트 및 PDF

수백만 단어 문서를 높은 정확도로 파싱. 복잡한 표, 코드, 구조화된 데이터를 단일 패스로 처리.

이미지 이해

MMMU-Pro 점수 83.6% — 글로벌 1위. 건축 도면, 차트, 상세한 시각 콘텐츠를 실시간으로 분석.

동영상 분석

최대 1시간 분량의 동영상 입력을 지원. 요약, QA, 콘텐츠 분석을 위해 프레임별 주요 변화를 포착.

오디오 처리

감정, 주변 소리, 다국어 대화를 인식. 실시간 번역과 음성 어시스턴트를 지원.

어디서든 개발 가능

Gemini 3.5 Flash는 Google의 개발자 및 소비자 생태계 전반에 깊이 통합되어 있습니다 — API 접근부터 수십억 사용자를 지원하는 기본 모델까지.

개발자 플랫폼

Gemini API
Google AI Studio
Android Studio
Google Antigravity
Gemini Enterprise Agent Platform (Vertex AI)

소비자 제품

Gemini 앱 — 글로벌 기본 모델
Google 검색 AI 모드 — 기본 모델
Gemini Spark — 개인 AI 에이전트
Felo AI — 검색 및 플레이그라운드를 통한 무료 이용

Gemini 3.5 Flash가 최고의 가성비 프론티어 모델임을 보여주는 지능 대 비용 차트

Gemini 3.5 Flash는 지능-비용 프론티어를 선도합니다. 동급 모델 대비 절반 이하의 비용으로 동등한 작업 성능을 제공합니다. 출처: Artificial Analysis, 2026년 5월.

Gemini 3.5 Flash 활용 분야

개인 개발자부터 기업 팀까지, 대규모로 빠르고 강력한 AI가 필요한 모든 곳에 Gemini 3.5 Flash가 적합합니다.

에이전트 코딩

Terminal-Bench 2.1 점수 76.2%와 저지연의 조합으로 코딩 에이전트가 더 빠르고 논리적 오류 없이 작업을 완료 — 반복적인 코드 생성, 디버깅, A/B 테스트를 Flash 속도로 처리.

재무 및 세무 처리

1년치 계약서와 재무제표를 단일 요청으로 처리. Xero는 1099 세금 양식 처리에, Ramp는 복잡한 인보이스 처리를 위한 멀티모달 OCR에 활용합니다.

기업 에이전트 플랫폼

Salesforce는 Agentforce에 통합하여 기업 에이전트 배포를 가속화합니다. Databricks는 실시간 데이터 모니터링과 자율적인 문제 진단에 활용합니다.

장기 비즈니스 작업

Shopify는 판매자 성장 예측에 활용합니다. 수 시간 또는 수 주에 걸친 복잡한 워크플로우를 안정적으로 수행 — 이전에는 매 단계마다 사람의 감독이 필요했던 작업들입니다.

멀티모달 콘텐츠 분석

동영상, 이미지, 문서를 단일 요청으로 함께 분석. CharXiv Reasoning 점수 84.2%로 복잡한 차트와 혼합 미디어 콘텐츠에서 정확하게 인사이트를 추출.

소비자 AI 제품

현재 Gemini 앱과 Google 검색 AI 모드의 기본 모델로 월간 수십억 명의 활성 사용자에게 서비스 중. 빠른 모드로 모바일에서도 거의 즉각적인 응답을 제공.

도입 팀의 이야기

“대규모 비정형 멀티모달 데이터셋 처리에서 장문 컨텍스트 성능이 탁월합니다.”

— Bridgewater Associates

“Gemini 3.5 Flash를 Agentforce에 통합하여 기업 에이전트 배포를 가속화했습니다 — 속도 대비 성능 비율은 지금까지 본 것 중 가장 뛰어납니다.”

— Salesforce

“Gemini 3.5 Flash 덕분에 에이전트 워크플로우에서 실시간 정보를 모니터링하고 문제를 자율적으로 진단할 수 있게 되었습니다.”

— Databricks

Felo에서 Gemini 3.5 Flash를 사용하는 두 가지 방법

Felo AI 검색

Felo AI 검색을 열고 Gemini 3.5 Flash 모델을 선택하세요. 질문하고, AI로 웹을 검색하고, 출처가 인용된 답변을 받아보세요 — Google의 가장 빠른 프론티어 모델이 지원합니다.

Felo AI 검색 열기

Felo LLM Playground

Felo LLM Playground를 열고 Gemini 3.5 Flash를 선택해 대화를 시작하세요. 여러 모델의 출력을 나란히 비교하며 속도와 추론 차이를 직접 확인해 보세요.

플레이그라운드 열기

자주 묻는 질문

지금 바로 Gemini 3.5 Flash를 무료로 체험하세요

Google I/O 2026에서 출시. Felo AI를 열고 Google의 가장 빠른 프론티어 모델을 오늘 바로 사용해 보세요.

Felo에서 Gemini 3.5 Flash 열기

무료 이용 — 신용카드 불필요