Gemini 3.5 Flash, Felo AI에 탑재 예정 — 구글의 가장 빠른 AI 모델, 무료 제공
Google DeepMind의 Gemini 3.5 Flash가 곧 Felo AI에 도입됩니다 — 1초 미만 응답 속도, 프로급 추론, 100만 토큰 컨텍스트, /usr/bin/bash.50/M 토큰 기준. 무료로 이용 가능.
속도와 깊이는 늘 맞바꿔야 하는 선택이었습니다. 하나를 고르라고 했죠.
Google DeepMind는 이제 그 규칙을 깨버렸습니다. Gemini 3.5 Flash — 프로급 추론 능력을 0.2초 첫 응답 속도로 구현한 최초의 Flash 모델입니다.
그리고 이제 우리는 이를 Felo AI에 가져옵니다. 완전히 무료로.
타협 없는 첫 Flash 모델
이전의 Flash 모델은 이렇게 물었습니다: 빠르지만 얕게 갈 것인가, 느리더라도 깊이를 얻을 것인가.
Gemini 3.5 Flash는 이제 그 선택 자체를 없앴습니다. 타협이 더는 존재하지 않습니다.
| 기능 | 제공 내용 |
|---|---|
| 1초 미만 속도 | 첫 토큰 생성까지 0.2초 — 실시간 음성 비서, 라이브 코드 자동완성, 지연 없는 검색 가능 |
| Thinking Mode | 응답 전 다단계 계획 설정 가능 — 수학, 코딩, 논리에서 플래그십 Pro 모델에 필적 |
| 100만 토큰 컨텍스트 | 전체 코드베이스, 장시간 영상, 1년치 계약서를 한 번에 — 잘리는 부분 없이 처리 |
| 네이티브 멀티모달 | 텍스트, 이미지, 비디오, 오디오를 하나의 아키텍처로 처리 — MMMU-Pro 점수 81.2%, 세계 1위 |
| $0.50당 백만 토큰 | GPT-5.5급 성능의 92%를 초저비용으로 — 24시간 AI 에이전트 실현 가능 |
Felo AI에서 가능한 일의 기준이 바뀐다
AI로 하기엔 너무 느리거나 비쌌던 일들을 떠올려 보세요.
실시간 음성 대화. 0.2초 지연이면 AI와의 대화가 사람과의 대화처럼 느껴집니다 — 응답을 기다릴 필요가 없습니다.
대규모 코딩 자동화. 78% SWE-bench 점수와 낮은 지연 덕분에 코딩 에이전트는 더 빠르게, 논리적 오류 없이 작업을 완료합니다.
Replit은 이렇게 말했습니다. “속도, 경제성, 그리고 코딩 에이전트의 핵심 루프를 작동시킬 충분한 성능을 모두 갖춘 최초의 모델이다.”
문서 전체를 한 번에 처리. 1년치 계약서를 100만 토큰 컨텍스트에 넣으면 이전 모델보다 15% 높은 추출 정확도를 달성 — 누락 없이 완벽 처리.
24/7 다국어 고객 지원. $0.50/백만 토큰, 91.8% 다국어 처리율로 전일 운영 시 비용이 기존 대비 80% 절감.
대규모 비디오 분석. Video-MMMU 기준 86.9% 성능, 최대 1시간 영상 입력 지원. 프레임 단위 분석 후 실시간으로 마케팅 문구 자동 생성.

Gemini 3.5 Flash의 비교 결과
Google DeepMind의 벤치마크에 따르면, Gemini 3.5 Flash는 매우 경쟁력 있는 위치에 있습니다:
- MMMU-Pro: 81.2% — 전 세계 1위 멀티모달 벤치마크 점수
- SWE-bench: Thinking Mode 활성화 시 78% — 강력한 코딩 에이전트 성능
- BigLaw Bench: 이전 모델 대비 법률 추론력 7% 향상
- OmniDocBench: OCR 편집 거리 0.121 — 복잡한 테이블과 필기에도 높은 인식 정확도
멀티모달 이해와 에이전트 도구 활용 측면에서, Gemini 3.5 Flash는 Claude Sonnet 4.6과 GPT-5.5를 모두 앞섭니다.
이미 현장에서 들려오는 평가
“Gemini 3.5 Flash는 Flash 같은 속도와 스케일에서 프로급 깊이를 제공하는 최초의 모델입니다. 대규모 연구 데이터셋 처리에 탁월한 장기 컨텍스트 성능을 보입니다.”
— Bridgewater Associates
“Junie 에이전트 코딩 평가에서 품질은 플래그십 Pro 모델에 근접하면서도, 쿼터 제약 환경에서도 높은 확장성과 낮은 비용을 유지했습니다.”
— JetBrains
Felo AI에서 Gemini 3.5 Flash를 사용하는 두 가지 방법
Felo AI Search
검색 모델로 Gemini 3.5 Flash를 선택하세요. 구글의 가장 빠른 프런티어 모델과 Felo의 실시간 웹 검색이 결합된 빠르고 출처가 명확한 답변을 받을 수 있습니다.
Felo LLM Playground
Gemini 3.5 Flash와 직접 대화하며, 다른 모델과 결과를 나란히 비교하고 속도의 차이를 직접 체감해 보세요.

앞으로의 일정
Gemini 3.5 Flash는 아주 곧 Felo AI에 도착합니다. 첫날부터 매끄럽게 사용할 수 있도록 통합을 마무리 중입니다.
도입 후에는:
- Felo AI Search를 열고 Gemini 3.5 Flash를 선택해 즉시 답변 받기
- LLM Playground에서 다른 모델과 속도 비교 테스트
- 대화 중에도 모델을 전환하며 실시간 결과 비교
설정 불필요. 결제도 없음. 그냥 바로 열고 사용하세요.
소식 받아보기
정식 출시일은 본 블로그와 채널을 통해 공개됩니다. Felo AI 가입 후 Gemini 3.5 Flash 출시 즉시 이용할 준비를 하세요.
빠른 AI가 비쌀 필요는 없습니다.
곧, 그렇지 않게 될 것입니다.
이 글은 다음 언어로도 읽을 수 있습니다: English, 简体中文, 日本語, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, ไทย, Español, বাংলা, Português.