Gemini 3.5 Flash, Felo AI에 탑재 예정 — 구글의 가장 빠른 AI 모델, 무료 제공

May 19, 2026 · 약 8분

Committed to answers at your fingertips

Google DeepMind의 Gemini 3.5 Flash가 곧 Felo AI에 도입됩니다 — 1초 미만 응답 속도, 프로급 추론, 100만 토큰 컨텍스트, /usr/bin/bash.50/M 토큰 기준. 무료로 이용 가능.

속도와 깊이는 늘 맞바꿔야 하는 선택이었습니다. 하나를 고르라고 했죠.

Google DeepMind는 이제 그 규칙을 깨버렸습니다. Gemini 3.5 Flash — 프로급 추론 능력을 0.2초 첫 응답 속도로 구현한 최초의 Flash 모델입니다.

그리고 이제 우리는 이를 Felo AI에 가져옵니다. 완전히 무료로.

타협 없는 첫 Flash 모델

이전의 Flash 모델은 이렇게 물었습니다: 빠르지만 얕게 갈 것인가, 느리더라도 깊이를 얻을 것인가.
Gemini 3.5 Flash는 이제 그 선택 자체를 없앴습니다. 타협이 더는 존재하지 않습니다.

기능	제공 내용
1초 미만 속도	첫 토큰 생성까지 0.2초 — 실시간 음성 비서, 라이브 코드 자동완성, 지연 없는 검색 가능
Thinking Mode	응답 전 다단계 계획 설정 가능 — 수학, 코딩, 논리에서 플래그십 Pro 모델에 필적
100만 토큰 컨텍스트	전체 코드베이스, 장시간 영상, 1년치 계약서를 한 번에 — 잘리는 부분 없이 처리
네이티브 멀티모달	텍스트, 이미지, 비디오, 오디오를 하나의 아키텍처로 처리 — MMMU-Pro 점수 81.2%, 세계 1위
$0.50당 백만 토큰	GPT-5.5급 성능의 92%를 초저비용으로 — 24시간 AI 에이전트 실현 가능

Felo AI에서 가능한 일의 기준이 바뀐다

AI로 하기엔 너무 느리거나 비쌌던 일들을 떠올려 보세요.

실시간 음성 대화. 0.2초 지연이면 AI와의 대화가 사람과의 대화처럼 느껴집니다 — 응답을 기다릴 필요가 없습니다.

대규모 코딩 자동화. 78% SWE-bench 점수와 낮은 지연 덕분에 코딩 에이전트는 더 빠르게, 논리적 오류 없이 작업을 완료합니다.
Replit은 이렇게 말했습니다. “속도, 경제성, 그리고 코딩 에이전트의 핵심 루프를 작동시킬 충분한 성능을 모두 갖춘 최초의 모델이다.”

문서 전체를 한 번에 처리. 1년치 계약서를 100만 토큰 컨텍스트에 넣으면 이전 모델보다 15% 높은 추출 정확도를 달성 — 누락 없이 완벽 처리.

24/7 다국어 고객 지원. $0.50/백만 토큰, 91.8% 다국어 처리율로 전일 운영 시 비용이 기존 대비 80% 절감.

대규모 비디오 분석. Video-MMMU 기준 86.9% 성능, 최대 1시간 영상 입력 지원. 프레임 단위 분석 후 실시간으로 마케팅 문구 자동 생성.

Gemini 3.5 Flash 속도 설명 일러스트 — 번개같이 빠른 AI 처리, 역동적 데이터 스트림이 밝은 초점으로 수렴, Felo AI의 짙은 파랑과 시안 브랜드 컬러

Gemini 3.5 Flash의 비교 결과

Google DeepMind의 벤치마크에 따르면, Gemini 3.5 Flash는 매우 경쟁력 있는 위치에 있습니다:

MMMU-Pro: 81.2% — 전 세계 1위 멀티모달 벤치마크 점수
SWE-bench: Thinking Mode 활성화 시 78% — 강력한 코딩 에이전트 성능
BigLaw Bench: 이전 모델 대비 법률 추론력 7% 향상
OmniDocBench: OCR 편집 거리 0.121 — 복잡한 테이블과 필기에도 높은 인식 정확도

멀티모달 이해와 에이전트 도구 활용 측면에서, Gemini 3.5 Flash는 Claude Sonnet 4.6과 GPT-5.5를 모두 앞섭니다.

이미 현장에서 들려오는 평가

“Gemini 3.5 Flash는 Flash 같은 속도와 스케일에서 프로급 깊이를 제공하는 최초의 모델입니다. 대규모 연구 데이터셋 처리에 탁월한 장기 컨텍스트 성능을 보입니다.”
— Bridgewater Associates

“Junie 에이전트 코딩 평가에서 품질은 플래그십 Pro 모델에 근접하면서도, 쿼터 제약 환경에서도 높은 확장성과 낮은 비용을 유지했습니다.”
— JetBrains

Felo AI에서 Gemini 3.5 Flash를 사용하는 두 가지 방법

Felo AI Search

검색 모델로 Gemini 3.5 Flash를 선택하세요. 구글의 가장 빠른 프런티어 모델과 Felo의 실시간 웹 검색이 결합된 빠르고 출처가 명확한 답변을 받을 수 있습니다.

Felo LLM Playground

Gemini 3.5 Flash와 직접 대화하며, 다른 모델과 결과를 나란히 비교하고 속도의 차이를 직접 체감해 보세요.

Felo AI 인터페이스에 표시된 Gemini 3.5 Flash 채팅 — 빠른 Thinking Mode 응답, 파랑 및 시안 포인트의 다크 모드 UI

앞으로의 일정

Gemini 3.5 Flash는 아주 곧 Felo AI에 도착합니다. 첫날부터 매끄럽게 사용할 수 있도록 통합을 마무리 중입니다.

도입 후에는:

Felo AI Search를 열고 Gemini 3.5 Flash를 선택해 즉시 답변 받기
LLM Playground에서 다른 모델과 속도 비교 테스트
대화 중에도 모델을 전환하며 실시간 결과 비교

설정 불필요. 결제도 없음. 그냥 바로 열고 사용하세요.

소식 받아보기

정식 출시일은 본 블로그와 채널을 통해 공개됩니다. Felo AI 가입 후 Gemini 3.5 Flash 출시 즉시 이용할 준비를 하세요.

빠른 AI가 비쌀 필요는 없습니다.
곧, 그렇지 않게 될 것입니다.

이 글은 다음 언어로도 읽을 수 있습니다: English, 简体中文, 日本語, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, ไทย, Español, বাংলা, Português.

타협 없는 첫 Flash 모델​

Felo AI에서 가능한 일의 기준이 바뀐다​

Gemini 3.5 Flash의 비교 결과​

이미 현장에서 들려오는 평가​

Felo AI에서 Gemini 3.5 Flash를 사용하는 두 가지 방법​

Felo AI Search​

Felo LLM Playground​

앞으로의 일정​

소식 받아보기​