अब GA · Google I/O 2026 में लॉन्च · 19 मई, 2026

Gemini 3.5 Flash — मुफ़्तFlash स्पीड में Pro-स्तरीय Agentic AI

Gemini 3.5 Flash, Google DeepMind का सबसे तेज़ फ्रंटियर मॉडल है, जिसे 19 मई 2026 को लॉन्च किया गया। यह 1M टोकन कॉन्टेक्स्ट विंडो के साथ Pro-स्तरीय रीज़निंग देता है और तुलनीय फ्रंटियर मॉडलों से 4× तेज़ चलता है — आधे से भी कम लागत पर। अभी Felo AI पर मुफ़्त आज़माएं।

Felo AI पर मुफ़्त उपयोग — क्रेडिट कार्ड की ज़रूरत नहीं

81.2%
MMMU-Pro स्कोर
वैश्विक #1 मल्टीमोडल बेंचमार्क
$0.50
इनपुट मूल्य
API के ज़रिए $1.50 / 1M टोकन
0.2s
स्पीड लाभ
तुलनीय मॉडलों से 4× तेज़
1M
कॉन्टेक्स्ट विंडो
एक अनुरोध में टोकन

Gemini 3.5 Flash को क्या अलग बनाता है

पहला Flash मॉडल जो agentic और कोडिंग बेंचमार्क पर अपने Pro पूर्ववर्ती को पीछे छोड़ता है — Flash-स्तरीय स्पीड और लागत बनाए रखते हुए।

स्पीड आइकन

Agentic वर्कफ़्लो के लिए बनाया गया

Gemini 3.5 Flash, Google का अब तक का सबसे सक्षम agentic और कोडिंग मॉडल है। यह घंटों या हफ्तों तक चलने वाले लंबे कार्यों को विश्वसनीय रूप से निष्पादित करता है, मल्टी-स्टेप टूल उपयोग संभालता है, और Google के Antigravity फ्रेमवर्क के ज़रिए सब-एजेंट्स को समन्वित करता है — बड़े पैमाने पर agentic सिस्टम को आर्थिक रूप से व्यावहारिक बनाता है।

थिंकिंग आइकन

डायनामिक थिंकिंग — कॉन्फ़िगर करने योग्य रीज़निंग गहराई

थिंकिंग डिफ़ॉल्ट रूप से सक्षम है और एक नए thinking_level पैरामीटर (डिफ़ॉल्ट: medium) के साथ आता है। Gemini 3.5 Flash जवाब देने से पहले आंतरिक मल्टी-स्टेप प्लानिंग करता है, गणित, कोडिंग और लॉजिक कार्यों पर फ्लैगशिप Pro मॉडल के बराबर रीज़निंग गहराई देता है — जिसे प्रति अनुरोध समायोजित किया जा सकता है।

कॉन्टेक्स्ट आइकन

1M टोकन कॉन्टेक्स्ट विंडो

एक ही अनुरोध में पूरा कोडबेस, घंटों का वीडियो या एक साल के वित्तीय अनुबंध डालें। 1M इनपुट टोकन विंडो और 64K आउटपुट टोकन के साथ जटिल कार्य पूरे रहते हैं — कुछ भी काटा नहीं जाता। MRCR v2 लॉन्ग-कॉन्टेक्स्ट स्कोर 26.6% सभी तुलनीय मॉडलों में अग्रणी।

लागत आइकन

4× तेज़, आधे से भी कम लागत

Gemini 3.5 Flash तुलनीय फ्रंटियर मॉडलों से 4× तेज़ चलता है और आधे से भी कम लागत पर। प्रति मिलियन इनपुट टोकन $1.50 और कॉन्टेक्स्ट कैशिंग $0.15/M पर, चौबीसों घंटे AI एजेंट चलाना व्यावहारिक विकल्प बन जाता है — न केवल तकनीकी रूप से संभव।

नया Pareto फ्रंटियर: स्पीड × इंटेलिजेंस

वर्षों से, तेज़ का मतलब कम सक्षम था। Gemini 3.5 Flash इस समझौते को तोड़ता है — यह स्पीड-इंटेलिजेंस कर्व के शीर्ष-दाईं ओर है, उन मॉडलों से आगे जो कहीं अधिक महंगे हैं।

Intelligence vs Speed चार्ट जो Gemini 3.5 Flash को Pareto फ्रंटियर पर दिखाता है

Gemini 3.5 Flash फ्रंटियर मॉडलों में intelligence-vs-speed Pareto फ्रंटियर का नेतृत्व करता है। स्रोत: Artificial Analysis, मई 2026।

परफॉर्मेंस बेंचमार्क

Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5

आधिकारिक मॉडल कार्ड परिणाम। Gemini 3.5 Flash मल्टीमोडल समझ, agentic टूल उपयोग और लॉन्ग-कॉन्टेक्स्ट रिट्रीवल में आगे है।

बेंचमार्क
Gemini 3.5 Flash
Claude Opus 4.7
GPT-5.5
MMMU-Pro
83.6%
75.2%
81.2%
CharXiv Reasoning
84.2%
82.1%
84.1%
MCP Atlas
83.6%
79.1%
75.3%
Terminal-Bench 2.1
76.2%
66.1%
78.2%
OSWorld-Verified
78.4%
78.0%
78.7%
MRCR v2 (1M ctx)
26.6%

स्रोत: Gemini 3.5 Flash Model Card — Google DeepMind, मई 2026।

तकनीकी विशिष्टताएं

Gemini 3.5 Flash को अपने एप्लिकेशन में एकीकृत करने से पहले जो कुछ भी जानना ज़रूरी है।

कॉन्टेक्स्ट विंडो

1,048,576 टोकन इनपुट
65,536 टोकन आउटपुट

API मूल्य निर्धारण

$1.50 / 1M इनपुट टोकन
$9.00 / 1M आउटपुट टोकन
$0.15 / 1M कैश्ड टोकन

सामान्य उपलब्धता

19 मई, 2026 — Google I/O

नॉलेज कटऑफ

जनवरी 2026

थिंकिंग मोड

डिफ़ॉल्ट रूप से चालू। thinking_level के ज़रिए कॉन्फ़िगर करने योग्य: low / medium (डिफ़ॉल्ट) / high। Thought Preservation मल्टी-टर्न बातचीत में रीज़निंग बनाए रखता है।

टूल उपयोग और APIs

फ़ंक्शन कॉलिंग, स्ट्रक्चर्ड आउटपुट, कोड एक्ज़ीक्यूशन, Google Search ग्राउंडिंग, कॉन्टेक्स्ट कैशिंग — सभी नेटिव रूप से समर्थित।

इनपुट मोडैलिटी

टेक्स्ट, इमेज, ऑडियो, वीडियो, PDF — नेटिव मल्टीमोडल, कोई प्री-प्रोसेसिंग आवश्यक नहीं।

नेटिव मल्टीमोडल — एक मॉडल, हर इनपुट प्रकार

Gemini 3.5 Flash टेक्स्ट, इमेज, ऑडियो और वीडियो को नेटिव रूप से प्रोसेस करता है — कोई अलग पाइपलाइन नहीं, कोई मल्टीपल मॉडल जोड़ने की ज़रूरत नहीं।

टेक्स्ट और PDF

मिलियन-शब्द दस्तावेज़ उच्च सटीकता से पार्स करता है। जटिल टेबल, कोड और संरचित डेटा को एक ही पास में संभालता है।

इमेज समझ

MMMU-Pro स्कोर 83.6% — वैश्विक #1। आर्किटेक्चरल ब्लूप्रिंट, चार्ट और विस्तृत विज़ुअल कंटेंट का रियल-टाइम विश्लेषण।

वीडियो विश्लेषण

1 घंटे तक के वीडियो इनपुट को सपोर्ट करता है। सारांश, QA और कंटेंट विश्लेषण के लिए फ्रेम दर फ्रेम मुख्य बदलाव कैप्चर करता है।

ऑडियो प्रोसेसिंग

भावना, परिवेश ध्वनि और बहुभाषी बातचीत पहचानता है। रियल-टाइम अनुवाद और वॉयस असिस्टेंट को शक्ति देता है।

हर जगह उपलब्ध जहां आप बनाते हैं

Gemini 3.5 Flash Google के डेवलपर और उपभोक्ता इकोसिस्टम में गहराई से एकीकृत है — API एक्सेस से लेकर अरबों उपयोगकर्ताओं को शक्ति देने वाले डिफ़ॉल्ट मॉडल तक।

डेवलपर प्लेटफ़ॉर्म

  • Gemini API
  • Google AI Studio
  • Android Studio
  • Google Antigravity
  • Gemini Enterprise Agent Platform (Vertex AI)

उपभोक्ता उत्पाद

  • Gemini ऐप — वैश्विक डिफ़ॉल्ट मॉडल
  • Google Search AI Mode — डिफ़ॉल्ट मॉडल
  • Gemini Spark — पर्सनल AI एजेंट
  • Felo AI — सर्च और प्लेग्राउंड के ज़रिए मुफ़्त एक्सेस
Intelligence vs Cost चार्ट जो Gemini 3.5 Flash को सर्वश्रेष्ठ मूल्य फ्रंटियर मॉडल के रूप में दिखाता है

Gemini 3.5 Flash intelligence-vs-cost फ्रंटियर का नेतृत्व करता है। समकक्ष कार्य प्रदर्शन के लिए तुलनीय मॉडलों की आधे से भी कम लागत। स्रोत: Artificial Analysis, मई 2026।

Gemini 3.5 Flash कौन उपयोग करता है

व्यक्तिगत डेवलपर से लेकर एंटरप्राइज़ टीम तक, Gemini 3.5 Flash हर जगह फिट बैठता है जहां आपको बड़े पैमाने पर तेज़, सक्षम AI की ज़रूरत है।

Agentic कोडिंग

Terminal-Bench 2.1 स्कोर 76.2% कम लेटेंसी के साथ। कोडिंग एजेंट तेज़ी से और कम लॉजिक गैप के साथ कार्य पूरे करते हैं — Flash स्पीड पर इटरेटिव कोड जनरेशन, डीबगिंग और A/B टेस्टिंग।

वित्तीय और टैक्स प्रोसेसिंग

एक अनुरोध में पूरे साल के अनुबंध और विवरण प्रोसेस करें। Xero इसका उपयोग 1099 टैक्स फॉर्म संभालने के लिए करता है; Ramp जटिल इनवॉइस प्रोसेसिंग के लिए इसके मल्टीमोडल OCR का उपयोग करता है।

एंटरप्राइज़ एजेंट प्लेटफ़ॉर्म

Salesforce इसे Agentforce में एकीकृत करता है एंटरप्राइज़ एजेंट तैनाती को तेज़ करने के लिए। Databricks इसका उपयोग रियल-टाइम डेटा मॉनिटर करने और स्वायत्त रूप से समस्याओं का निदान करने के लिए करता है।

लंबे-क्षितिज व्यावसायिक कार्य

Shopify इसका उपयोग मर्चेंट ग्रोथ फोरकास्टिंग के लिए करता है। घंटों या हफ्तों तक चलने वाले जटिल वर्कफ़्लो विश्वसनीय रूप से निष्पादित करता है — वे कार्य जिनमें पहले हर कदम पर मानव निगरानी की ज़रूरत होती थी।

मल्टीमोडल कंटेंट विश्लेषण

एक ही अनुरोध में वीडियो, इमेज और दस्तावेज़ एक साथ विश्लेषण करें। CharXiv Reasoning स्कोर 84.2% का मतलब है यह जटिल चार्ट और मिश्रित-मीडिया कंटेंट से सटीक रूप से अंतर्दृष्टि निकालता है।

उपभोक्ता AI उत्पाद

अब Gemini ऐप और Google Search AI Mode में डिफ़ॉल्ट मॉडल — अरबों मासिक सक्रिय उपयोगकर्ताओं की सेवा करता है। Fast Mode मोबाइल पर लगभग तत्काल रिस्पॉन्स देता है।

टीमें क्या कह रही हैं

बड़े पैमाने पर असंरचित मल्टीमोडल डेटासेट प्रोसेस करने के लिए इसकी लॉन्ग-कॉन्टेक्स्ट परफॉर्मेंस असाधारण है।

Bridgewater Associates

हमने Gemini 3.5 Flash को Agentforce में एकीकृत किया एंटरप्राइज़ एजेंट तैनाती को तेज़ करने के लिए — स्पीड-टू-कैपेबिलिटी अनुपात ऐसा है जो हमने पहले कभी नहीं देखा।

Salesforce

Gemini 3.5 Flash हमें हमारे agentic वर्कफ़्लो में रियल-टाइम जानकारी मॉनिटर करने और स्वायत्त रूप से समस्याओं का निदान करने देता है।

Databricks

Felo पर Gemini 3.5 Flash उपयोग करने के दो तरीके

Felo AI सर्च

Felo AI सर्च खोलें और Gemini 3.5 Flash मॉडल चुनें। सवाल पूछें, AI के साथ वेब सर्च करें और उद्धृत जवाब पाएं — Google के सबसे तेज़ फ्रंटियर मॉडल द्वारा संचालित।

Felo AI सर्च खोलें

Felo LLM Playground

Felo LLM Playground खोलें, Gemini 3.5 Flash चुनें और चैट शुरू करें। स्पीड और रीज़निंग का अंतर खुद देखने के लिए कई मॉडलों के आउटपुट की तुलना करें।

Playground खोलें

अक्सर पूछे जाने वाले सवाल

Gemini 3.5 Flash अभी मुफ़्त आज़माएं

Google I/O 2026 में लॉन्च। Felo AI खोलें और आज ही Google के सबसे तेज़ फ्रंटियर मॉडल का उपयोग शुरू करें।

Felo पर Gemini 3.5 Flash खोलें

मुफ़्त उपयोग — क्रेडिट कार्ड की ज़रूरत नहीं