Skip to main content

کلاوڈ اوپس 4.8 جاری: اینتھروپِک کا اب تک کا سب سے طاقتور ماڈل

· 7 منٹ پڑھیں
Felo Search Tips Buddy
Committed to answers at your fingertips

انتهروپِک نے ابھی کلاوڈ اوپس 4.8 جاری کیا — تیز تر، زیادہ ایماندار، اور ایجنٹ پر مبنی کاموں میں بہتر۔ یہاں جانیں اس میں کیا نیا ہے اور یہ ڈویلپرز کے لیے کیوں اہم ہے۔

کلاوڈ اوپس 4.8 جاری کا کور امیج جو سرخی اور اہم نکات دکھاتا ہے

اینتھروپِک نے اس ہفتے کلاوڈ اوپس 4.8 جاری کیا۔ یہ اب تک کا سب سے زیادہ قابل ماڈل ہے جو انہوں نے عام طور پر دستیاب کیا ہے — اوپس 4.7 کی بنیاد پر، جو کوڈنگ، استدلال، ایجنٹ پر مبنی کاموں، اور ایمانداری کے لحاظ سے مزید بہتری لایا ہے۔ قیمت وہی ہے: فی ایک ملین ان پٹ ٹوکنز کے لیے $5، اور فی ایک ملین آؤٹ پٹ ٹوکنز کے لیے $25۔

یہ ہے کہ کیا بدلا ہے اور ڈویلپرز کے لیے اس کی کیا اہمیت ہے۔


اوپس 4.7 سے کیا بدلا ہے؟

یہ ہے جو واقعی بدلا:

1. بہتر فیصلے اور ایمانداری

اوپس 4.8 کے غیر ثابت شدہ دعوے کرنے یا کوڈ کی خامیوں کو بغیر نشاندہی کے چھوڑ دینے کے امکانات پہلے کے مقابلے میں نمایاں طور پر کم ہیں۔ اینتھروپِک کے تجزیے کے مطابق، یہ تقریباً چار گنا کم امکان رکھتا ہے کہ اپنے ہی کوڈ کی غلطیوں کو بغیر جھنڈا لگائے گزرنے دے۔ ایسی بہتری اس وقت اہم ہوتی ہے جب آپ کسی ماڈل پر خودمختیار طور پر کام کرنے کا بھروسہ کر رہے ہوں۔

ابتدائی ٹیسٹرز نے رپورٹ کیا کہ یہ درست سوالات پوچھتا ہے، اپنی غلطیوں کو پکڑتا ہے، اور جب کوئی منصوبہ غیر منطقی ہو تو اس پر اعتراض بھی کرتا ہے۔

2. مضبوط ایجنٹک کارکردگی

بینچ مارک موازنہ چارٹ جو کلاوڈ اوپس 4.8 بمقابلہ اوپس 4.7 بمقابلہ جی پی ٹی-5.5 کو سپر ایجنٹ، کرسر بینچ، آن لائن-مائنڈ2 ویب، اور لیگل ایجنٹ بینچ مارکس میں دکھاتا ہے

اوپس 4.8 واحد ماڈل ہے جس نے اینتھروپِک کے سپر ایجنٹ بینچ مارک میں ہر کیس کو آغاز سے اختتام تک مکمل کیا، پچھلے اوپس ماڈلز اور جی پی ٹی-5.5 دونوں کو لاگت کی برابری پر پیچھے چھوڑ دیا۔ کرسر بینچ پر، یہ سابقہ اوپس ورژنز سے ہر سطح پر بہتر ہے، اور ایک ہی ذہانت کے لیے کم ٹول کالنگ مراحل استعمال کرتا ہے۔

یہ سب سے مضبوط کمپیوٹر استعمال اور براؤزر ایجنٹ ماڈل بھی ہے جو اینتھروپِک نے آزمائے ہیں، جس نے آن لائن-مائنڈ2 ویب پر 84% اسکور حاصل کیا۔

3. تیز تر، زیادہ مؤثر ٹول کالنگ

یہ ماڈل ان ٹول کالز کو چھوڑنے کے کم امکانات رکھتا ہے جو کسی کام کے لیے ضروری ہوں — ایک مسئلہ جو اوپس 4.7 میں عام تھا۔ طویل ایجنٹک عمل اب سیاق و سباق کے کمپیکشن کے بعد بھی زیادہ یکسو رہتے ہیں اور کم بھٹکتے ہیں۔

4. خود تطبیق پذیر سوچ — جو واقعی مطابقت رکھتی ہے

جب خود تطبیق پذیر سوچ کو فعال کیا جائے، اوپس 4.8 ہر باری فیصلہ کرتا ہے کہ آیا استدلال کی ضرورت ہے یا نہیں۔ سادہ سوالات کے لیے براہ راست جوابات فراہم کرتا ہے، جبکہ پیچیدہ مسائل کے لیے جواب سے پہلے تفکر شامل کرتا ہے۔ اوپس 4.7 کے مقابلے میں کم ضائع شدہ ٹوکنز۔


نئی خصوصیات جو جاننے کے قابل ہیں

کوشش کا کنٹرول — اب تمام پلانز میں دستیاب

ماڈل سلیکٹر کے ساتھ ایک نیا کنٹرول صارفین کو یہ منتخب کرنے دیتا ہے کہ کلاوڈ کسی جواب میں کتنا زور لگائے۔ اوپس 4.8 کا ڈیفالٹ high کوشش ہے، جبکہ extra اور max اختیارات مشکل کاموں کے لیے دستیاب ہیں۔ زیادہ ٹوکن استعمال کے لیے کلاؤڈ کوڈ میں ریٹ کی حدیں بڑھا دی گئی ہیں۔

فاسٹ موڈ — 2.5 گنا تیز رفتار، کم لاگت

اب فاسٹ موڈ کلاؤڈ API پر ایک تحقیقی پریویو کے طور پر اوپس 4.8 کے لیے دستیاب ہے۔ یہ پچھلے ماڈلز کے مقابلے میں 2.5× زیادہ آؤٹ پٹ ٹوکن فی سیکنڈ فراہم کرتا ہے، وہ بھی تین گنا کم لاگت پر۔

گفتگو کے دوران سسٹم پیغامات

اب میسجز API role: "system" انٹریز کو میسیجز کے ارے کے اندر قبول کرتا ہے۔ آپ کسی کام کے دوران کلاؤڈ کی ہدایات کو اپ ڈیٹ کر سکتے ہیں بغیر پرامپٹ کیش توڑے — یہ اس وقت مفید ہے جب اجازتیں یا سیاق و سباق کسی ایجنٹک عمل کے دوران بدل جائیں۔

کم سے کم پرامپٹ کیش لمبائی میں کمی

اب کم سے کم کیشیبل پرامپٹ کی لمبائی 1,024 ٹوکنز تک کم کر دی گئی ہے۔ وہ پرامپٹس جو اوپس 4.7 میں بہت چھوٹے ہونے کی وجہ سے کیش نہیں ہو سکتے تھے، اب بغیر کسی کوڈ تبدیلی کے کیش انٹریز بناتے ہیں۔


حقیقی دنیا کے بینچ مارکس

بینچ مارکاوپس 4.8 کی کارکردگی
سپر ایجنٹتمام کیسز آغاز سے اختتام تک مکمل (ایسا کرنے والا واحد ماڈل)
کرسر بینچہر سطح پر تمام پچھلے اوپس ماڈلز سے بہتر
آن لائن-مائنڈ2 ویب84% (سب سے مضبوط آزمودہ ماڈل)
لیگل ایجنٹ بینچ مارکسب سے زیادہ اسکور؛ پہلا ماڈل جس نے 10% کی حد عبور کی

ایک خیالی خاکہ جس میں ایک اے آئی ایجنٹ کو خودمختار طور پر کوڈبیس پر ٹولز اور ورک فلو اشاروں کے ساتھ کام کرتے دکھایا گیا ہے

اوپس 4.8 ان جگہوں پر سب سے بہترین ہے جہاں طویل المیعاد خودمختاری اہم ہوتی ہے — جیسے کوڈنگ ایجنٹس، تحقیقاتی ایجنٹس، قانونی ورک فلو، اور ادارہ جاتی نالج ورک۔


قیمت — اوپس 4.7 کے برابر

موڈان پٹآؤٹ پٹ
معیاری$5 / 1M ٹوکنز$25 / 1M ٹوکنز
فاسٹ$10 / 1M ٹوکنز$50 / 1M ٹوکنز

اوپس 4.7 جیسی ہی قیمت، لیکن بہتر کارکردگی کے ساتھ۔ API پر ماڈل آئی ڈی claude-opus-4-8 ہے۔ یہ 1M ٹوکن کے سیاق و سباق کی ونڈو اور 128k زیادہ سے زیادہ آؤٹ پٹ ٹوکنز کی حمایت کرتا ہے۔


آگے کیا: مائتھوس کلاس ماڈلز

اینتھروپِک نے ایک نئی ماڈل کلاس کا عندیہ بھی دیا ہے جس میں "اوپس سے بھی زیادہ ذہانت" ہوگی۔ کچھ ادارے پہلے ہی کلاوڈ مائتھوس پری ویو کو پروجیکٹ گلاس وِنگ کے ذریعے سائبر سیکیورٹی کے کام کے لیے استعمال کر رہے ہیں۔ کمپنی اگلے چند ہفتوں میں مائتھوس کلاس ماڈلز تمام صارفین کے لیے دستیاب کرنے کا منصوبہ رکھتی ہے، جب مناسب حفاظتی اقدامات مکمل ہو جائیں گے۔


ماڈل تنوع کیوں اہم ہے

اب ہر ہفتے نئے اے آئی ماڈلز جاری ہو رہے ہیں۔ ان پر کام کرنے والے ڈویلپرز کے لیے اصل سوال یہ نہیں کہ کون سا ماڈل "بہترین" ہے — بلکہ یہ کہ کون سا ماڈل کس کام کے لیے موزوں ہے، اور کس طرح بغیر کسی رکاوٹ کے ان کے درمیان سوئچ کیا جا سکتا ہے۔

یہی مسئلہ Felo AI حل کرتا ہے۔ اپنی اے آئی سے تقویت یافتہ سرچ کے علاوہ، جو جدید ماڈلز سے حقیقی وقت کے جوابات فراہم کرتی ہے، فیلو ایک LLM پلے گراؤنڈ بھی پیش کرتا ہے، جہاں آپ مختلف معروف ماڈلز کے جوابات کو ایک ہی جگہ پر کال، ٹیسٹ، اور موازنہ کر سکتے ہیں۔ نہ API کیز بدلنے کی ضرورت، نہ مختلف ڈیش بورڈز میں گھومنے کی۔ بس ماڈل منتخب کریں، اپنا پرامپٹ چلائیں، اور دیکھیں کارکردگی کیسی ہے۔

اگر آپ اپنے ورک فلو کے لیے ماڈلز کا جائزہ لے رہے ہیں، یا صرف یہ جاننا چاہتے ہیں کہ مارکیٹ میں کیا نیا ہے، تو سب کو ایک ہی انٹرفیس میں دیکھنا موازنہ کے عمل کو کہیں زیادہ آسان بنا دیتا ہے۔


فیلو اے آئی مفت میں آزمائیں → https://felo.ai


یہ مضمون ان زبانوں میں بھی دستیاب ہے: English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, ไทย, Español, বাংলা and Português۔