🙆♀️Felo AI کی انقلابی کامیابی: SimpleQA بینچ مارک ٹیسٹ میں درستگی کی شرح 91.2%، AI تلاش کے نئے معیارات کی قیادت کر رہا ہے
Felo AI نے SimpleQA بینچ مارک ٹیسٹ میں 91.2% کی درستگی کے ساتھ انقلابی ترقی حاصل کی، AI تلاش کے میدان میں سب سے آگے ہے۔ جانیں کہ کس طرح بین اللغوی تلاش کی تبدیلی جیسے جدید ٹیکنالوجی تلاش کے تجربے کو بہتر بناتی ہیں۔
AI سرچ انجن میں بے مثال درستگی کے ساتھ انقلاب
ہم خوشی کے ساتھ اعلان کرتے ہیں کہ Felo نے SimpleQA بینچ مارک ٹیسٹ میں تمام حریفوں کو پیچھے چھوڑ دیا ہے۔ SimpleQA اوپن اے آئی کی طرف سے تیار کردہ ایک اہم ٹیسٹ ہے جو AI سوال و جواب میں حقائق کی درستگی کا اندازہ لگانے کے لیے استعمال ہوتا ہے۔ شاندار 91.2% کی درستگی کے ساتھ، Felo Pro (فاسٹ موڈ) AI سرچ انجن کے لیے ایک نئی مثال قائم کرتا ہے، جو Perplexity اور Gemini جیسے حریفوں سے نمایاں طور پر آگے ہے۔
SimpleQA بینچ مارک ٹیسٹ: AI سرچ انجن کا امتحان
SimpleQA بینچ مارک ٹیسٹ اوپن اے آئی کی طرف سے تیار کردہ ہے، جس کا مقصد AI سسٹمز کی ویب ڈیٹا کا استعمال کرتے ہوئے مختصر حقائق پر مبنی سوالات کے جوابات دینے کی صلاحیت کو جانچنا ہے۔ روایتی سرچ میٹرکس کے برعکس، SimpleQA حقائق کی درستگی اور قابل اعتماد پر زور دے کر AI سسٹمز میں غلط فہمی کے مسائل کو کم کرنے پر توجہ مرکوز کرتا ہے - جو AI کے میدان میں ایک طویل مدتی چیلنج ہے۔ Felo کی اس بینچ مارک ٹیسٹ میں شاندار کارکردگی ہماری عزم کی عکاسی کرتی ہے کہ ہم AI سرچ انجن کے لیے جدید ترین حل فراہم کرنے کے لیے پرعزم ہیں۔
ٹیسٹنگ کا طریقہ: سخت تشخیصی فریم ورک
Felo نے SimpleQA بینچ مارک ٹیسٹ کی تشخیص کے لیے ایک معیاری فریم ورک اپنایا تاکہ انصاف اور شفافیت کو یقینی بنایا جا سکے۔ اس طریقہ کار میں درج ذیل مراحل شامل ہیں:
- سوال: SimpleQA ڈیٹا سیٹ میں موجود سوالات کو براہ راست Felo کو جمع کرنا۔
- جواب کی تخلیق: Felo Pro (فاسٹ موڈ) کا استعمال کرتے ہوئے جوابات تیار کرنا۔
تمام ٹیسٹ ایک ہی سوالات کے سیٹ اور اسکورنگ کے معیار کے ساتھ کیے گئے، جو اصل SimpleQA پروٹوکول میں بیان کیے گئے ہیں، تاکہ تمام شرکاء کے درمیان منصفانہ موازنہ کو یقینی بنایا جا سکے۔
ٹیسٹ کے نتائج: Felo نے صنعت میں رہنما درستگی حاصل کی
SimpleQA بینچ مارک ٹیسٹ کے نتائج نے AI ذہین سرچ کے میدان میں Felo کی قیادت کو اجاگر کیا:
ہم نے Felo کے ٹیسٹ کے نتائج کو اوپن سورس کر دیا ہے، آپ مزید تفصیلات کے لیےیہاں جا سکتے ہیں۔
Felo کی خاص بات کیا ہے؟
Felo کی SimpleQA بینچ مارک ٹیسٹ میں شاندار کارکردگی اس کی جدید آرکیٹیکچر اور ڈیزائن کا نتیجہ ہے، اہم فرق درج ذیل ہیں:
- جدید بین اللغوی سوالات کی دوبارہ تحریر Felo ذہین طور پر اصل سوالات کو زیادہ تفصیلی ذیلی سوالات میں تقسیم کرنے کے قابل ہے، یہاں تک کہ صارف کے سوال کے لیے سب سے موزوں زبان کے ماحول کا انتخاب بھی کرتا ہے، یہ ذیلی سوالات روایتی سرچ انجن اور RAG سسٹمز کی تلاش کے لیے بہتر بنائے گئے ہیں۔ اس سے Felo کو مزید متعلقہ ویب صفحات حاصل کرنے کی اجازت ملتی ہے۔
- مخلوط انڈیکسنگ کی ٹیکنالوجی Felo نے کلیدی الفاظ اور معنیاتی مخلوط تلاش کی ٹیکنالوجی اپنائی ہے، ویب صفحات کے مواد پر ماڈل کی بنیاد پر معنیاتی کمپریشن کا اطلاق کرتے ہوئے، Felo نے غیر متعلقہ شور کو ہٹاتے ہوئے اہم حقائق کی کثافت کو برقرار رکھا ہے۔ یہ اس بات کو یقینی بناتا ہے کہ LLM (بڑے زبان ماڈل) صرف سب سے متعلقہ اور اعلیٰ معیار کی معلومات حاصل کریں۔
- تلاش پر توجہ مرکوز تربیت عمومی سرچ انجنوں کے برعکس، Felo خاص طور پر بڑے زبان ماڈل کے معلومات کو پروسیس کرنے کے منفرد طریقے کے لیے درجہ بندی کے ماڈل کو بہتر بناتا ہے، 7 LLMs تیار کیے ہیں، جس سے زیادہ درست، سیاق و سباق کے ساتھ مربوط تلاش کے نتائج فراہم کیے جا رہے ہیں۔