🙆‍♀️Felo AI pencapaian terobosan: Akurasi 91,2% dalam pengujian benchmark SimpleQA, memimpin standar baru pencarian AI

February 11, 2025 · 3 menit dibaca

Committed to answers at your fingertips

Felo AI telah mencapai kemajuan terobosan dalam pengujian benchmark SimpleQA, dengan akurasi 91,2% memimpin bidang pencarian AI. Pelajari bagaimana teknologi inovatif seperti penulisan ulang kueri lintas bahasa meningkatkan pengalaman pencarian.

Inovasi Mesin Pencari AI dengan Akurasi yang Tak Tertandingi

Kami dengan senang hati mengumumkan bahwa Felo telah melampaui semua pesaing dalam kinerja terbaru di pengujian benchmark SimpleQA. SimpleQA adalah tes kunci yang dikembangkan oleh OpenAI untuk mengevaluasi akurasi fakta dalam pertanyaan AI. Dengan akurasi yang mengesankan sebesar 91,2%, Felo Pro (mode cepat) telah menetapkan tolok ukur baru untuk mesin pencari AI, secara signifikan melampaui pesaing seperti Perplexity dan Gemini.

Pengujian Benchmark SimpleQA: Batu Uji untuk Mesin Pencari AI

SimpleQA adalah pengujian benchmark yang dikembangkan oleh OpenAI, bertujuan untuk mengukur efektivitas sistem AI dalam menjawab pertanyaan faktual yang ringkas menggunakan data dari web. Berbeda dengan metrik pencarian tradisional, SimpleQA menekankan pada akurasi dan keandalan fakta, dengan fokus pada pengurangan masalah ilusi dalam sistem AI—tantangan yang telah ada lama di bidang AI. Kinerja luar biasa Felo dalam pengujian benchmark ini menunjukkan komitmen kami untuk menyediakan solusi mutakhir bagi mesin pencari AI.

Metode Pengujian: Kerangka Evaluasi yang Ketat

Felo menggunakan kerangka standar untuk evaluasi pengujian benchmark SimpleQA, untuk memastikan keadilan dan transparansi. Metode ini mencakup langkah-langkah berikut:

Pertanyaan: Mengajukan pertanyaan dari dataset SimpleQA langsung kepada Felo.
Generasi Jawaban: Menggunakan Felo Pro (mode cepat) untuk menghasilkan jawaban.

Semua pengujian dilakukan dengan menggunakan kumpulan pertanyaan dan kriteria penilaian yang sama, yang didefinisikan dalam protokol SimpleQA asli, untuk memastikan perbandingan yang adil di antara semua peserta.

Hasil Pengujian: Felo Mencapai Akurasi Terdepan di Industri

Hasil pengujian benchmark SimpleQA menyoroti posisi terdepan Felo di bidang pencarian cerdas AI:

Hasil benchmark SimpleQA menyoroti posisi kepemimpinan Felo di bidang pencarian cerdas AI.PNG

Kami telah membuka sumber hasil pengujian Felo, Anda dapat mengunjungi sini untuk informasi lebih lanjut.

Apa yang Membuat Felo Unik?

Felo telah mencapai kinerja luar biasa dalam pengujian benchmark SimpleQA berkat arsitektur dan desain inovatifnya, dengan perbedaan kunci sebagai berikut:

Pemrosesan Ulang Pertanyaan Lintas Bahasa yang Canggih Felo mampu secara cerdas memecah pertanyaan asli menjadi sub-pertanyaan yang lebih terperinci, bahkan memilih lingkungan bahasa yang paling sesuai untuk pencarian berdasarkan pertanyaan pengguna, yang dioptimalkan untuk pencarian di mesin pencari tradisional dan sistem RAG. Ini memungkinkan Felo untuk mendapatkan lebih banyak halaman web yang relevan.
Teknologi Indeks Campuran Felo menggunakan teknologi pencarian campuran kata kunci dan semantik, dengan menerapkan kompresi semantik yang peka terhadap model pada konten halaman web, Felo menghilangkan kebisingan yang tidak relevan sambil mempertahankan kepadatan fakta yang penting. Ini memastikan bahwa LLM (model bahasa besar) hanya menerima informasi yang paling relevan dan berkualitas tinggi.
Pelatihan yang Fokus pada Pencarian Berbeda dengan mesin pencari umum, Felo secara khusus mengoptimalkan model peringkat untuk cara unik model bahasa besar dalam memproses informasi, mengembangkan 7 LLM sendiri, sehingga memberikan hasil pencarian yang lebih akurat dan kontekstual.

Inovasi Mesin Pencari AI dengan Akurasi yang Tak Tertandingi​

Pengujian Benchmark SimpleQA: Batu Uji untuk Mesin Pencari AI​

Metode Pengujian: Kerangka Evaluasi yang Ketat​

Hasil Pengujian: Felo Mencapai Akurasi Terdepan di Industri​

Apa yang Membuat Felo Unik?​

Inovasi Mesin Pencari AI dengan Akurasi yang Tak Tertandingi

Pengujian Benchmark SimpleQA: Batu Uji untuk Mesin Pencari AI

Metode Pengujian: Kerangka Evaluasi yang Ketat

Hasil Pengujian: Felo Mencapai Akurasi Terdepan di Industri

Apa yang Membuat Felo Unik?