Skip to main content

🙆‍♀️Logro revolucionario de Felo AI: tasa de precisión del 91.2% en la prueba de referencia SimpleQA, estableciendo un nuevo estándar en la búsqueda de IA

· 4 min de lectura
Felo Search Tips Buddy
Committed to answers at your fingertips

Felo AI ha logrado un avance revolucionario en la prueba de referencia SimpleQA, liderando el campo de la búsqueda de IA con una tasa de precisión del 91.2%. Descubre cómo tecnologías innovadoras como la reescritura de consultas multilingües mejoran la experiencia de búsqueda.

Revolucionando los motores de búsqueda de IA con una precisión inigualable

Nos complace anunciar que Felo ha superado a todos sus competidores en el último rendimiento de la prueba de referencia SimpleQA. SimpleQA es una prueba clave desarrollada por OpenAI para evaluar la precisión fáctica en las respuestas de IA. Con una impresionante 91.2% de precisión, Felo Pro (modo rápido) establece un nuevo estándar para los motores de búsqueda de IA, superando significativamente a competidores como Perplexity y Gemini.

Prueba de referencia SimpleQA: la piedra de toque de los motores de búsqueda de IA

SimpleQA es una prueba de referencia desarrollada por OpenAI, diseñada para medir la efectividad de los sistemas de IA al utilizar datos de la web para responder preguntas fácticas de manera concisa. A diferencia de las métricas de búsqueda tradicionales, SimpleQA se centra en reducir los problemas de alucinación en los sistemas de IA, enfatizando la precisión y fiabilidad de los hechos, un desafío persistente en el campo de la IA. El rendimiento excepcional de Felo en esta prueba de referencia demuestra nuestro compromiso de proporcionar soluciones de vanguardia para motores de búsqueda de IA.

Método de prueba: un marco de evaluación riguroso

La evaluación de Felo en la prueba de referencia SimpleQA utiliza un marco estandarizado para garantizar la equidad y la transparencia. Este método incluye los siguientes pasos:

  • Preguntas: Se envían directamente a Felo las preguntas del conjunto de datos de SimpleQA.
  • Generación de respuestas: Se generan respuestas utilizando Felo Pro (modo rápido).

Todas las pruebas se realizan utilizando el mismo conjunto de preguntas y criterios de puntuación, que están definidos en el protocolo original de SimpleQA, asegurando una comparación justa entre todos los participantes.

Resultados de la prueba: Felo alcanza una precisión líder en la industria

Los resultados de la prueba de referencia SimpleQA destacan la posición de liderazgo de Felo en el campo de la búsqueda inteligente de IA:

Los resultados de la prueba de referencia SimpleQA destacan la posición de liderazgo de Felo en el campo de la búsqueda inteligente de IA.PNG

Hemos hecho públicos los resultados de las pruebas de Felo, y puede visitar aquí para obtener más detalles.

¿Qué hace que Felo sea único?

Felo ha logrado un rendimiento excepcional en la prueba de referencia SimpleQA gracias a su arquitectura y diseño innovadores, con diferencias clave que incluyen:

  1. Reescritura de consultas multilingües avanzada Felo puede descomponer inteligentemente la consulta original en subconsultas más detalladas, eligiendo incluso el entorno lingüístico más adecuado para la búsqueda en función de la pregunta del usuario, optimizando estas subconsultas para la recuperación en motores de búsqueda tradicionales y sistemas RAG. Esto permite a Felo obtener más páginas web relevantes.
  2. Tecnología de índice híbrido Felo utiliza una tecnología de búsqueda híbrida de palabras clave y semántica, aplicando compresión semántica consciente del modelo al contenido de las páginas web, lo que permite a Felo eliminar el ruido irrelevante mientras retiene la densidad fáctica clave. Esto asegura que el LLM (modelo de lenguaje grande) reciba solo la información más relevante y de alta calidad.
  3. Entrenamiento enfocado en la recuperación A diferencia de los motores de búsqueda generales, Felo ajusta su modelo de clasificación específicamente para la forma única en que los modelos de lenguaje grandes procesan la información, desarrollando 7 LLM propios para proporcionar resultados de búsqueda más precisos y contextualizados.