🙆‍♀️Conquista revolucionária da Felo AI: precisão de 91,2% no teste de benchmark SimpleQA, estabelecendo novos padrões para a busca em IA

February 11, 2025 · 3 minutos de leitura

Committed to answers at your fingertips

A Felo AI alcançou um avanço revolucionário no teste de benchmark SimpleQA, liderando o campo da busca em IA com uma precisão de 91,2%. Descubra como tecnologias inovadoras, como a reescrita de consultas entre idiomas, melhoram a experiência de busca.

Inovando o mecanismo de busca AI com precisão incomparável

Estamos empolgados em anunciar que Felo superou todos os concorrentes em seu desempenho mais recente no benchmark SimpleQA. O SimpleQA foi desenvolvido pela OpenAI para avaliar a precisão factual em perguntas e respostas de IA. Com uma impressionante 91,2% de precisão, o Felo Pro (modo rápido) estabelece um novo padrão para mecanismos de busca AI, superando significativamente concorrentes como Perplexity e Gemini.

Benchmark SimpleQA: A pedra de toque para mecanismos de busca AI

SimpleQA é um benchmark desenvolvido pela OpenAI, projetado para medir a eficácia dos sistemas de IA em responder a perguntas factuais concisas utilizando dados da web. Ao contrário das métricas de busca tradicionais, o SimpleQA foca na precisão e confiabilidade dos fatos, enfatizando a redução de problemas de alucinação em sistemas de IA — um desafio de longa data no campo da IA. O desempenho excepcional do Felo neste benchmark demonstra nosso compromisso em fornecer soluções de ponta para mecanismos de busca AI.

Método de teste: Um quadro de avaliação rigoroso

A avaliação do Felo no benchmark SimpleQA utilizou um quadro padronizado para garantir equidade e transparência. O método inclui os seguintes passos:

Pergunta: Submeter diretamente as perguntas do conjunto de dados SimpleQA ao Felo.
Geração de respostas: Utilizar o Felo Pro (modo rápido) para gerar respostas.

Todos os testes foram realizados utilizando o mesmo conjunto de perguntas e critérios de pontuação, que estão definidos no protocolo original do SimpleQA, garantindo uma comparação justa entre todos os participantes.

Resultados do teste: Felo alcança uma precisão líder na indústria

Os resultados do benchmark SimpleQA destacam a posição de liderança do Felo no campo da busca inteligente em IA:

Os resultados do benchmark SimpleQA destacam a posição de liderança do Felo no campo da busca inteligente em IA.PNG

Nós tornamos os resultados dos testes do Felo de código aberto, você pode acessar aqui para mais detalhes.

O que torna o Felo único?

Felo deve seu desempenho excepcional no benchmark SimpleQA à sua arquitetura e design inovadores, com diferenças chave incluindo:

Reescrita de consultas avançada entre idiomas O Felo é capaz de dividir inteligentemente a consulta original em subconsultas mais granulares, escolhendo até mesmo o ambiente linguístico mais adequado para a busca com base nas perguntas dos usuários, otimizando essas subconsultas para busca em mecanismos tradicionais e sistemas RAG. Isso permite que o Felo obtenha mais páginas relevantes.
Tecnologia de índice híbrido O Felo utiliza uma tecnologia de busca híbrida que combina palavras-chave e semântica, aplicando compressão semântica sensível ao modelo ao conteúdo da web, permitindo que o Felo remova ruídos irrelevantes enquanto preserva a densidade factual crítica. Isso garante que o LLM (modelo de linguagem grande) receba apenas as informações mais relevantes e de alta qualidade.
Treinamento focado em busca Ao contrário dos mecanismos de busca genéricos, o Felo é ajustado especificamente para a maneira única como os modelos de linguagem grandes processam informações, desenvolvendo internamente 7 LLMs, proporcionando resultados de busca mais precisos e contextualizados.

Inovando o mecanismo de busca AI com precisão incomparável​

Benchmark SimpleQA: A pedra de toque para mecanismos de busca AI​

Método de teste: Um quadro de avaliação rigoroso​

Resultados do teste: Felo alcança uma precisão líder na indústria​

O que torna o Felo único?​

Inovando o mecanismo de busca AI com precisão incomparável

Benchmark SimpleQA: A pedra de toque para mecanismos de busca AI

Método de teste: Um quadro de avaliação rigoroso

Resultados do teste: Felo alcança uma precisão líder na indústria

O que torna o Felo único?