Cómo usar los modelos de razonamiento de OpenAI: modelos o1-preview/o1-Mini - Chat de IA gratuito

· 7 min de lectura
Felo Search Tips Buddy
Committed to answers at your fingertips

El chat de Felo IA ahora admite el uso gratuito del modelo de razonamiento O1

En el paisaje de la inteligencia artificial que evoluciona rápidamente, OpenAI ha introducido una serie innovadora de modelos de lenguaje grandes conocidos como la serie o1. Estos modelos están diseñados para realizar tareas de razonamiento complejas, lo que los convierte en una herramienta poderosa tanto para desarrolladores como para investigadores. En esta publicación de blog, exploraremos cómo utilizar de manera efectiva los modelos de razonamiento de OpenAI, centrándonos en sus capacidades, limitaciones y mejores prácticas para su implementación.

¡Felo AI Chat ahora admite el uso gratuito del modelo de razonamiento O1. Ve a probarlo!!

OpenAI-o1-prview-1.pngOpenAI-o1-mini-free-2.png

Entendiendo los Modelos de la Serie OpenAI o1

Los modelos de la serie o1 son distintos de las iteraciones anteriores de los modelos de lenguaje de OpenAI debido a su metodología de entrenamiento única. Utilizan el aprendizaje por refuerzo para mejorar sus capacidades de razonamiento, lo que les permite pensar críticamente antes de generar respuestas. Este proceso de pensamiento interno permite a los modelos producir una larga cadena de razonamiento, lo que es particularmente beneficioso para abordar problemas complejos.

Características Clave de los Modelos OpenAI o1

1. **Razonamiento Avanzado**: Los modelos o1 sobresalen en el razonamiento científico, logrando resultados impresionantes en programación competitiva y benchmarks académicos. Por ejemplo, se clasifican en el percentil 89 en Codeforces y han demostrado precisión a nivel de doctorado en materias como física, biología y química.

2. **Dos Variantes**: OpenAI ofrece dos versiones de los modelos o1 a través de su API:
 

- **o1-preview**: Esta es una versión temprana diseñada para abordar problemas difíciles utilizando un amplio conocimiento general.
 

- **o1-mini**: Una variante más rápida y rentable, particularmente adecuada para tareas de codificación, matemáticas y ciencias que no requieren un amplio conocimiento general.

3. **Ventana de Contexto**: Los modelos o1 vienen con una ventana de contexto sustancial de 128,000 tokens, lo que permite una entrada y razonamiento extensos. Sin embargo, es crucial gestionar este contexto de manera efectiva para evitar alcanzar los límites de tokens.

Comenzando con los Modelos OpenAI o1

Para comenzar a utilizar los modelos o1, los desarrolladores pueden acceder a ellos a través del endpoint de completaciones de chat de la API de OpenAI.

¿Estás listo para elevar tu experiencia de interacción con la IA? ¡Felo AI Chat ahora ofrece la oportunidad de explorar el modelo de razonamiento O1 de vanguardia sin costo alguno!

Ve por una prueba gratuita del modelo de razonamiento o1.

20240913-153242.gif

Limitaciones Beta de los Modelos OpenAI o1

Es importante tener en cuenta que los modelos o1 están actualmente en beta, lo que significa que hay algunas limitaciones a tener en cuenta:

Durante la fase beta, muchos parámetros de la API de completación de chat aún no están disponibles. Más notablemente:

  • Modalidades: solo texto, las imágenes no son compatibles.
  • Tipos de mensajes: solo mensajes de usuario y asistente, los mensajes del sistema no son compatibles.
  • Streaming: no soportado.
  • Herramientas: herramientas, llamadas a funciones y parámetros de formato de respuesta no son compatibles.
  • Logprobs: no soportado.
  • Otros: temperature, top_p y n están fijos en 1, mientras que presence_penalty y frequency_penalty están fijos en 0.
  • Asistentes y Lotes: estos modelos no son compatibles con la API de Asistentes o la API de Lotes.

**Gestionando la Ventana de Contexto**:

Con una ventana de contexto de 128,000 tokens, es esencial gestionar el espacio de manera efectiva. Cada completación tiene un límite máximo de tokens de salida, que incluye tanto los tokens de razonamiento como los tokens de completación visibles. Por ejemplo:

- **o1-preview**: Hasta 32,768 tokens
 

- **o1-mini**: Hasta 65,536 tokens

Velocidad de los Modelos OpenAI o1

Para ilustrar, comparamos las respuestas de GPT-4o, o1-mini y o1-preview a una pregunta de razonamiento de palabras. Aunque GPT-4o proporcionó una respuesta incorrecta, tanto o1-mini como o1-preview respondieron correctamente, con o1-mini llegando a la respuesta correcta aproximadamente 3-5 veces más rápido.

OpenAI-o1-model-speed.gif

¿Cómo elegir entre los modelos GPT-4o, O1 Mini y O1 Preview?

**O1 Preview**: Esta es una versión temprana del modelo O1 de OpenAI, diseñada para aprovechar un amplio conocimiento general para razonar a través de problemas complejos.

**O1 Mini**: Una versión más rápida y asequible de O1, particularmente buena en tareas de codificación, matemáticas y ciencias, ideal para situaciones que no requieren un amplio conocimiento general.

Los modelos O1 ofrecen mejoras significativas en razonamiento, pero no están destinados a reemplazar a GPT-4o en todos los casos de uso.

Para aplicaciones que necesitan entrada de imagen, llamadas a funciones o tiempos de respuesta consistentemente rápidos, los modelos GPT-4o y GPT-4o Mini siguen siendo las mejores opciones. Sin embargo, si estás desarrollando aplicaciones que requieren un razonamiento profundo y pueden acomodar tiempos de respuesta más largos, los modelos O1 podrían ser una gran opción.

Consejos para la Efectividad de los Modelos O1 Mini y O1 Preview

Los Modelos OpenAI o1 funcionan mejor con indicaciones claras y directas. Algunas técnicas, como el prompting de pocos ejemplos o pedirle al modelo que "piense paso a paso", pueden no mejorar el rendimiento e incluso pueden obstaculizarlo. Aquí hay algunas mejores prácticas a seguir:

1. **Mantén las Indicaciones Simples y Directas**: Los modelos son más efectivos cuando se les dan instrucciones breves y claras sin necesidad de una extensa elaboración.

2. **Evita Indicaciones de Cadena de Pensamiento**: Dado que estos modelos manejan el razonamiento internamente, no hay necesidad de pedirles que "piensen paso a paso" o "expliquen su razonamiento".

3. **Usa Delimitadores para Claridad**: Emplea delimitadores como comillas triples, etiquetas XML o títulos de sección para definir claramente las diferentes partes de la entrada, lo que ayuda al modelo a interpretar cada sección correctamente.

4. **Limita el Contexto Adicional en la Generación Aumentada por Recuperación (RAG)**: Al proporcionar contexto o documentos adicionales, incluye solo la información más pertinente para evitar complicar la respuesta del modelo.

Precios para los modelos o1 Mini y 1 Preview.

El cálculo de costos para los modelos o1 Mini y 1 Preview es diferente al de otros modelos, ya que incluye un costo adicional por los tokens de razonamiento.

Precios de o1-mini

$3.00 / 1M tokens de entrada
 

$12.00 / 1M tokens de salida

Precios de o1-preview

$15.00 / 1M tokens de entrada
 

$60.00 / 1M tokens de salida

Gestionando los Costos del Modelo o1-preview/ o1-mini

Para controlar los gastos con los modelos de la serie o1, puedes usar el parámetro `max_completion_tokens` para establecer un límite en el número total de tokens que el modelo genera, abarcando tanto los tokens de razonamiento como los tokens de completación.

En modelos anteriores, el parámetro `max_tokens` gestionaba tanto el número de tokens generados como el número de tokens visibles para el usuario, que siempre eran los mismos. Sin embargo, con la serie o1, el total de tokens generados puede superar el número de tokens mostrados al usuario debido a los tokens de razonamiento internos.

Dado que algunas aplicaciones dependen de que `max_tokens` coincida con el número de tokens recibidos de la API, la serie o1 introduce `max_completion_tokens` para controlar específicamente el número total de tokens producidos por el modelo, incluidos tanto los tokens de razonamiento como los tokens de completación visibles. Esta opción explícita garantiza que las aplicaciones existentes sigan siendo compatibles con los nuevos modelos. El parámetro `max_tokens` continúa funcionando como lo hacía para todos los modelos anteriores.

Conclusión

Los modelos de la serie o1 de OpenAI representan un avance significativo en el campo de la inteligencia artificial, particularmente en su capacidad para realizar tareas de razonamiento complejas. Al comprender sus capacidades, limitaciones y mejores prácticas para su uso, los desarrolladores pueden aprovechar el poder de estos modelos para crear aplicaciones innovadoras. A medida que OpenAI continúa refinando y expandiendo la serie o1, podemos esperar desarrollos aún más emocionantes en el ámbito del razonamiento impulsado por IA. Ya seas un desarrollador experimentado o estés comenzando, los modelos o1 ofrecen una oportunidad única para explorar el futuro de los sistemas inteligentes. ¡Feliz codificación!

Felo AI Chat siempre te ofrece una experiencia gratuita con modelos de IA avanzados de todo el mundo. ¡Haz clic aquí para probarlo!