如何使用 OpenAI 推理模型:o1-preview/o1-Mini 模型 - 免费 AI 聊天

· 阅读需 10 分钟
Felo Search Tips Buddy
Committed to answers at your fingertips

Felo AI 聊天现在支持免费使用 O1 推理模型

在快速发展的人工智能领域,OpenAI推出了一系列开创性的语言模型,称为o1系列。这些模型旨在执行复杂的推理任务,使其成为开发人员和研究人员的强大工具。在这篇博客文章中,我们将探讨如何有效使用OpenAI的推理模型,重点关注它们的能力、局限性以及实施的最佳实践。

Felo AI Chat现在支持免费使用O1推理模型。快来试试吧!

OpenAI-o1-prview-zh.pngOpenAI-o1-mini-free-zh.png

理解OpenAI o1系列模型

o1系列模型与OpenAI之前的语言模型迭代不同,主要是由于其独特的训练方法。它们利用强化学习来增强推理能力,使其在生成响应之前能够进行批判性思考。这种内部思维过程使模型能够产生长链推理,这对于解决复杂问题特别有益。

OpenAI o1模型的主要特点

1. **高级推理**:o1模型在科学推理方面表现出色,在竞争编程和学术基准测试中取得了令人印象深刻的结果。例如,它们在Codeforces上的排名为89百分位,并在物理、生物和化学等学科中表现出博士级的准确性。

2. **两个变体**:OpenAI通过其API提供两个版本的o1模型:

- **o1-preview**:这是一个早期版本,旨在利用广泛的常识来解决难题。

- **o1-mini**:一个更快且更具成本效益的变体,特别适合不需要广泛常识的编码、数学和科学任务。

3. **上下文窗口**:o1模型具有128,000个标记的可观上下文窗口,允许进行广泛的输入和推理。然而,管理好这个上下文以避免达到标记限制是至关重要的。

开始使用OpenAI o1模型

要开始使用o1模型,开发人员可以通过OpenAI API的聊天完成端点访问它们。

你准备好提升你的AI互动体验了吗?Felo AI Chat现在提供探索尖端O1推理模型的机会,完全免费!

免费试用o1推理模型。

20240913-153242.gif

OpenAI o1模型的Beta限制

需要注意的是,o1模型目前处于测试阶段,这意味着有一些限制需要注意:

在测试阶段,许多聊天完成API参数尚不可用。最显著的是:

  • 模态:仅支持文本,不支持图像。
  • 消息类型:仅支持用户和助手消息,不支持系统消息。
  • 流式传输:不支持。
  • 工具:不支持工具、函数调用和响应格式参数。
  • Logprobs:不支持。
  • 其他temperaturetop_pn固定为1,而presence_penaltyfrequency_penalty固定为0
  • 助手和批处理:这些模型不支持在助手API或批处理API中使用。

**管理上下文窗口**:

由于上下文窗口为128,000个标记,必须有效管理该空间。每个完成都有一个最大输出标记限制,包括推理和可见完成标记。例如:

- **o1-preview**:最多32,768个标记
 

- **o1-mini**:最多65,536个标记

OpenAI o1模型的速度

为了说明这一点,我们比较了GPT-4o、o1-mini和o1-preview对一个单词推理问题的响应。尽管GPT-4o提供了错误的答案,但o1-mini和o1-preview都回答正确,其中o1-mini的正确答案大约快3-5倍。

OpenAI-o1-model-speed.gif

如何在GPT-4o、o1-Mini和o1-Preview模型之间进行选择?

**O1 Preview**:这是OpenAI O1模型的早期版本,旨在利用广泛的常识来推理复杂问题。

**O1 Mini**:O1的一个更快且更实惠的版本,特别擅长编码、数学和科学任务,适合不需要广泛常识的情况。

O1模型在推理方面提供了显著的改进,但并不打算在所有用例中取代GPT-4o。

对于需要图像输入、函数调用或持续快速响应时间的应用,GPT-4o和GPT-4o Mini模型仍然是最佳选择。然而,如果您正在开发需要深度推理并且可以容忍较长响应时间的应用,O1模型可能是一个不错的选择。

o1-Mini和o1-Preview模型有效提示的技巧

OpenAI o1模型在使用清晰直接的提示时效果最佳。一些技术,例如少量示例提示或要求模型“逐步思考”,可能不会提高性能,甚至可能会妨碍性能。以下是一些最佳实践:

1. **保持提示简单直接**:当模型接收到简短、清晰的指令时,效果最佳,而无需进行广泛的阐述。

2. **避免链式思维提示**:由于这些模型内部处理推理,因此无需提示它们“逐步思考”或“解释你的推理”。

3. **使用分隔符以提高清晰度**:使用三重引号、XML标签或章节标题等分隔符来清晰地定义输入的不同部分,这有助于模型正确解释每个部分。

4. **限制检索增强生成(RAG)中的额外上下文**:在提供额外上下文或文档时,仅包含最相关的信息,以避免使模型的响应过于复杂。

o1-Mini和o1-Preview模型的价格。

o1 Mini和o1 Preview模型的成本计算与其他模型不同,因为它包括推理标记的额外费用。

o1-mini定价

$3.00 / 1M输入标记

$12.00 / 1M输出标记

o1-preview定价

$15.00 / 1M输入标记

$60.00 / 1M输出标记

管理o1-preview/o1-mini模型成本

为了控制o1系列模型的费用,您可以使用`max_completion_tokens`参数设置模型生成的标记总数的限制,包括推理和完成标记。

在早期模型中,`max_tokens`参数管理生成的标记数量和用户可见的标记数量,这两者始终相同。然而,在o1系列中,由于内部推理标记,生成的总标记数量可能超过用户显示的标记数量。

由于某些应用程序依赖于`max_tokens`与从API接收的标记数量匹配,o1系列引入了`max_completion_tokens`,以专门控制模型生成的标记总数,包括推理和可见完成标记。这个明确的选择确保现有应用程序与新模型保持兼容。`max_tokens`参数继续像以前的所有模型一样工作。

结论

OpenAI的o1系列模型代表了人工智能领域的重大进展,特别是在执行复杂推理任务的能力方面。通过了解它们的能力、局限性和使用最佳实践,开发人员可以利用这些模型的力量来创建创新的应用程序。随着OpenAI不断完善和扩展o1系列,我们可以期待在AI驱动的推理领域出现更多令人兴奋的发展。无论您是经验丰富的开发人员还是刚刚起步,o1模型都提供了探索智能系统未来的独特机会。祝您编码愉快!

Felo AI Chat始终为您提供来自世界各地的先进AI模型的免费体验。点击这里试试吧!