如何使用 OpenAI 推理模型:o1-preview/o1-Mini 模型 - 免費 AI 聊天

· 閱讀時間約 10 分鐘
Felo Search Tips Buddy
Committed to answers at your fingertips

Felo AI 聊天現在支持免費使用 O1 推理模型

在快速發展的人工智慧領域,OpenAI推出了一系列開創性的語言模型,稱為o1系列。這些模型旨在執行複雜的推理任務,使其成為開發人員和研究人員的強大工具。在這篇部落格文章中,我們將探討如何有效使用OpenAI的推理模型,重點關注它們的能力、局限性以及實施的最佳實踐。

Felo AI Chat現在支持免費使用O1推理模型。快來試試吧!

OpenAI-o1-mini-free-zw.png

理解OpenAI o1系列模型

o1系列模型與OpenAI之前的語言模型迭代不同,主要是由於其獨特的訓練方法。它們利用強化學習來增強推理能力,使其在生成回應之前能夠進行批判性思考。這種內部思維過程使模型能夠產生長鏈推理,這對於解決複雜問題特別有益。

OpenAI o1模型的主要特點

1. **高級推理**:o1模型在科學推理方面表現出色,在競爭編程和學術基準測試中取得了令人印象深刻的結果。例如,它們在Codeforces上的排名為89百分位,並在物理、生物和化學等學科中表現出博士級的準確性。

2. **兩個變體**:OpenAI通過其API提供兩個版本的o1模型:

- **o1-preview**:這是一個早期版本,旨在利用廣泛的常識來解決難題。

- **o1-mini**:一個更快且更具成本效益的變體,特別適合不需要廣泛常識的編碼、數學和科學任務。

3. **上下文窗口**:o1模型具有128,000個標記的可觀上下文窗口,允許進行廣泛的輸入和推理。然而,管理好這個上下文以避免達到標記限制是至關重要的。

開始使用OpenAI o1模型

要開始使用o1模型,開發人員可以通過OpenAI API的聊天完成端點訪問它們。

你準備好提升你的AI互動體驗了嗎?Felo AI Chat現在提供探索尖端O1推理模型的機會,完全免費!

免費試用o1推理模型。

20240913-153242.gif

OpenAI o1模型的Beta限制

需要注意的是,o1模型目前處於測試階段,這意味著有一些限制需要注意:

在測試階段,許多聊天完成API參數尚不可用。最顯著的是:

  • 模態:僅支持文本,不支持圖像。
  • 消息類型:僅支持用戶和助手消息,不支持系統消息。
  • 串流傳輸:不支持。
  • 工具:不支持工具、函數調用和響應格式參數。
  • Logprobs:不支持。
  • 其他temperaturetop_pn固定為1,而presence_penaltyfrequency_penalty固定為0
  • 助手和批次處理:這些模型不支持在助手API或批次處理API中使用。

**管理上下文窗口**:

由於上下文窗口為128,000個標記,必須有效管理該空間。每個完成都有一個最大輸出標記限制,包括推理和可見完成標記。例如:

- **o1-preview**:最多32,768個標記  

- **o1-mini**:最多65,536個標記

OpenAI o1模型的速度

為了說明這一點,我們比較了GPT-4o、o1-mini和o1-preview對一個單詞推理問題的響應。儘管GPT-4o提供了錯誤的答案,但o1-mini和o1-preview都回答正確,其中o1-mini的正確答案大約快3-5倍。

OpenAI-o1-model-speed.gif

如何在GPT-4o、o1-Mini和o1-Preview模型之間進行選擇?

**O1 Preview**:這是OpenAI O1模型的早期版本,旨在利用廣泛的常識來推理複雜問題。

**O1 Mini**:O1的一個更快且更實惠的版本,特別擅長編碼、數學和科學任務,適合不需要廣泛常識的情況。

O1模型在推理方面提供了顯著的改進,但並不打算在所有用例中取代GPT-4o。

對於需要圖像輸入、函數調用或持續快速響應時間的應用,GPT-4o和GPT-4o Mini模型仍然是最佳選擇。然而,如果您正在開發需要深度推理並且可以容忍較長響應時間的應用,O1模型可能是一個不錯的選擇。

o1-Mini和o1-Preview模型有效提示的技巧

OpenAI o1模型在使用清晰直接的提示時效果最佳。一些技術,例如少量示例提示或要求模型“逐步思考”,可能不會提高性能,甚至可能會妨礙性能。以下是一些最佳實踐:

1. **保持提示簡單直接**:當模型接收到簡短、清晰的指令時,效果最佳,而無需進行廣泛的闡述。

2. **避免鏈式思維提示**:由於這些模型內部處理推理,因此無需提示它們“逐步思考”或“解釋你的推理”。

3. **使用分隔符以提高清晰度**:使用三重引號、XML標籤或章節標題等分隔符來清晰地定義輸入的不同部分,這有助於模型正確解釋每個部分。

4. **限制檢索增強生成(RAG)中的額外上下文**:在提供額外上下文或文檔時,僅包含最相關的信息,以避免使模型的響應過於複雜。

o1-Mini和o1-Preview模型的價格。

o1 Mini和o1 Preview模型的成本計算與其他模型不同,因為它包括推理標記的額外費用。

o1-mini定價

$3.00 / 1M輸入標記

$12.00 / 1M輸出標記

o1-preview定價

$15.00 / 1M輸入標記

$60.00 / 1M輸出標記

管理o1-preview/o1-mini模型成本

為了控制o1系列模型的費用,您可以使用`max_completion_tokens`參數設置模型生成的標記總數的限制,包括推理和完成標記。

在早期模型中,`max_tokens`參數管理生成的標記數量和用戶可見的標記數量,這兩者始終相同。然而,在o1系列中,由於內部推理標記,生成的總標記數量可能超過用戶顯示的標記數量。

由於某些應用程序依賴於`max_tokens`與從API接收的標記數量匹配,o1系列引入了`max_completion_tokens`,以專門控制模型生成的標記總數,包括推理和可見完成標記。這個明確的選擇確保現有應用程序與新模型保持兼容。`max_tokens`參數繼續像以前的所有模型一樣工作。

結論

OpenAI的o1系列模型代表了人工智慧領域的重大進展,特別是在執行複雜推理任務的能力方面。通過了解它們的能力、局限性和使用最佳實踐,開發人員可以利用這些模型的力量來創建創新的應用程式。隨著OpenAI不斷完善和擴展o1系列,我們可以期待在AI驅動的推理領域出現更多令人興奮的發展。無論您是經驗豐富的開發人員還是剛剛起步,o1模型都提供了探索智能系統未來的獨特機會。祝您編碼愉快!

Felo AI Chat始終為您提供來自世界各地的先進AI模型的免費體驗。點擊這裡試試吧!