Skip to main content

Claude Opus 4.8 เปิดตัวแล้ว: โมเดลที่ทรงพลังที่สุดจาก Anthropic จนถึงตอนนี้

· อ่าน 3 นาที
Felo Search Tips Buddy
Committed to answers at your fingertips

Anthropic เพิ่งเปิดตัว Claude Opus 4.8 — เร็วขึ้น ซื่อสัตย์ขึ้น และเก่งขึ้นในงานเชิงตัวแทน (agentic tasks) มาดูกันว่ามีอะไรใหม่บ้างและเหตุใดจึงสำคัญสำหรับนักพัฒนา

Claude Opus 4.8 Released cover image showing headline and key highlights

Anthropic เปิดตัว Claude Opus 4.8 ในสัปดาห์นี้ ซึ่งเป็นโมเดลที่ทรงพลังที่สุดที่ปล่อยให้ใช้งานได้ทั่วไป โดยพัฒนาต่อจาก Opus 4.7 ทั้งในด้านการเขียนโค้ด การให้เหตุผล งานเชิงตัวแทน และความซื่อสัตย์ ราคายังคงเดิม: 5 ดอลลาร์ต่อหนึ่งล้านโทเคนอินพุต และ 25 ดอลลาร์ต่อหนึ่งล้านโทเคนเอาต์พุต

ต่อไปนี้คือสิ่งที่เปลี่ยนแปลง และเหตุผลที่สำคัญสำหรับนักพัฒนาที่สร้างบนแพลตฟอร์มนี้


มีอะไรเปลี่ยนไปจาก Opus 4.7?

ต่อไปนี้คือสิ่งที่เปลี่ยนแปลงจริง ๆ:

1. การตัดสินใจและความซื่อสัตย์ที่ดีขึ้น

Opus 4.8 มีแนวโน้มที่จะไม่กล่าวอ้างโดยไม่มีข้อมูลสนับสนุน หรือปล่อยให้ข้อบกพร่องในโค้ดหลุดไปโดยไม่ตรวจพบมากกว่ารุ่นก่อน ผลการทดสอบของ Anthropic แสดงว่า มันมีแนวโน้มให้บั๊กผ่านไปโดยไม่แจ้งเตือนน้อยกว่ารุ่นก่อนถึง 4 เท่า การปรับปรุงแบบนี้มีความสำคัญมากเมื่อคุณต้องพึ่งโมเดลให้ทำงานอย่างอัตโนมัติ

ผู้ทดสอบกลุ่มแรก ๆ รายงานว่า มันถามคำถามได้ตรงจุด จับความผิดพลาดของตัวเองได้ และแสดงข้อโต้แย้งเมื่อแผนการไม่สมเหตุสมผล

2. ประสิทธิภาพเชิงตัวแทน (Agentic Performance) ที่แข็งแกร่งขึ้น

Benchmark comparison chart showing Claude Opus 4.8 vs Opus 4.7 vs GPT-5.5 across Super-Agent, CursorBench, Online-Mind2Web, and Legal Agent benchmarks

Opus 4.8 เป็นโมเดลเดียวที่ทำทุกเคสจนจบในฐานข้อมูล Super-Agent ของ Anthropic เอาชนะทั้งรุ่นก่อนหน้าและ GPT-5.5 ที่ต้นทุนเท่ากัน บน CursorBench มันทำได้ดีกว่าทุกรุ่นก่อนหน้าของ Opus ในทุกระดับความพยายาม โดยใช้ขั้นตอนเรียกใช้เครื่องมือน้อยลงสำหรับความฉลาดในระดับเดียวกัน

นอกจากนี้ มันยังเป็นโมเดลด้านการใช้คอมพิวเตอร์และเบราว์เซอร์ตัวแทนที่แข็งแกร่งที่สุดที่ Anthropic ทดสอบ โดยได้คะแนน 84% บน Online-Mind2Web

3. การเรียกใช้เครื่องมือที่เร็วและมีประสิทธิภาพยิ่งขึ้น

โมเดลนี้มีแนวโน้มที่จะไม่ข้ามการเรียกใช้เครื่องมือที่งานต้องใช้ ซึ่งเคยเป็นปัญหาใน Opus 4.7 ร่องรอยการทำงานแบบตัวแทนที่ยาวนานก็มีแนวโน้มไม่หลุดจากงานหลังการบีบอัดบริบท

4. การคิดแบบ Adaptive ที่ปรับได้จริง

เมื่อเปิดใช้งานโหมด adaptive thinking, Opus 4.8 จะตัดสินใจในแต่ละรอบว่าจำเป็นต้องให้เหตุผลหรือไม่ การค้นหาง่าย ๆ จะได้คำตอบโดยตรง ส่วนปัญหาซับซ้อนจะได้รับการให้เหตุผลก่อนคำตอบ ใช้โทเคนน้อยลงเมื่อเทียบกับ Opus 4.7


ฟีเจอร์ใหม่ที่น่าสนใจ

ควบคุมระดับความพยายาม — มีให้ในทุกแผน

มีตัวควบคุมใหม่อยู่ข้างตัวเลือกโมเดล ให้ผู้ใช้เลือกได้ว่า Claude จะใช้ความพยายามมากน้อยเพียงใดในการตอบกลับ ค่าเริ่มต้นของ Opus 4.8 คือ high โดยมีตัวเลือก extra และ max สำหรับงานที่ยากกว่า ระบบจำกัดอัตราใน Claude Code ถูกขยายเพื่อรองรับการใช้โทเคนที่มากขึ้น

โหมดเร็ว — ความเร็วเพิ่ม 2.5 เท่า ราคาถูกลง

โหมดเร็ว (Fast mode) พร้อมใช้งานแล้วสำหรับ Opus 4.8 ในฐานะเวอร์ชันพรีวิวเพื่อการวิจัยบน Claude API โดยให้ผลลัพธ์ที่มี ความเร็วในการสร้างโทเคนเอาต์พุตสูงขึ้นถึง 2.5 เท่า และมีต้นทุนต่ำกว่ารุ่นก่อนถึงสามเท่า

ข้อความระบบระหว่างการสนทนา

Messages API ตอนนี้รองรับการเพิ่ม role: "system" ในอาร์เรย์ข้อความ คุณสามารถอัปเดตคำแนะนำของ Claude ระหว่างงานได้โดยไม่ทำให้ prompt cache เสียประโยชน์ เหมาะสำหรับเมื่อต้องเปลี่ยนสิทธิ์หรือบริบทระหว่างลูปเชิงตัวแทน

ลดขนาดขั้นต่ำของ Prompt Cache

ความยาวขั้นต่ำของพรอมต์ที่สามารถแคชได้ลดลงเหลือเพียง 1,024 โทเคน พรอมต์ที่สั้นเกินไปใน Opus 4.7 ตอนนี้สามารถสร้างแคชได้โดยไม่ต้องแก้ไขโค้ด


การทดสอบในสภาพแวดล้อมจริง

การทดสอบประสิทธิภาพของ Opus 4.8
Super-Agentทำครบทุกเคสตั้งแต่ต้นจนจบ (โมเดลเดียวที่ทำได้)
CursorBenchทำได้ดีกว่าทุกรุ่นก่อนหน้าของ Opus ในทุกระดับ
Online-Mind2Web84% (โมเดลที่แข็งแกร่งที่สุดในการทดสอบ)
Legal Agent Benchmarkได้คะแนนสูงสุด และเป็นโมเดลแรกที่ทะลุ 10% โดยรวม

Conceptual illustration of an AI agent autonomously working on a codebase with tools and workflow indicators

Opus 4.8 แข็งแกร่งที่สุดในงานที่ต้องการความอิสระระยะยาว — เช่น ตัวแทนเขียนโค้ด ตัวแทนวิจัย งานด้านกฎหมาย และการจัดการความรู้ภายในองค์กร


ราคา — ไม่เปลี่ยนจาก Opus 4.7

โหมดอินพุตเอาต์พุต
มาตรฐาน$5 / 1M tokens$25 / 1M tokens
เร็ว$10 / 1M tokens$50 / 1M tokens

ราคายังคงเท่า Opus 4.7 แต่มีประสิทธิภาพดีกว่า รหัสโมเดลใน API คือ claude-opus-4-8 รองรับขนาดหน้าต่างบริบท 1 ล้านโทเคน และเอาต์พุตสูงสุด 128k โทเคน


สิ่งที่จะตามมา: โมเดลระดับ Mythos

Anthropic ยังได้บอกใบ้ถึงโมเดลระดับใหม่ที่ “ฉลาดกว่า Opus” องค์กรจำนวนน้อยกำลังใช้งาน Claude Mythos Preview สำหรับงานด้านความปลอดภัยทางไซเบอร์ผ่านโครงการ Project Glasswing บริษัทมีแผนจะเปิดให้ลูกค้าทุกคนเข้าถึงโมเดลระดับ Mythos ในอีกไม่กี่สัปดาห์ข้างหน้า เมื่อระบบความปลอดภัยพร้อมแล้ว


ทำไมความหลากหลายของโมเดลจึงสำคัญ

ทุกวันนี้ โมเดล AI ใหม่ออกมาทุกสัปดาห์ สำหรับนักพัฒนาที่สร้างบนโมเดลเหล่านี้ คำถามจริง ๆ ไม่ใช่ว่า “โมเดลไหนดีที่สุด” แต่คือ “โมเดลไหนเหมาะกับงานไหน” และ “จะสลับระหว่างโมเดลได้อย่างไรโดยไม่ยุ่งยาก”

นั่นคือสิ่งที่ Felo AI เข้ามาช่วยได้ นอกจากระบบค้นหาที่ขับเคลื่อนด้วย AI ซึ่งใช้โมเดลล้ำสมัยในการตอบคำถามแบบเรียลไทม์แล้ว Felo ยังมี LLM Playground ที่ให้คุณเรียกใช้ ทดสอบ และเปรียบเทียบผลลัพธ์จากโมเดลชั้นนำหลากหลายได้ในที่เดียว ไม่ต้องสลับ API key หรือแดชบอร์ดให้ยุ่งยาก แค่เลือกโมเดล รันพรอมต์ แล้วดูผลลัพธ์ได้เลย

หากคุณกำลังประเมินว่าโมเดลไหนเหมาะกับเวิร์กโฟลว์ของคุณ หรือแค่อยากรู้ว่ามีอะไรออกใหม่บ้าง การมีทุกโมเดลอยู่ในอินเทอร์เฟซเดียว ทำให้กระบวนการเปรียบเทียบง่ายขึ้นมาก


ลองใช้ Felo AI ฟรี → https://felo.ai


บทความนี้มีให้อ่านในภาษาต่อไปนี้ด้วย: English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, Español, বাংলা and Português