แปลงวิดีโอ YouTube ให้เป็นบทถอดเสียงที่ค้นหาได้และเอกสารงาน
ดึงคำบรรยายและเวลาจากวิดีโอ YouTube ใด ๆ แล้วนำเนื้อหานั้นมาใช้ซ้ำสำหรับสรุป รายงานการประชุม การวิจัย และเอกสาร Markdown — ทั้งหมดภายใน Google Antigravity

YouTube มีความรู้มากมายมหาศาล — การสาธิตผลิตภัณฑ์ การบรรยาย การเรียนการสอน การฝึกอบรม การประชุมทีมที่บันทึกไว้เพื่อดูภายหลัง แต่ความรู้นั้นกลับถูกซ่อนอยู่ในวิดีโอ คุณไม่สามารถค้นหาภายในวิดีโอได้ คุณไม่สามารถอ้างอิงเวลาช่วงหนึ่งในการบันทึกรายงานการประชุมโดยไม่ดูซ้ำ และคุณไม่สามารถนำวิดีโอเข้าสู่กระบวนการวิจัยของคุณได้เหมือนกับบทความ
จนถึงตอนนี้
Felo YouTube Subtitling skill สำหรับ Google Antigravity จะเปลี่ยนวิดีโอ YouTube ใด ๆ ให้กลายเป็นบทถอดเสียงที่ค้นหาได้พร้อมเวลา จากนั้นให้คุณนำเนื้อหานั้นกลับมาใช้ใหม่สำหรับสรุป รายงานการประชุม ข้อมูลประกอบการวิจัย และเอกสาร Markdown ที่มีโครงสร้าง เพียงวางโฟลเดอร์ของสกิลไว้ในไดเรกทอรี .agent/skills/ และตัวจัดการเอเจนต์ของ Antigravity จะจัดการทุกอย่างให้อัตโนมัติ — โดยไม่ต้องใช้คำสั่งพิเศษหรือการแยกข้อมูลด้วยมือ
ปัญหา: วิดีโอคือกล่องดำ
ถ้าคุณเคยพยายามหาช่วงที่เฉพาะเจาะจงในวิดีโอเดโมสินค้ายาว 45 นาที คุณคงรู้ดีว่ามันยุ่งยากแค่ไหน ต้องกรอไปมา ดูซ้ำหลายรอบ อยากแค่กด Ctrl+F ค้นหาคำที่จำได้ก็ยังทำไม่ได้
ปัญหาไม่ได้อยู่ที่ตัววิดีโอเอง แต่เพราะวิดีโอไม่มี “ชั้นข้อความ” ที่สามารถค้นหาได้ เครื่องมือค้นหาสามารถจัดทำดัชนีคำอธิบายหรือความคิดเห็นของ YouTube ได้เท่านั้น แต่ไม่สามารถจัดทำดัชนีสิ่งที่ พูดจริง ๆ ในวิดีโอได้ — อย่างน้อยก็ไม่ใช่ในแบบที่มีเวลาที่แม่นยำและข้อความที่นำกลับมาใช้ได้
สำหรับทีมที่ใช้ Agent Manager ของ Google Antigravity ช่องว่างนี้ชัดเจนยิ่งขึ้น เอเจนต์ของคุณสามารถวิจัยเว็บ สกัดหน้าเพจ สร้างสไลด์ และเขียนเอกสารได้ แต่ถ้าไม่สามารถประมวลผลเนื้อหาวิดีโอได้ ส่วนนั้นของฐานความรู้ทีมจะยังคงเข้าถึงไม่ได้
Felo YouTube Subtitling skill จะช่วยปิดช่องว่างนั้น

สกิลนี้ทำอะไรได้บ้าง
ขั้นตอนที่ 1: ดึงคำบรรยายและเวลา
เมื่อระบุ URL ของ YouTube สกิลจะดึงคำบรรยายของวิดีโอ (ทั้งแบบอัตโนมัติและที่อัปโหลดโดยผู้สร้างเมื่อมี) พร้อมเวลาที่แม่นยำ ผลลัพธ์จะเป็นบทถอดเสียงแบบมีโครงสร้างที่จับคู่ทุกประโยคกับช่วงเวลาที่ตรงในวิดีโอ
นี่ไม่ใช่การประมาณคร่าว ๆ เวลาที่ได้จะตรงกับสิ่งที่พูดจริงในวิดีโอ ดังนั้นเมื่ออ้างถึงจุดใดจากบทถอดเสียง คุณสามารถกระโดดไปยังช่วงเวลานั้นในวิดีโอต้นฉบับได้เลย
ขั้นตอนที่ 2: สร้างสรุป
เมื่อได้บทถอดเสียงเต็มรูปแบบ สกิลสามารถสร้างสรุปเนื้อหาวิดีโอที่กระชับ ครอบคลุมหัวข้อหลัก เหตุผลสำคัญ และข้อสรุปที่สามารถนำไปใช้ได้ — คล้ายกับการที่คุณดูวิดีโอแล้วสรุปด้วยตัวเอง แต่ดำเนินการได้ภายในไม่กี่วินาที
ขั้นตอนที่ 3: สร้างบันทึกการประชุมและข้อมูลวิจัย
บทถอดเสียงและสรุปจะถูกนำไปใช้เป็นส่วนประกอบของงานขั้นต่อไป:
- บันทึกการประชุม: หากวิดีโอเป็นการประชุมทีม การสนทนากับลูกค้า หรือการรีวิวโปรเจกต์ สกิลจะจัดโครงสร้างบทถอดเสียงให้เป็นบันทึกการประชุมที่มีผู้พูด การตัดสินใจ และสิ่งที่ต้องดำเนินการต่อ
- ข้อมูลวิจัย: หากเป็นการบรรยาย การพูดในงานประชุม หรือวิดีโอเทคนิคลึก บทถอดเสียงจะกลายเป็นข้อความที่พร้อมอ้างอิงได้ ซึ่งเอเจนต์ของคุณสามารถดึงไปใช้ในการอ้างอิงและรายงานการวิจัย
- เอกสาร Markdown: ผลลัพธ์ทั้งหมดจะถูกส่งออกเป็นไฟล์ Markdown สะอาด พร้อมใช้งานในฐานความรู้ วิกิ หรือโฟลเดอร์โปรเจกต์
ทุกอย่างนี้เกิดขึ้นภายในสภาพแวดล้อม IDE ของ Google Antigravity เพียงวาง URL ของ YouTube แล้ว Agent Manager จะจัดการกระบวนการทั้งหมดผ่านการกำหนดเส้นทางใน SKILL.md — โดยไม่ต้องแตะมือเลย
ทำไมสิ่งนี้จึงสำคัญสำหรับทีม Antigravity
Agent Manager ของ Google Antigravity เป็นเครื่องมือวางแผนที่ยอดเยี่ยม แต่ตามที่กล่าวไว้ใน หน้าภาพรวมของ Felo Skills การวางแผนเป็นเพียงครึ่งงานเท่านั้น Agent Manager ต้องสามารถเข้าถึงชั้นข้อมูลและเครื่องมือส่งออกที่เหมาะสมเพื่อให้งานสมบูรณ์ได้จริง
วิดีโอเป็นชั้นข้อมูลที่ถูกใช้ประโยชน์น้อยที่สุดในกระบวนการจัดการความรู้ของทีม ลองพิจารณาดู:
- ทีมวิศวกรรม บันทึกรีวิวการออกแบบและรายงานเหตุการณ์ แต่ไม่มีบทถอดเสียง การบันทึกเหล่านั้นแทบไม่ถูกกลับมาดูอีก
- ทีมขาย เก็บบันทึกการโทรไว้สำหรับการฝึกอบรม แต่ถ้าไม่มีข้อความค้นหาได้ การดึงประเด็นจากการโทรเก่า ๆ เป็นงานที่ยุ่งยาก
- ทีมผลิตภัณฑ์ เก็บการสัมภาษณ์ผู้ใช้และเดโมของคู่แข่ง แต่ถ้าไม่มีบทถอดเสียง การเปรียบเทียบหลายวิดีโอแทบเป็นไปไม่ได้
- ทีมคอนเทนต์ ผลิตวิดีโอการศึกษาและเว็บบินาร์ แต่หากไม่มีข้อความค้นหาได้ เนื้อหาก็ไม่สามารถนำไปใช้ต่อได้อย่างมีประสิทธิภาพ
Felo YouTube Subtitling skill ทำให้วิดีโอแต่ละรายการกลายเป็นแหล่งข้อมูลข้อความระดับแรกในชั้นความรู้ของทีม — ชั้นเดียวกับที่ Felo LiveDoc จัดทำดัชนีเพื่อการค้นหาตลอดเวลา และเป็นแหล่งเดียวกันที่ Agent Manager ใช้เมื่อต้องการคำตอบที่มีข้อมูลรองรับ
วิธีที่ทีมใช้งาน
เวิร์กโฟลว์ที่ 1: เอกสารหลังการประชุม
- การประชุมทีมถูกบันทึกและอัปโหลดไปยัง YouTube (อาจเป็นแบบส่วนตัวหรือ unlisted)
- นำ URL ใส่ในงานของเอเจนต์ Antigravity: "สร้างบันทึกการประชุมจากวิดีโอนี้"
- Agent Manager เรียกใช้ YouTube Subtitling skill โดยอัตโนมัติ
- สกิลจะดึงคำบรรยายและเวลา สร้างสรุปแบบมีโครงสร้าง และจัดรูปแบบเป็นบันทึกการประชุม
- เอเจนต์ส่งมอบเอกสาร Markdown ฉบับสมบูรณ์ — พร้อมแชร์หรือเก็บทันที
กระบวนการทั้งหมดใช้เวลาเพียงไม่กี่วินาทีหลังจากได้รับ URL ไม่มีใครต้องดูวิดีโอซ้ำอีก
เวิร์กโฟลว์ที่ 2: การวิเคราะห์คู่แข่ง
- คู่แข่งเผยแพร่วิดีโอเปิดตัวผลิตภัณฑ์บน YouTube
- งานของเอเจนต์: "สรุปเดโมสินค้าและดึงคุณสมบัติหลักที่กล่าวถึง"
- สกิลดึงบทถอดเสียง เอเจนต์วิเคราะห์ แล้วส่งคืนการเปรียบเทียบคุณสมบัติแบบมีโครงสร้าง
- ผลลัพธ์ถูกส่งเข้าสู่เอกสารการวิเคราะห์คู่แข่งของทีมทันที
เวิร์กโฟลว์ที่ 3: การนำเนื้อหากลับมาใช้ใหม่
- เว็บบินาร์หรือการพูดในงานประชุมถูกเผยแพร่ใน YouTube
- งานของเอเจนต์: "สร้างร่างบล็อกโพสต์จากวิดีโอนี้"
- บทถอดเสียงจะเป็นต้นทาง เอเจนต์เขียนร่างแรกโดยอิงตามประเด็นสำคัญของการพูด
- บรรณาธิการมนุษย์เข้ามาปรับแก้ — แต่โครงหลักเสร็จแล้ว
การผสานกับสกิลอื่นของ Felo
YouTube Subtitling skill ไม่ได้ทำงานแยกเดี่ยว มันถูกออกแบบให้ทำงานร่วมกับระบบสกิลทั้งหมดของ Felo สำหรับ Google Antigravity:
- Felo Web Fetch ดึงข้อมูลจากหน้าเว็บมาใช้ร่วมกับวิดีโอ ทำให้เอเจนต์มีทั้งแหล่งเขียนและแหล่งเสียง
- Felo LiveDoc จัดทำดัชนีบทถอดเสียงและสรุปเข้าสู่ฐานความรู้ถาวร ค้นหาได้ทุกเซสชันและใช้ได้กับทุกเอเจนต์ในทีม
- Felo Slides แปลงบทถอดเสียงวิดีโอให้กลายเป็นชุดสไลด์ — จินตนาการดูสิว่าการพูดในงานสัมมนาจะกลายเป็นสไลด์พร้อมใช้งานโดยอัตโนมัติได้อย่างไร
- Felo Search ให้บริบทออนไลน์แบบเรียลไทม์ เพิ่มข้อมูลปัจจุบัน ราคา หรือพัฒนาการล่าสุดให้กับเนื้อหาวิดีโอ
เมื่อรวมกัน สกิลเหล่านี้จะสร้างกระบวนการความรู้แบบครบวงจร: ค้นหา → ดึงข้อมูล → จัดโครงสร้าง → ใช้ซ้ำ → ส่งมอบ วิดีโอจะกลายเป็นเพียงรูปแบบข้อมูลอีกชนิดหนึ่งในเวิร์กโฟลว์ที่เชื่อมโยงข้อความ วิดีโอ สไลด์ และข้อมูลออนไลน์เข้าด้วยกัน
การเริ่มต้นใช้งาน
การติดตั้งสกิลนี้ทำตามรูปแบบมาตรฐานของ Felo Skills สำหรับ Google Antigravity:
# Clone ที่เก็บ Felo skills
git clone https://github.com/Felo-Inc/felo-skills.git
# คัดลอก YouTube Subtitling skill ไปยังโฟลเดอร์สกิลของ Antigravity
cp -r felo-skills/felo-youtube-subtitling ~/.gemini/antigravity/skills/
# หรือวางไว้ใน .agent/skills/ ของโปรเจกต์เพื่อแชร์ให้ทั้งทีม
cp -r felo-skills/felo-youtube-subtitling .agent/skills/
เมื่อคอมมิตไดเรกทอรี .agent/skills/ ไปยัง Git นักพัฒนาทุกคนในทีมจะได้ความสามารถนี้ทันทีในการดึงครั้งถัดไป ไม่มีการตั้งค่าส่วนบุคคล ไม่ต้องจัดการคีย์ API หรือการติดตั้งเพิ่มเติมใด ๆ
คู่มือการติดตั้งแบบเต็ม บนหน้า Felo Skills ครอบคลุมเส้นทางติดตั้งอย่างเป็นทางการของ Google Antigravity และแนวทางปฏิบัติที่ดีที่สุดในการเผยแพร่สกิลให้ทั้งทีมใช้ร่วมกัน
อะไรทำให้สกิลนี้แตกต่าง
มีเครื่องมือมากมายที่สามารถดึงคำบรรยายจากวิดีโอ YouTube ได้ แต่สิ่งที่ทำให้สกิลนี้โดดเด่นคือการผสานเข้ากับเวิร์กโฟลว์อัตโนมัติของ Agent Manager ใน Antigravity
ทำงานโดยเอเจนต์ ไม่ใช่ผู้ใช้สั่งการ. คุณไม่ต้องเรียกใช้สกิลด้วยคำสั่ง Slash ไฟล์ SKILL.md จะทำหน้าที่เป็นตัวกระตุ้นแบบอัตโนมัติ — เมื่อภารกิจของเอเจนต์เกี่ยวข้องกับวิดีโอ คำบรรยาย หรือการถอดเสียง ตัวจัดการเอเจนต์จะโหลดสกิลให้อัตโนมัติ คุณทำงานปกติ และสกิลจะทำงานเมื่อจำเป็นเท่านั้น
ผลลัพธ์พร้อมใช้ ไม่ใช่แค่ข้อความดิบ. สกิลนี้ไม่ได้เพียงแค่ดึงคำบรรยายออกมาเท่านั้น แต่ยังจัดโครงสร้างให้เป็นสรุป บันทึกการประชุม และไฟล์ Markdown ที่พร้อมใช้งานสำหรับงานต่อไปทันที
แบ่งปันได้ทั้งทีม ไม่ใช่เฉพาะบุคคล. เมื่อติดตั้งใน .agent/skills/ และบันทึกใน Git ทุกคนในทีมจะได้สกิลนี้โดยอัตโนมัติ ไม่มีการตั้งค่าซ้ำซ้อน
ทำงานร่วมกับหลายสกิล. บทถอดเสียงจะเป็นข้อมูลนำเข้าให้กับ Felo Skills อื่น ๆ — LiveDoc สำหรับการจัดทำดัชนีถาวร Slides สำหรับการสร้างสไลด์ และ Landing Page สำหรับการเผยแพร่เนื้อหา สกิลเดียวปลดล็อกความสามารถอีกมากมาย
มุมมองในภาพรวม
วิดีโอกำลังกลายเป็นรูปแบบหลักในการแบ่งปันความรู้ แต่เครื่องมือในการทำงานกับเนื้อหาวิดีโอยังไม่ทันยุค ส่วนใหญ่ยังมองว่าวิดีโอเป็นเพียงสื่อเส้นตรงที่ค้นหาไม่ได้ — ดู จด แล้วก็ผ่าน
Felo YouTube Subtitling skill คือการเปลี่ยนแนวคิดนั้น: วิดีโอในฐานะข้อมูลที่มีโครงสร้าง ค้นหาได้ และนำกลับมาใช้ใหม่ได้ เมื่อนำมารวมกับ Felo Skills อื่น ๆ มันคือส่วนหนึ่งของความพยายามที่ใหญ่กว่าในการมอบชุดความสามารถที่ครบถ้วนให้กับเอเจนต์ AI เพื่อทำงานจริงได้ — ไม่ใช่แค่วางแผนหรือสรุป แต่ผลิตผลงานสำเร็จรูปจากรูปแบบข้อมูลใดก็ได้
สำรวจชุดสกิลทั้งหมดได้ที่ felo.ai และดูว่าสกิลแต่ละตัวเชื่อมต่อกับ Agent Manager ของ Google Antigravity อย่างไร เริ่มจากสกิลที่ตรงกับความต้องการเร่งด่วนที่สุดของทีมคุณ แล้วต่อยอดจากตรงนั้น
บทความนี้มีให้อ่านในภาษาต่อไปนี้ด้วย: English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, Español, বাংলা and Português