Skip to main content

แปลงวิดีโอ YouTube ให้เป็นบทถอดเสียงที่ค้นหาได้และเอกสารงาน

· อ่าน 3 นาที
Felo Search Tips Buddy
Committed to answers at your fingertips

ดึงคำบรรยายและเวลาจากวิดีโอ YouTube ใด ๆ แล้วนำเนื้อหานั้นมาใช้ซ้ำสำหรับสรุป รายงานการประชุม การวิจัย และเอกสาร Markdown — ทั้งหมดภายใน Google Antigravity

Turn YouTube Videos into Searchable Transcripts

YouTube มีความรู้มากมายมหาศาล — การสาธิตผลิตภัณฑ์ การบรรยาย การเรียนการสอน การฝึกอบรม การประชุมทีมที่บันทึกไว้เพื่อดูภายหลัง แต่ความรู้นั้นกลับถูกซ่อนอยู่ในวิดีโอ คุณไม่สามารถค้นหาภายในวิดีโอได้ คุณไม่สามารถอ้างอิงเวลาช่วงหนึ่งในการบันทึกรายงานการประชุมโดยไม่ดูซ้ำ และคุณไม่สามารถนำวิดีโอเข้าสู่กระบวนการวิจัยของคุณได้เหมือนกับบทความ

จนถึงตอนนี้

Felo YouTube Subtitling skill สำหรับ Google Antigravity จะเปลี่ยนวิดีโอ YouTube ใด ๆ ให้กลายเป็นบทถอดเสียงที่ค้นหาได้พร้อมเวลา จากนั้นให้คุณนำเนื้อหานั้นกลับมาใช้ใหม่สำหรับสรุป รายงานการประชุม ข้อมูลประกอบการวิจัย และเอกสาร Markdown ที่มีโครงสร้าง เพียงวางโฟลเดอร์ของสกิลไว้ในไดเรกทอรี .agent/skills/ และตัวจัดการเอเจนต์ของ Antigravity จะจัดการทุกอย่างให้อัตโนมัติ — โดยไม่ต้องใช้คำสั่งพิเศษหรือการแยกข้อมูลด้วยมือ

ปัญหา: วิดีโอคือกล่องดำ

ถ้าคุณเคยพยายามหาช่วงที่เฉพาะเจาะจงในวิดีโอเดโมสินค้ายาว 45 นาที คุณคงรู้ดีว่ามันยุ่งยากแค่ไหน ต้องกรอไปมา ดูซ้ำหลายรอบ อยากแค่กด Ctrl+F ค้นหาคำที่จำได้ก็ยังทำไม่ได้

ปัญหาไม่ได้อยู่ที่ตัววิดีโอเอง แต่เพราะวิดีโอไม่มี “ชั้นข้อความ” ที่สามารถค้นหาได้ เครื่องมือค้นหาสามารถจัดทำดัชนีคำอธิบายหรือความคิดเห็นของ YouTube ได้เท่านั้น แต่ไม่สามารถจัดทำดัชนีสิ่งที่ พูดจริง ๆ ในวิดีโอได้ — อย่างน้อยก็ไม่ใช่ในแบบที่มีเวลาที่แม่นยำและข้อความที่นำกลับมาใช้ได้

สำหรับทีมที่ใช้ Agent Manager ของ Google Antigravity ช่องว่างนี้ชัดเจนยิ่งขึ้น เอเจนต์ของคุณสามารถวิจัยเว็บ สกัดหน้าเพจ สร้างสไลด์ และเขียนเอกสารได้ แต่ถ้าไม่สามารถประมวลผลเนื้อหาวิดีโอได้ ส่วนนั้นของฐานความรู้ทีมจะยังคงเข้าถึงไม่ได้

Felo YouTube Subtitling skill จะช่วยปิดช่องว่างนั้น

Video to Docs Workflow

สกิลนี้ทำอะไรได้บ้าง

ขั้นตอนที่ 1: ดึงคำบรรยายและเวลา

เมื่อระบุ URL ของ YouTube สกิลจะดึงคำบรรยายของวิดีโอ (ทั้งแบบอัตโนมัติและที่อัปโหลดโดยผู้สร้างเมื่อมี) พร้อมเวลาที่แม่นยำ ผลลัพธ์จะเป็นบทถอดเสียงแบบมีโครงสร้างที่จับคู่ทุกประโยคกับช่วงเวลาที่ตรงในวิดีโอ

นี่ไม่ใช่การประมาณคร่าว ๆ เวลาที่ได้จะตรงกับสิ่งที่พูดจริงในวิดีโอ ดังนั้นเมื่ออ้างถึงจุดใดจากบทถอดเสียง คุณสามารถกระโดดไปยังช่วงเวลานั้นในวิดีโอต้นฉบับได้เลย

ขั้นตอนที่ 2: สร้างสรุป

เมื่อได้บทถอดเสียงเต็มรูปแบบ สกิลสามารถสร้างสรุปเนื้อหาวิดีโอที่กระชับ ครอบคลุมหัวข้อหลัก เหตุผลสำคัญ และข้อสรุปที่สามารถนำไปใช้ได้ — คล้ายกับการที่คุณดูวิดีโอแล้วสรุปด้วยตัวเอง แต่ดำเนินการได้ภายในไม่กี่วินาที

ขั้นตอนที่ 3: สร้างบันทึกการประชุมและข้อมูลวิจัย

บทถอดเสียงและสรุปจะถูกนำไปใช้เป็นส่วนประกอบของงานขั้นต่อไป:

  • บันทึกการประชุม: หากวิดีโอเป็นการประชุมทีม การสนทนากับลูกค้า หรือการรีวิวโปรเจกต์ สกิลจะจัดโครงสร้างบทถอดเสียงให้เป็นบันทึกการประชุมที่มีผู้พูด การตัดสินใจ และสิ่งที่ต้องดำเนินการต่อ
  • ข้อมูลวิจัย: หากเป็นการบรรยาย การพูดในงานประชุม หรือวิดีโอเทคนิคลึก บทถอดเสียงจะกลายเป็นข้อความที่พร้อมอ้างอิงได้ ซึ่งเอเจนต์ของคุณสามารถดึงไปใช้ในการอ้างอิงและรายงานการวิจัย
  • เอกสาร Markdown: ผลลัพธ์ทั้งหมดจะถูกส่งออกเป็นไฟล์ Markdown สะอาด พร้อมใช้งานในฐานความรู้ วิกิ หรือโฟลเดอร์โปรเจกต์

ทุกอย่างนี้เกิดขึ้นภายในสภาพแวดล้อม IDE ของ Google Antigravity เพียงวาง URL ของ YouTube แล้ว Agent Manager จะจัดการกระบวนการทั้งหมดผ่านการกำหนดเส้นทางใน SKILL.md — โดยไม่ต้องแตะมือเลย

ทำไมสิ่งนี้จึงสำคัญสำหรับทีม Antigravity

Agent Manager ของ Google Antigravity เป็นเครื่องมือวางแผนที่ยอดเยี่ยม แต่ตามที่กล่าวไว้ใน หน้าภาพรวมของ Felo Skills การวางแผนเป็นเพียงครึ่งงานเท่านั้น Agent Manager ต้องสามารถเข้าถึงชั้นข้อมูลและเครื่องมือส่งออกที่เหมาะสมเพื่อให้งานสมบูรณ์ได้จริง

วิดีโอเป็นชั้นข้อมูลที่ถูกใช้ประโยชน์น้อยที่สุดในกระบวนการจัดการความรู้ของทีม ลองพิจารณาดู:

  • ทีมวิศวกรรม บันทึกรีวิวการออกแบบและรายงานเหตุการณ์ แต่ไม่มีบทถอดเสียง การบันทึกเหล่านั้นแทบไม่ถูกกลับมาดูอีก
  • ทีมขาย เก็บบันทึกการโทรไว้สำหรับการฝึกอบรม แต่ถ้าไม่มีข้อความค้นหาได้ การดึงประเด็นจากการโทรเก่า ๆ เป็นงานที่ยุ่งยาก
  • ทีมผลิตภัณฑ์ เก็บการสัมภาษณ์ผู้ใช้และเดโมของคู่แข่ง แต่ถ้าไม่มีบทถอดเสียง การเปรียบเทียบหลายวิดีโอแทบเป็นไปไม่ได้
  • ทีมคอนเทนต์ ผลิตวิดีโอการศึกษาและเว็บบินาร์ แต่หากไม่มีข้อความค้นหาได้ เนื้อหาก็ไม่สามารถนำไปใช้ต่อได้อย่างมีประสิทธิภาพ

Felo YouTube Subtitling skill ทำให้วิดีโอแต่ละรายการกลายเป็นแหล่งข้อมูลข้อความระดับแรกในชั้นความรู้ของทีม — ชั้นเดียวกับที่ Felo LiveDoc จัดทำดัชนีเพื่อการค้นหาตลอดเวลา และเป็นแหล่งเดียวกันที่ Agent Manager ใช้เมื่อต้องการคำตอบที่มีข้อมูลรองรับ

วิธีที่ทีมใช้งาน

เวิร์กโฟลว์ที่ 1: เอกสารหลังการประชุม

  1. การประชุมทีมถูกบันทึกและอัปโหลดไปยัง YouTube (อาจเป็นแบบส่วนตัวหรือ unlisted)
  2. นำ URL ใส่ในงานของเอเจนต์ Antigravity: "สร้างบันทึกการประชุมจากวิดีโอนี้"
  3. Agent Manager เรียกใช้ YouTube Subtitling skill โดยอัตโนมัติ
  4. สกิลจะดึงคำบรรยายและเวลา สร้างสรุปแบบมีโครงสร้าง และจัดรูปแบบเป็นบันทึกการประชุม
  5. เอเจนต์ส่งมอบเอกสาร Markdown ฉบับสมบูรณ์ — พร้อมแชร์หรือเก็บทันที

กระบวนการทั้งหมดใช้เวลาเพียงไม่กี่วินาทีหลังจากได้รับ URL ไม่มีใครต้องดูวิดีโอซ้ำอีก

เวิร์กโฟลว์ที่ 2: การวิเคราะห์คู่แข่ง

  1. คู่แข่งเผยแพร่วิดีโอเปิดตัวผลิตภัณฑ์บน YouTube
  2. งานของเอเจนต์: "สรุปเดโมสินค้าและดึงคุณสมบัติหลักที่กล่าวถึง"
  3. สกิลดึงบทถอดเสียง เอเจนต์วิเคราะห์ แล้วส่งคืนการเปรียบเทียบคุณสมบัติแบบมีโครงสร้าง
  4. ผลลัพธ์ถูกส่งเข้าสู่เอกสารการวิเคราะห์คู่แข่งของทีมทันที

เวิร์กโฟลว์ที่ 3: การนำเนื้อหากลับมาใช้ใหม่

  1. เว็บบินาร์หรือการพูดในงานประชุมถูกเผยแพร่ใน YouTube
  2. งานของเอเจนต์: "สร้างร่างบล็อกโพสต์จากวิดีโอนี้"
  3. บทถอดเสียงจะเป็นต้นทาง เอเจนต์เขียนร่างแรกโดยอิงตามประเด็นสำคัญของการพูด
  4. บรรณาธิการมนุษย์เข้ามาปรับแก้ — แต่โครงหลักเสร็จแล้ว

การผสานกับสกิลอื่นของ Felo

YouTube Subtitling skill ไม่ได้ทำงานแยกเดี่ยว มันถูกออกแบบให้ทำงานร่วมกับระบบสกิลทั้งหมดของ Felo สำหรับ Google Antigravity:

  • Felo Web Fetch ดึงข้อมูลจากหน้าเว็บมาใช้ร่วมกับวิดีโอ ทำให้เอเจนต์มีทั้งแหล่งเขียนและแหล่งเสียง
  • Felo LiveDoc จัดทำดัชนีบทถอดเสียงและสรุปเข้าสู่ฐานความรู้ถาวร ค้นหาได้ทุกเซสชันและใช้ได้กับทุกเอเจนต์ในทีม
  • Felo Slides แปลงบทถอดเสียงวิดีโอให้กลายเป็นชุดสไลด์ — จินตนาการดูสิว่าการพูดในงานสัมมนาจะกลายเป็นสไลด์พร้อมใช้งานโดยอัตโนมัติได้อย่างไร
  • Felo Search ให้บริบทออนไลน์แบบเรียลไทม์ เพิ่มข้อมูลปัจจุบัน ราคา หรือพัฒนาการล่าสุดให้กับเนื้อหาวิดีโอ

เมื่อรวมกัน สกิลเหล่านี้จะสร้างกระบวนการความรู้แบบครบวงจร: ค้นหา → ดึงข้อมูล → จัดโครงสร้าง → ใช้ซ้ำ → ส่งมอบ วิดีโอจะกลายเป็นเพียงรูปแบบข้อมูลอีกชนิดหนึ่งในเวิร์กโฟลว์ที่เชื่อมโยงข้อความ วิดีโอ สไลด์ และข้อมูลออนไลน์เข้าด้วยกัน

การเริ่มต้นใช้งาน

การติดตั้งสกิลนี้ทำตามรูปแบบมาตรฐานของ Felo Skills สำหรับ Google Antigravity:

# Clone ที่เก็บ Felo skills
git clone https://github.com/Felo-Inc/felo-skills.git

# คัดลอก YouTube Subtitling skill ไปยังโฟลเดอร์สกิลของ Antigravity
cp -r felo-skills/felo-youtube-subtitling ~/.gemini/antigravity/skills/

# หรือวางไว้ใน .agent/skills/ ของโปรเจกต์เพื่อแชร์ให้ทั้งทีม
cp -r felo-skills/felo-youtube-subtitling .agent/skills/

เมื่อคอมมิตไดเรกทอรี .agent/skills/ ไปยัง Git นักพัฒนาทุกคนในทีมจะได้ความสามารถนี้ทันทีในการดึงครั้งถัดไป ไม่มีการตั้งค่าส่วนบุคคล ไม่ต้องจัดการคีย์ API หรือการติดตั้งเพิ่มเติมใด ๆ

คู่มือการติดตั้งแบบเต็ม บนหน้า Felo Skills ครอบคลุมเส้นทางติดตั้งอย่างเป็นทางการของ Google Antigravity และแนวทางปฏิบัติที่ดีที่สุดในการเผยแพร่สกิลให้ทั้งทีมใช้ร่วมกัน

อะไรทำให้สกิลนี้แตกต่าง

มีเครื่องมือมากมายที่สามารถดึงคำบรรยายจากวิดีโอ YouTube ได้ แต่สิ่งที่ทำให้สกิลนี้โดดเด่นคือการผสานเข้ากับเวิร์กโฟลว์อัตโนมัติของ Agent Manager ใน Antigravity

ทำงานโดยเอเจนต์ ไม่ใช่ผู้ใช้สั่งการ. คุณไม่ต้องเรียกใช้สกิลด้วยคำสั่ง Slash ไฟล์ SKILL.md จะทำหน้าที่เป็นตัวกระตุ้นแบบอัตโนมัติ — เมื่อภารกิจของเอเจนต์เกี่ยวข้องกับวิดีโอ คำบรรยาย หรือการถอดเสียง ตัวจัดการเอเจนต์จะโหลดสกิลให้อัตโนมัติ คุณทำงานปกติ และสกิลจะทำงานเมื่อจำเป็นเท่านั้น

ผลลัพธ์พร้อมใช้ ไม่ใช่แค่ข้อความดิบ. สกิลนี้ไม่ได้เพียงแค่ดึงคำบรรยายออกมาเท่านั้น แต่ยังจัดโครงสร้างให้เป็นสรุป บันทึกการประชุม และไฟล์ Markdown ที่พร้อมใช้งานสำหรับงานต่อไปทันที

แบ่งปันได้ทั้งทีม ไม่ใช่เฉพาะบุคคล. เมื่อติดตั้งใน .agent/skills/ และบันทึกใน Git ทุกคนในทีมจะได้สกิลนี้โดยอัตโนมัติ ไม่มีการตั้งค่าซ้ำซ้อน

ทำงานร่วมกับหลายสกิล. บทถอดเสียงจะเป็นข้อมูลนำเข้าให้กับ Felo Skills อื่น ๆ — LiveDoc สำหรับการจัดทำดัชนีถาวร Slides สำหรับการสร้างสไลด์ และ Landing Page สำหรับการเผยแพร่เนื้อหา สกิลเดียวปลดล็อกความสามารถอีกมากมาย

มุมมองในภาพรวม

วิดีโอกำลังกลายเป็นรูปแบบหลักในการแบ่งปันความรู้ แต่เครื่องมือในการทำงานกับเนื้อหาวิดีโอยังไม่ทันยุค ส่วนใหญ่ยังมองว่าวิดีโอเป็นเพียงสื่อเส้นตรงที่ค้นหาไม่ได้ — ดู จด แล้วก็ผ่าน

Felo YouTube Subtitling skill คือการเปลี่ยนแนวคิดนั้น: วิดีโอในฐานะข้อมูลที่มีโครงสร้าง ค้นหาได้ และนำกลับมาใช้ใหม่ได้ เมื่อนำมารวมกับ Felo Skills อื่น ๆ มันคือส่วนหนึ่งของความพยายามที่ใหญ่กว่าในการมอบชุดความสามารถที่ครบถ้วนให้กับเอเจนต์ AI เพื่อทำงานจริงได้ — ไม่ใช่แค่วางแผนหรือสรุป แต่ผลิตผลงานสำเร็จรูปจากรูปแบบข้อมูลใดก็ได้

สำรวจชุดสกิลทั้งหมดได้ที่ felo.ai และดูว่าสกิลแต่ละตัวเชื่อมต่อกับ Agent Manager ของ Google Antigravity อย่างไร เริ่มจากสกิลที่ตรงกับความต้องการเร่งด่วนที่สุดของทีมคุณ แล้วต่อยอดจากตรงนั้น


บทความนี้มีให้อ่านในภาษาต่อไปนี้ด้วย: English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Tiếng Việt, Türkçe, Italiano, Español, বাংলা and Português