Skip to main content

将 YouTube 视频转化为可搜索的文字稿和工作文档

· 阅读需 13 分钟
Felo Search Tips Buddy
Committed to answers at your fingertips

从任意 YouTube 视频中提取字幕与时间戳,然后在 Google Antigravity 中将内容复用为摘要、会议记录、研究输入及 Markdown 文档。

将 YouTube 视频转化为可搜索的文字稿

YouTube 拥有庞大的知识库——产品演示、会议演讲、课程讲座、教学视频、团队会议录制。然而,这些知识被封存在视频中。你无法在视频中搜索;无法在会议记录中引用某个时间点而不重新观看;也无法像处理文章那样将视频纳入研究流程。

直到现在。

Google Antigravity 的 Felo YouTube 字幕技能 能将任何 YouTube 视频转换为带时间戳的可搜索文字稿,然后让你在摘要、会议记录、研究输入及结构化 Markdown 文档中重复利用这些内容。只需将技能文件夹放入你的 .agent/skills/ 目录,Antigravity Agent Manager 会自动完成剩余步骤——无需斜杠命令,也无需手动提取。

问题所在:视频是一个黑箱

如果你曾试图在一段 45 分钟的产品演示中找到某个特定片段,你一定体会过那种痛苦。你不断拖动时间轴反复播放,只希望能直接像 Ctrl+F 那样搜索关键词。

问题并不在于视频本身,而在于视频缺乏文本层。搜索引擎可以索引 YouTube 的描述和评论,但无法索引视频中真正说出的内容——至少,无法以提供精确时间戳及可复用文本的方式实现。

对于使用 Google Antigravity Agent Manager 的团队而言,这一缺口尤为明显。你的智能体可以研究网页、提取页面内容、生成幻灯片并撰写文档。但若无法处理视频内容,你团队知识库中的大量信息将无法触及。

Felo YouTube 字幕技能正是为弥补这一缺口而存在。

视频到文档的流程

该技能的功能

第一步:提取字幕与时间戳

给定一个 YouTube 链接,该技能会提取视频字幕(包括自动生成和人工提供的字幕,若存在)以及精确时间戳。输出内容是一份结构化文字稿,将每句话或短语映射到视频中确切的时间点。

这不是粗略匹配。时间戳与实际语音高度一致,因此在引用文字稿中的内容时,可以直接跳转到原视频中的对应片段。

第二步:生成摘要

获得完整文字稿后,技能可生成简洁的视频内容摘要。这些摘要概括主要话题、核心论点及可执行要点——就像你亲自观看后撰写的总结,但只需几秒即可生成。

第三步:生成会议记录与研究输入

文字稿与摘要可成为后续工作的基础:

  • 会议记录: 如果视频是团队晨会、客户通话记录或项目回顾,技能会将文字稿整理成带发言人、决策及行动项的会议记录格式。
  • 研究输入: 如果视频是讲座、会议演讲或技术讲解,文字稿会成为可引用的文本来源,智能体可将其引用、参考并纳入研究文档。
  • Markdown 文档: 全部输出以干净的 Markdown 形式呈现,可直接放入知识库、Wiki 或项目文件夹。

以上一切都在 Google Antigravity 的 IDE 环境中完成。你只需粘贴 YouTube 链接,Agent Manager 会通过技能的 SKILL.md 路由自动协调整个流程——无需人工干预。

为什么这对 Antigravity 团队至关重要

Google Antigravity 的 Agent Manager 具备强大的规划能力。但正如 Felo 技能概览页面 所述,规划只是工作的一半。Agent Manager 需要访问正确的数据层与输出工具,才能完成实际工作。

视频是团队知识工作流程中最未被充分利用的数据层之一。想一想:

  • 工程团队 记录设计评审和复盘会议。没有文字稿,这些录音几乎从不回看。
  • 销售团队 保留通话录音以用于培训与辅导。缺乏可搜索文本,从过去的通话中提炼洞察变得异常费力。
  • 产品团队 保存用户研究访谈及竞争产品演示。没有文字稿,交叉参考多个视频几乎不可能。
  • 内容团队 制作教学视频与网络研讨会。没有可搜索文本,内容便无法高效复用为博客、文档或社交媒体内容。

Felo YouTube 字幕技能让每个录制视频都成为团队知识层中的一等文本来源——这一层正是 Felo LiveDoc 可持续索引的对象,也是 Agent Manager 在需要精确答案时查询的层。

团队如何使用

工作流 1:会议后文档化

  1. 团队会议被录制并上传至 YouTube(私有或非公开)。
  2. 将链接放入 Antigravity 智能体任务中:“根据此录音生成会议记录。”
  3. Agent Manager 自动触发 YouTube 字幕技能。
  4. 技能提取字幕与时间戳,生成结构化摘要,并将其格式化为会议记录。
  5. 智能体交付最终 Markdown 文档——可直接分享或存储。

整个流程在粘贴链接后的几秒钟内完成,无需任何人重看录音。

工作流 2:竞争情报分析

  1. 竞争对手在 YouTube 发布产品发布视频。
  2. 智能体任务:“总结此产品演示并提取提及的关键特性。”
  3. 技能提取文字稿,智能体处理后返回结构化特性对比。
  4. 输出直接纳入团队的竞争分析文档。

工作流 3:内容再利用

  1. 一场网络研讨会或会议演讲上传至 YouTube。
  2. 智能体任务:“根据此演讲创建博客文章草稿。”
  3. 文字稿成为源材料,智能体依据演讲要点撰写初稿。
  4. 人类编辑再行润色——但主要工作已完成。

与其他 Felo 技能的集成

YouTube 字幕技能并非孤立运行。它旨在融入 Google Antigravity 的 Felo 技能生态系统:

  • Felo Web Fetch 可提取网页,与视频内容并行用于研究,赋予智能体文字与语音双重素材来源。
  • Felo LiveDoc 将输出的文字稿和摘要索引进持久知识库,使内容可跨会话搜索,并供团队所有智能体访问。
  • Felo Slides 可将视频文字稿转化为演示幻灯片——想象一下自动将会议演讲转换为演讲要点幻灯片。
  • Felo Search 提供实时网页上下文,以最新数据、价格或相关进展丰富视频内容。

这些技能共同组成完整的知识流水线:发现 → 提取 → 结构化 → 复用 → 交付。视频因此成为跨文本、视频、幻灯片与实时数据的统一输入格式。

开始使用

安装此技能遵循 Google Antigravity 的 Felo 技能标准模式:

# 克隆 Felo 技能仓库
git clone https://github.com/Felo-Inc/felo-skills.git

# 将 YouTube 字幕技能复制至你的 Antigravity 技能文件夹
cp -r felo-skills/felo-youtube-subtitling ~/.gemini/antigravity/skills/

# 或放入项目的 .agent/skills/ 目录实现团队共享
cp -r felo-skills/felo-youtube-subtitling .agent/skills/

.agent/skills/ 目录提交到 Git,团队中每位开发者在下次拉取时都会获得该功能。无需单独配置、无需 API 密钥管理、无需额外设置。

Felo 技能页面的完整安装指南 提供官方 Google Antigravity 安装路径及团队范围分发的最佳实践。

独特之处

市面上已有一些工具能提取 YouTube 字幕。但此技能的独到之处在于与 Antigravity Agent Manager 自主工作流的集成:

由智能体触发,而非用户触发。 你无需用命令调用技能。SKILL.md 描述本身即为语义触发器——当智能体任务涉及视频内容、字幕或文字稿提取时,Agent Manager 会自动加载相应技能。你正常工作,技能在需要时自动激活。

输出可直接使用,而非原生文本。 该技能并非仅输出字幕原文,而是将其结构化为摘要、会议记录、Markdown 文档格式,可立即用于后续工作。

团队共享,而非个人配置。 安装至 .agent/skills/ 并提交至 Git 后,每位开发者的 Antigravity 实例都会加载该技能。整个团队都可享受视频文字提取的便利,无需个人单独设置。

多技能组合。 文字稿可作为其他 Felo 技能的输入——LiveDoc 用于持久索引,Slides 用于生成演示文稿,Landing Page 用于内容发布。一项技能即可解锁一系列能力。

更大的愿景

视频正逐渐成为知识分享的主流形式,但我们处理视频内容的工具却尚未跟上。大多数团队仍将视频视为线性、不可搜索的资料——观看、手动记录、然后放下。

Felo YouTube 字幕技能标志着一次转变:将视频重新定义为结构化、可搜索、可复用的数据。结合 Felo 技能生态系统的其余部分,它是让 AI 智能体具备完整工作能力的重要一步——不仅能规划任务、生成摘要,更能从任意输入格式产出最终成果。

前往 felo.ai 探索全部 Felo 技能,了解它们如何与 Google Antigravity 的 Agent Manager 集成。从最能解决你团队关键痛点的技能开始,再逐步扩展。


本文还提供以下语言版本:English日本語한국어繁體中文हिन्दीFrançaisالعربيةРусскийاردوBahasa IndonesiaDeutschTiếng ViệtTürkçeItalianoไทยEspañolবাংলাPortuguês