Skip to main content

YouTube動画を検索可能な文字起こしと作業ドキュメントに変換する

· 約15分
Felo Search Tips Buddy
Committed to answers at your fingertips

任意のYouTube動画から字幕とタイムスタンプを抽出し、その内容を要約、議事録、リサーチ資料、Markdownドキュメントとして再利用 — すべてをGoogle Antigravityの中で実現。

YouTube動画を検索可能な文字起こしに変換

YouTubeには膨大な知識が蓄積されています — 製品デモ、カンファレンス講演、授業、チュートリアル、チーム会議の録画など。しかし、その知識は動画の中に閉じ込められています。動画の中を検索することはできません。会議メモにタイムスタンプを引用するにも再生が必要です。記事のように動画をリサーチパイプラインに取り込むこともできません。

それが今、変わります。

Google Antigravity用のFelo YouTube Subtitling スキルは、任意のYouTube動画をタイムスタンプ付きの検索可能な文字起こしに変換し、その内容を要約、会議メモ、リサーチ資料、構造化されたMarkdownドキュメントとして再利用できるようにします。スキルフォルダを.agent/skills/ディレクトリに配置するだけで、Antigravityエージェントマネージャーが自動的に処理を行います — スラッシュコマンドも手動操作も不要です。

課題: 動画はブラックボックス

45分間の製品デモから特定の箇所を探した経験があれば、その苦労を知っているでしょう。タイムラインを何度も行ったり来たりして、同じセグメントを3回見返す羽目になります。「あのキーワードをCtrl+Fできたら…」と思ったことはありませんか?

問題は動画自体ではなく、動画コンテンツにテキスト層がないことにあります。検索エンジンはYouTubeの説明文やコメントをインデックスできますが、動画内で実際に話されている内容を正確なタイムスタンプ付きで再利用できる形ではインデックスできません。

Google Antigravityのエージェントマネージャーを使うチームでは、このギャップはさらに深刻です。エージェントはWebを調査し、ページを抽出し、スライドを作成し、ドキュメントを書くことができます。しかし、動画コンテンツを処理する手段がなければ、チームの知識の大部分はアクセスできないままです。

Felo YouTube Subtitling スキルが、そのギャップを埋めます。

動画からドキュメントへのワークフロー

スキルの機能

ステップ1: 字幕とタイムスタンプの抽出

YouTubeのURLを指定すると、このスキルは動画の字幕(自動生成と手動提供の両方を利用可能な場合)と正確なタイムスタンプを取得します。出力は、各文やフレーズを動画内の対応する瞬間にマッピングした構造化された文字起こしです。

単なる概算ではありません。タイムスタンプは実際の発話内容と正確に一致しており、文字起こしから特定の箇所を参照する際に、元動画のその瞬間に直接ジャンプできます。

ステップ2: 要約の生成

全文の文字起こしをもとに、このスキルは動画内容の簡潔な要約を生成します。主要なトピック、重要な議論、実行可能なポイントなど、動画を視聴後に自分でまとめるような概要を数秒で自動生成します。

ステップ3: 会議メモとリサーチ入力の生成

文字起こしと要約は、その後の業務に活用できる基礎データになります。

  • 会議メモ: チームの朝会やクライアント通話、プロジェクトレビューなどの場合、文字起こしを話者や決定事項、アクション項目付きの整形済み会議メモとして構成します。
  • リサーチ資料: 講義、カンファレンス講演、技術解説動画などの場合、文字起こしは引用可能なテキストソースとなり、エージェントが引用・参照・リサーチ文書に組み込めるようになります。
  • Markdownドキュメント: 出力全体はクリーンなMarkdown形式で提供され、ナレッジベースやWiki、プロジェクトフォルダにそのまま追加可能です。

これらすべてがGoogle AntigravityのIDE環境内で完結します。YouTubeのURLを貼り付けると、エージェントマネージャーがスキルのSKILL.mdルーティングを通じて全体を自動的に処理 — 手作業は一切不要です。

Antigravityチームにとっての意義

Google Antigravityのエージェントマネージャーは優れたプランナーですが、Felo Skillsの概要ページでも述べたように、計画は仕事の半分にすぎません。エージェントマネージャーが実務を完遂するには、適切なデータ層と出力ツールへのアクセスが必要です。

動画はチームナレッジフローの中で最も活用されていないデータ層の一つです。例えば:

  • エンジニアリングチーム: 設計レビューやポストモーテムを録画しても、文字起こしがなければ再活用はまれです。
  • 営業チーム: 通話録音をトレーニング目的で保存しても、検索できるテキストがなければ洞察抽出は手作業です。
  • プロダクトチーム: ユーザーリサーチや競合製品デモを蓄積しても、文字起こしがなければ複数動画を横断参照するのは非効率です。
  • コンテンツチーム: 教育動画やウェビナーを制作しても、検索可能なテキストがなければブログ、ドキュメント、SNSなどへの再利用は困難です。

Felo YouTube Subtitling スキルを使えば、あらゆる録画動画をチームのナレッジ層における第一級のテキストソースに変えられます — Felo LiveDocが永続検索のためにインデックス化するのと同じ層、エージェントマネージャーが根拠ある回答を得る際に参照するのと同じ層です。

チームでの活用方法

ワークフロー1: 会議後のドキュメント化

  1. チーム会議を録画し、YouTube(限定公開または非公開)にアップロードします。
  2. エージェントタスクにURLを貼り付け、「この録画から会議メモを生成」と指示します。
  3. エージェントマネージャーが自動でYouTube Subtitling スキルを起動します。
  4. スキルが字幕とタイムスタンプを抽出し、構造化された要約を作成して会議メモとして整形します。
  5. エージェントが最終的なMarkdownドキュメントを生成し、すぐに共有・保管できます。

URLを入力した後の処理は数秒で完了。録画を見直す必要はありません。

ワークフロー2: 競合リサーチ

  1. 競合他社が新製品ローンチ動画をYouTubeに投稿します。
  2. エージェントに「この製品デモを要約し、言及された主要機能を抽出」と依頼します。
  3. スキルが文字起こしを取得し、エージェントが処理して構造化された機能比較を返します。
  4. 結果はチームの競合分析ドキュメントに直接利用されます。

ワークフロー3: コンテンツ再利用

  1. ウェビナーや講演がYouTubeに公開されます。
  2. エージェントに「この講演をもとにブログ記事の下書きを作成」と指示します。
  3. 文字起こしが素材となり、エージェントが講演の主要ポイントに沿って初稿を作成します。
  4. 人間の編集者が調整すれば完成 — 主要作業の大部分は自動化済みです。

他のFelo Skillsとの連携

YouTube Subtitling スキルは単独ではなく、Google Antigravity用のFelo Skillsエコシステムの一部として設計されています。

  • Felo Web Fetch: 動画と同時にWebページも抽出し、テキストと発話の両方を分析素材として提供。
  • Felo LiveDoc: 生成された文字起こしと要約を永続的なナレッジベースにインデックス化し、全セッションやチーム全員で検索可能にします。
  • Felo Slides: 動画の文字起こしをスライド資料に変換し、講演を自動的にスライド化。
  • Felo Search: リアルタイムWeb情報を動画内容に補完し、最新データや価格、関連動向を追加。

これらのスキルが連携することで、発見 → 抽出 → 構造化 → 再利用 → 提供 という完全なナレッジパイプラインを構成します。動画はテキスト・スライド・Webデータと並ぶもう一つの入力形式になります。

はじめ方

このスキルのインストールは、Google Antigravity用Felo Skillsの標準パターンに従います。

# Felo skillsリポジトリをクローン
git clone https://github.com/Felo-Inc/felo-skills.git

# YouTube SubtitlingスキルをAntigravityのskillsフォルダにコピー
cp -r felo-skills/felo-youtube-subtitling ~/.gemini/antigravity/skills/

# またはプロジェクトの.agent/skills/フォルダに配置してチーム全体で共有
cp -r felo-skills/felo-youtube-subtitling .agent/skills/

.agent/skills/ディレクトリをGitにコミットすれば、次回のpullでチームの全開発者がスキルを利用可能になります。ユーザーごとの設定やAPIキー管理、追加セットアップは不要です。

Felo Skillsページの完全なインストールガイドでは、Google Antigravityの正式な導入手順とチーム全体での配布ベストプラクティスを紹介しています。

このスキルの特長

YouTube動画の字幕を抽出するツールは既に存在しますが、このスキルの独自性はAntigravityエージェントマネージャーの自律的ワークフロー統合にあります。

ユーザーでなくエージェントが起動。 スラッシュコマンドを使う必要はありません。SKILL.mdの説明がセマンティックトリガーとして機能し、タスクが動画・字幕・文字起こしに関係する場合、自動的にスキルをロードします。通常通り作業すれば、必要なときに自動で動作します。

即利用可能な出力。 このスキルは単に字幕を出すだけではなく、要約、会議メモ、Markdown形式文書など、後工程ですぐ使える形に整形して出力します。

チーム共有型。 .agent/skills/に設置してGit管理すれば、全開発者のAntigravity環境がスキルを自動で取得。個別設定なしでチーム全体が恩恵を受けられます。

複数スキルの連携。 文字起こしは他のFelo Skillsの入力にもなり、LiveDocで永続インデックス化、Slidesでプレゼン生成、Landing Pageでコンテンツ公開といった流れが可能。一つのスキルが一連の機能を解放します。

ビジョン

動画は知識共有の主要フォーマットになりつつあります。しかし、動画コンテンツを扱うツールはまだ追いついていません。多くのチームは今でも動画を「検索不能な一次資料」として扱い、視聴して手作業でメモを取り、そのまま終わっています。

Felo YouTube Subtitling スキルはその流れを変えます。動画を構造化・検索可能・再利用可能なデータとして扱うのです。Felo Skillsエコシステム全体と組み合わせることで、AIエージェントが「実際の仕事を完遂できる」環境を実現します。計画するだけでなく、要約するだけでもなく、あらゆる入力フォーマットから完成した成果物を生み出せるようにするのです。

felo.aiでFelo Skillsの全ラインナップを確認し、各スキルがGoogle Antigravityのエージェントマネージャーにどのように統合されているかを見てみましょう。チームの最も重要な課題に合ったスキルから導入を始め、そこから拡張していきましょう。


この記事は次の言語でもお読みいただけます:English简体中文한국어繁體中文हिन्दीFrançaisالعربيةРусскийاردوBahasa IndonesiaDeutschTiếng ViệtTürkçeItalianoไทยEspañolবাংলাPortuguês