Google Antigravity·智能代理技能·SKILL.md 路由

讓 Antigravity 代理擷取視覺證據,而不只是文字

Antigravity 的 Browser Subagent 可以控制 Chrome——但擷取、標注截圖並整理成結構化報告是另一項工作。Website Screenshot Agent 讀取 Markdown 擷取計畫,逐一造訪每個 URL,截取截圖,處理需要登入的頁面,並整合成團隊可審閱和分享的文件報告。

同樣支援 Claude Code · OpenClaw · 所有平台
Antigravity Agent — task log
計畫驅動
Markdown 擷取說明控制輸出
支援登入
處理需要登入的頁面
結構化報告
截圖按計畫整理
團隊共用
透過 Git 中的 .agent/skills/
運作方式

自動觸發 doc-screenshot-agent 的 Agent 任務

這些是 Antigravity 的 Agent Manager 路由到 doc-screenshot-agent 的場景——當任務需要頁面當前狀態的視覺證據。

01 · 使用者
傳送提示詞
在 Antigravity 中輸入任務,無需特殊語法。
02 · Agent Manager
任務分析
Gemini 3 規劃任務並偵測知識截止日期風險。
03 · SKILL.md 路由器
語意比對
SKILL.md 描述與任務相符,技能隨即載入。
04 · 技能
技能執行
比對到的技能執行並擷取或處理資料。
05 · 輸出
內嵌引用答案
附有來源連結的結構化答案回傳給代理。
Scenario 01

競品 UI 截圖

Agent 任務涉及記錄競品產品的當前外觀。

截取 Vercel 控制台定價頁面,擷取當前方案比較表。
Scenario 02

視覺回歸證據

Agent 需要頁面變更前後的視覺記錄。

在部署重新設計之前,截取我們落地頁的當前狀態。
Scenario 03

需登入頁面截圖

Agent 任務涉及截取需要登入才能存取的頁面。

截取我們的內部管理後台,擷取當前使用者指標視圖。
運作方式

doc-screenshot-agent 為 Antigravity 帶來的能力

六項能力,讓代理無需離開 IDE 即可擷取視覺證據並進行推理。

視覺證據擷取

代理擷取任何 URL 的截圖,作為文件化或 QA 任務的一部分。

元素級擷取

鎖定特定 UI 元素或頁面區塊——而非僅限全頁截圖。

截圖轉文字

從擷取的截圖中提取可讀文字,供代理進一步推理。

前後對比

代理擷取變更前後的狀態,用於視覺差異文件化。

成品儲存

截圖儲存後以 URL 形式在代理輸出中引用。

SKILL.md 自動路由

當代理任務涉及視覺文件化、QA 或 UI 驗證時自動啟動。

使用情境

真實任務,真實工作流程

開發者在 Antigravity 中使用此技能的方式——從快速查詢到複雜的多步驟工作流程。

視覺回歸證據
02

視覺回歸證據

Agent 需要頁面變更前後的視覺記錄。

在部署重新設計之前,截取我們落地頁的當前狀態。
需登入頁面截圖
03

需登入頁面截圖

Agent 任務涉及截取需要登入才能存取的頁面。

截取我們的內部管理後台,擷取當前使用者指標視圖。
Installation

在 Antigravity 中實現結構化視覺擷取的三個步驟

安裝完成後,Agent Manager 會在任務需要視覺證據時觸發 doc-screenshot-agent——代理讀取擷取計畫並自動產出文件報告。

方式 1 · 終端機

透過命令列安裝

複製 Felo 技能儲存庫,並將技能複製到 Antigravity 全域技能目錄中。

Terminal
# Clone the Felo skills repository git clone https://github.com/Felo-Inc/felo-skills.git # Copy this skill to your global Antigravity skills folder cp -r felo-skills/doc-screenshot-agent ~/.gemini/antigravity/skills/
安裝至 ~/.gemini/antigravity/skills/ — 在所有專案中均可使用
方式 2 · 代理提示詞

讓代理自動安裝

將此提示詞直接貼上到 Antigravity 中,代理會自動複製儲存庫並複製技能。

貼上到 Antigravity
請幫我將 https://github.com/Felo-Inc/felo-skills 安裝到 Antigravity 的全域技能目錄中。
代理負責複製、貼上和目錄設定,無需開啟終端機
1

將技能複製到 .agent/skills/

複製 Felo 技能儲存庫,並將 doc-screenshot-agent 複製到 .agent/skills/ 以透過 Git 供團隊共用。資料夾內的 SKILL.md 描述會在需要視覺頁面擷取或 UI 文件化的任務中啟動它。

2

撰寫 Markdown 擷取計畫

建立一個 .md 檔案,列出你要擷取的 URL、區塊和證據。技能讀取計畫後,依序造訪每個頁面,並按你的指示整理截圖——設定憑證後也支援需要登入的頁面。

3

代理交付結構化視覺報告

技能產出一份嵌入截圖的 Markdown 報告,按你的擷取計畫組織。Agent Manager 可將此報告納入更大的交付成果——競品分析、QA 摘要、設計評審——無需任何手動截圖工作。

無需任何設定。技能資料夾內的 SKILL.md 檔案會告知 Antigravity 的 Agent Manager 何時啟動該技能。資料夾就位後,代理會根據你的提示詞自動路由到對應技能。

FAQ

Website Screenshot Agent 在 Google Antigravity 中 — 常見問題

Browser Subagent 是互動式的——它即時點擊、捲動並回應代理的指令。doc-screenshot-agent 是批次導向的:給它一份 Markdown 擷取計畫,它會執行完整清單並產出結構化報告。更適合你確切知道需要擷取什麼的系統性文件化任務。

為 Antigravity 代理提供視覺證據層,用於審計、評審和監控

將 doc-screenshot-agent 安裝到 .agent/skills/,讓 Agent Manager 能在任何研究或 QA 工作流中擷取、標注並報告網頁內容。

一組 API 金鑰。提交到 .agent/skills/ 後,你的代理即可記錄視覺網頁——包括需要登入的頁面。