Google Antigravity·Kỹ năng tác nhân·Định tuyến SKILL.md

Website Screenshot Agent Kỹ năng Google Antigravity

Browser Subagent của Antigravity có thể điều khiển Chrome — nhưng chụp, chú thích và tổ chức ảnh chụp màn hình thành một báo cáo có cấu trúc là một công việc khác. Website Screenshot Agent đọc một kế hoạch capture dạng Markdown, truy cập từng URL, chụp ảnh màn hình, xử lý các trang đã xác thực và tổng hợp một báo cáo có tài liệu mà nhóm có thể xem xét và chia sẻ.

Antigravity Agent — task log
Google Antigravity skill
Kế hoạch capture Markdown kiểm soát đầu ra
git clone + folder copy
one-command setup
Batch
ảnh chụp được tổ chức theo kế hoạch của bạn
Markdown
qua .agent/skills/ trong Git
Cách hoạt động

Các tác vụ agent tự động kích hoạt doc-screenshot-agent

Đây là những prompt mà Agent Manager của Antigravity định tuyến đến doc-screenshot-agent — khi tác vụ cần bằng chứng trực quan, không chỉ văn bản.

01 · Người dùng
Lệnh đã gửi
Bạn nhập tác vụ trong Antigravity. Không cần cú pháp đặc biệt.
02 · Agent Manager
Phân tích tác vụ
Gemini 3 lập kế hoạch tác vụ và phát hiện rủi ro giới hạn kiến thức.
03 · Bộ định tuyến SKILL.md
Khớp ngữ nghĩa
Mô tả SKILL.md khớp với tác vụ. Kỹ năng được tải.
04 · Kỹ năng
Thực thi kỹ năng
Kỹ năng phù hợp chạy và tìm nạp hoặc xử lý dữ liệu.
05 · Đầu ra
Câu trả lời có trích dẫn nội tuyến
Câu trả lời có cấu trúc kèm liên kết nguồn được trả về cho tác nhân.
Scenario 01

Tài liệu QA

Tác vụ agent liên quan đến việc chụp trạng thái hiện tại của luồng UI cho báo cáo QA.

Chụp trạng thái hiện tại của luồng thanh toán của chúng tôi cho báo cáo QA.
Scenario 02

So sánh trước/sau

Agent cần ghi lại thay đổi UI bằng bằng chứng trực quan.

Chụp trang đăng nhập trước và sau khi thiết kế lại cho ghi chú phát hành.
Scenario 03

Phân tích UI của đối thủ

Tác vụ agent liên quan đến việc chụp và phân tích UI của đối thủ cho buổi đánh giá thiết kế.

Chụp màn hình trang chi tiết issue của Linear và trích xuất các mẫu UI được sử dụng.
Cách hoạt động

doc-screenshot-agent bổ sung gì cho Antigravity

Sáu khả năng cho phép agent chụp và lập luận về bằng chứng trực quan mà không cần rời khỏi IDE.

Chụp bằng chứng trực quan

Agent chụp ảnh màn hình của bất kỳ URL nào như một phần của tác vụ tài liệu hoặc QA.

Chụp cấp độ phần tử

Nhắm vào các phần tử UI cụ thể hoặc các phần của trang — không chỉ ảnh chụp toàn trang.

Ảnh chụp sang văn bản

Trích xuất văn bản có thể đọc từ ảnh chụp đã thu thập để agent suy luận thêm.

So sánh trước/sau

Agent chụp trạng thái trước và sau một thay đổi để tạo tài liệu so sánh trực quan.

Lưu trữ artifact

Ảnh chụp được lưu trữ và tham chiếu bằng URL trong đầu ra của agent.

Tự động định tuyến SKILL.md

Được kích hoạt khi tác vụ agent liên quan đến tài liệu trực quan, QA, hoặc xác minh UI.

Trường hợp sử dụng

Tác vụ thực tế, quy trình thực tế

Cách các nhà phát triển sử dụng kỹ năng này trong Antigravity — từ tra cứu nhanh đến các quy trình làm việc phức tạp nhiều bước.

So sánh trước/sau
02

So sánh trước/sau

Agent cần ghi lại thay đổi UI bằng bằng chứng trực quan.

Chụp trang đăng nhập trước và sau khi thiết kế lại cho ghi chú phát hành.
Phân tích UI của đối thủ
03

Phân tích UI của đối thủ

Tác vụ agent liên quan đến việc chụp và phân tích UI của đối thủ cho buổi đánh giá thiết kế.

Chụp màn hình trang chi tiết issue của Linear và trích xuất các mẫu UI được sử dụng.
Installation

Ba bước để capture trực quan có cấu trúc trong Antigravity

Sau khi cài đặt, Agent Manager kích hoạt doc-screenshot-agent khi tác vụ cần bằng chứng trực quan — agent đọc kế hoạch capture và tự động tạo báo cáo có tài liệu.

Phương pháp 1 · Terminal

Cài đặt qua dòng lệnh

Sao chép kho kỹ năng Felo và copy kỹ năng vào thư mục kỹ năng Antigravity toàn cục của bạn.

Terminal
# Clone the Felo skills repository git clone https://github.com/Felo-Inc/felo-skills.git # Copy this skill to your global Antigravity skills folder cp -r felo-skills/doc-screenshot-agent ~/.gemini/antigravity/skills/
Cài đặt vào ~/.gemini/antigravity/skills/ — khả dụng trên tất cả dự án của bạn
Phương pháp 2 · Lệnh tác nhân

Để tác nhân cài đặt cho bạn

Dán lệnh này trực tiếp vào Antigravity. Tác nhân sẽ sao chép kho và copy kỹ năng tự động.

Dán vào Antigravity
Cài đặt https://github.com/Felo-Inc/felo-skills vào thư mục kỹ năng toàn cục Antigravity của tôi.
Tác nhân xử lý việc sao chép, copy và thiết lập thư mục — không cần terminal
1

Copy skill vào .agent/skills/

Clone repo Felo skills và copy doc-screenshot-agent vào .agent/skills/ để truy cập toàn nhóm qua Git. Mô tả SKILL.md kích hoạt nó cho các tác vụ yêu cầu capture trang trực quan hoặc tài liệu UI.

2

Viết kế hoạch capture dạng Markdown

Tạo file .md liệt kê các URL, phần và bằng chứng bạn muốn capture. Skill đọc kế hoạch, truy cập từng trang theo thứ tự và tổ chức ảnh chụp theo hướng dẫn của bạn — bao gồm cả các trang đã xác thực khi credentials được thiết lập.

3

Agent cung cấp một báo cáo trực quan có cấu trúc

Skill tạo ra báo cáo Markdown với ảnh chụp màn hình nhúng, được tổ chức theo kế hoạch capture của bạn. Agent Manager có thể đưa báo cáo này vào một sản phẩm lớn hơn — phân tích cạnh tranh, tóm tắt QA, đánh giá thiết kế — mà không cần làm ảnh chụp thủ công.

Không cần cấu hình. Tệp SKILL.md bên trong thư mục kỹ năng cho Agent Manager của Antigravity biết khi nào cần kích hoạt. Sau khi thư mục được đặt đúng chỗ, tác nhân sẽ tự động định tuyến đến kỹ năng dựa trên lệnh của bạn.

FAQ

Website Screenshot Agent trong Google Antigravity — FAQ

Browser Subagent là tương tác — nó click, cuộn và phản hồi hướng dẫn của agent theo thời gian thực. doc-screenshot-agent hướng đến xử lý hàng loạt: cho nó một kế hoạch capture Markdown và nó thực hiện toàn bộ danh sách, tạo ra báo cáo có cấu trúc. Phù hợp hơn cho các tác vụ tài liệu có hệ thống khi bạn biết chính xác cần capture gì.

Trao cho agent Antigravity lớp bằng chứng trực quan cho kiểm tra, đánh giá và giám sát

Cài đặt doc-screenshot-agent vào .agent/skills/ và để Agent Manager capture, chú thích và báo cáo về các trang web như một phần của bất kỳ workflow nghiên cứu hay QA nào.

Một API key. Commit vào .agent/skills/ và agent của bạn có thể ghi chép web trực quan — bao gồm cả các trang đã xác thực.