Website Screenshot Agent: Tự động chụp ảnh trang web và tạo báo cáo Markdown với Google Antigravity
Chụp trang web ở quy mô lớn, theo dõi trang của đối thủ, và xuất báo cáo Markdown có cấu trúc cho kiểm toán, theo dõi thị trường, và nghiên cứu định kỳ — tất cả được hỗ trợ bởi kỹ năng website-screenshot-agent dành cho Google Antigravity.

Vấn đề: Giám sát trang web vẫn là công việc thủ công
Nếu bạn từng chịu trách nhiệm theo dõi trang web của đối thủ, cập nhật thay đổi giá, kiểm toán tuân thủ trên hàng chục trang, hoặc chỉ đơn giản là chụp ảnh một trang web đang hoạt động để đưa vào báo cáo, bạn hẳn đã hiểu nỗi mệt mỏi này. Đó là một chu trình lặp lại, thủ công: mở trình duyệt, truy cập đúng URL, chụp ảnh, sao chép và dán nội dung liên quan vào tài liệu — rồi lặp lại. Với một hai trang thì ổn, nhưng năm mươi trang thì sao? Không khả thi chút nào.
Hầu hết các nhóm xử lý vấn đề này bằng các đoạn script Selenium dễ vỡ, dịch vụ SaaS giám sát đắt đỏ, hoặc — nói thật lòng — một bảng tính chia sẻ và sự quyết tâm tốt đẹp. Không cách nào trong số này có thể mở rộng tốt, và tất cả đều cần người xây dựng, bảo trì, và giám sát thủ công.
Kỹ năng website-screenshot-agent thay đổi hoàn toàn phương trình này. Được thiết kế cho Agent Manager của Google Antigravity, nó mang lại cho các agent AI khả năng chụp ảnh toàn trang web ở quy mô lớn và chuyển chúng thành các báo cáo Markdown có cấu trúc — tự động, theo lịch, và không cần thao tác tay trong trình duyệt.
Website Screenshot Agent làm được gì
Cốt lõi của kỹ năng này bổ sung hai khả năng cho agent Antigravity của bạn:
Tự động chụp ảnh trang web. Agent của bạn có thể truy cập bất kỳ URL công khai nào và chụp ảnh toàn bộ trang — không chỉ là phần hiển thị, mà toàn bộ trang được render, từ phần đầu đến phần chân. Ảnh chụp được lưu lại dưới dạng tệp hình ảnh độ phân giải cao, có thể xem, chia sẻ, hoặc lưu trữ.
Báo cáo Markdown có cấu trúc. Ngoài phần hình ảnh, agent còn trích xuất nội dung trang thành Markdown có cấu trúc: tiêu đề, đoạn văn, danh sách, liên kết, và bảng dữ liệu. Kết quả là một báo cáo có thể đọc bằng máy, có thể tìm kiếm, so sánh với bản chụp trước đó, hoặc đưa vào phân tích tiếp theo.
Kết hợp hai khả năng này, một trang web không còn chỉ là giao diện trực quan — nó trở thành nguồn dữ liệu mà agent của bạn có thể xử lý.
Các trường hợp ứng dụng quan trọng
Giám sát trang đối thủ
Nhóm marketing và sản phẩm cần biết khi nào đối thủ thay đổi thông điệp, điều chỉnh giá, ra mắt tính năng mới, hoặc định vị lại giá trị của họ. Việc kiểm tra thủ công danh sách trang đối thủ mỗi tuần từng là cách làm phổ biến. Với website-screenshot-agent, agent Antigravity của bạn có thể chạy tác vụ định kỳ: truy cập URL, chụp ảnh, tạo báo cáo Markdown, và đánh dấu các thay đổi kể từ lần chụp trước.
Đầu ra Markdown có cấu trúc đặc biệt hữu ích ở đây. Bạn có thể so sánh hai phiên bản của cùng một trang bằng chương trình và nhận chính xác bản ghi thay đổi — "đã xóa nút kêu gọi hành động 'Dùng thử miễn phí'", "giá thay đổi từ $49 xuống $39", "một mục tích hợp mới xuất hiện". Đây là thông tin có thể hành động, không chỉ là đống ảnh chụp bạn sẽ chẳng bao giờ xem lại.
Kiểm toán tuân thủ và thiết kế
Đối với các nhóm phát triển quy mô lớn, việc đảm bảo nhất quán trên hàng chục trang đích, trang sản phẩm, và tài liệu luôn là một thách thức. Website-screenshot-agent cho phép bạn ghi lại trạng thái hiện tại của mọi trang và tạo báo cáo có cấu trúc để xem xét một cách có hệ thống.
Nhà kiểm toán thiết kế có thể so sánh ảnh chụp với hướng dẫn phong cách. Bộ phận pháp lý và tuân thủ có thể xác minh rằng các điều khoản, chính sách và thông báo cần thiết đều có mặt và được cập nhật. Báo cáo Markdown giúp dễ dàng tìm kiếm ngôn ngữ hoặc điều khoản cụ thể trên toàn bộ danh mục trang.
Nghiên cứu thị trường định kỳ
Quy trình nghiên cứu thường yêu cầu thu thập thông tin từ nhiều nguồn theo định kỳ. Trang giá, bảng so sánh tính năng, danh mục đối tác, và bản cập nhật tài liệu — tất cả đều thay đổi liên tục. Website-screenshot-agent biến mỗi nguồn thành một điểm dữ liệu có dấu thời gian.
Theo thời gian, bạn xây dựng được tập dữ liệu theo chuỗi dài để theo dõi sự dịch chuyển của thị trường. Đối thủ nào đang thêm tính năng AI? Sản phẩm SaaS nào đang thay đổi cấu trúc gói? Dự án mã nguồn mở nào đang cập nhật lộ trình? Agent sẽ ghi lại bằng chứng; báo cáo có cấu trúc giúp phân tích dễ dàng hơn.
Báo cáo khách hàng và quy trình làm việc của agency
Các agency và chuyên gia tư vấn thường cần ghi lại tình trạng hiện tại của trang web khách hàng ở những mốc cụ thể — trước khi khởi động redesign, sau khi triển khai chiến dịch, hoặc trong các buổi đánh giá hàng quý. Website-screenshot-agent tự động hóa quá trình này: chụp định kỳ kèm bằng chứng hình ảnh và trích xuất nội dung có cấu trúc, được trình bày dưới dạng báo cáo thống nhất.
Cách hoạt động trong Antigravity
Kỹ năng này tuân theo mô hình “cài đặt một lần, dùng mãi” giống như các Felo Skills khác cho Google Antigravity. Bạn chỉ cần sao chép thư mục skill vào thư mục .agent/skills/, commit vào Git, và mọi bản cài đặt Antigravity của các developer sẽ tự động nhận.

Khi cài đặt xong, kỹ năng sẽ tự kích hoạt khi tác vụ của agent khớp với mô tả ngữ nghĩa của nó — bất kỳ thao tác nào liên quan đến chụp trang web, giám sát trang, hoặc kiểm toán hình ảnh. Tệp SKILL.md đóng vai trò như trình kích hoạt: khi agent phát hiện cần chụp trang web, nó sẽ nạp kỹ năng này mà không cần lệnh thủ công hay slash command.
Quy trình làm việc
-
Giao nhiệm vụ. Agent nhận nhiệm vụ như "Theo dõi các trang giá của năm đối thủ này và báo cáo mọi thay đổi."
-
Kích hoạt kỹ năng. Agent Manager nhận ra rằng nhiệm vụ cần chụp trang web và kích hoạt kỹ năng website-screenshot-agent tự động.
-
Chụp và trích xuất. Agent truy cập từng URL, chụp ảnh toàn trang, và trích xuất nội dung thành Markdown có cấu trúc.
-
Tạo báo cáo. Agent tổng hợp kết quả thành báo cáo định dạng sẵn, gồm ảnh chụp và nội dung có cấu trúc. Nếu có bản chụp trước đó, agent có thể so sánh và đánh dấu thay đổi.
-
Gửi kết quả. Báo cáo được xuất dưới dạng tệp Markdown trong không gian làm việc của bạn — có thể tìm kiếm, quản lý phiên bản, và phân tích tiếp.
Tùy chỉnh linh hoạt
Kỹ năng hỗ trợ nhiều chế độ chụp khác nhau:
- Ảnh chụp toàn trang để ghi lại toàn bộ giao diện trực quan của bất kỳ trang nào.
- Ảnh chụp có mục tiêu tập trung vào các phần hoặc khung nhìn cụ thể.
- Xử lý hàng loạt để giám sát nhiều URL trong cùng một tác vụ agent.
- Lên lịch thực thi thông qua công cụ lập lịch của Antigravity, cho phép giám sát định kỳ mà không cần kích hoạt thủ công.
Tại sao cách này vượt trội hơn phương pháp truyền thống
Không cần hạ tầng bảo trì
Các công cụ giám sát web truyền thống yêu cầu máy chủ, cron job, khung tự động hóa trình duyệt và bảo trì liên tục. Website-screenshot-agent chạy bên trong Agent Manager của Antigravity — hệ thống mà nhóm bạn đã dùng. Không cần thêm hạ tầng, không có daemon để giám sát, không cần xoay vòng khóa API.
Đầu ra gốc từ Agent
Phần lớn công cụ ảnh chụp màn hình chỉ cho bạn tệp hình ảnh. Hữu ích để tham khảo, nhưng không phải dữ liệu. Website-screenshot-agent tạo ra cả ảnh chụp và báo cáo Markdown có cấu trúc, giúp kết quả ngay lập tức có thể phân tích, tìm kiếm, so sánh, và tích hợp vào quy trình khác.
Chia sẻ qua Git cho cả nhóm
Như tất cả Felo Skills khác, website-screenshot-agent được phân phối dưới dạng thư mục trong kho mã nguồn. Khi bạn commit kỹ năng này lên Git, mọi developer trong nhóm tự động có khả năng đó. Không cài đặt riêng lẻ, không trôi cấu hình, không còn chuyện “chạy được trên máy tôi mà”.
Kích hoạt theo ngữ cảnh
Kỹ năng không chạy theo lịch tự cấu hình. Nó chỉ kích hoạt khi tác vụ của agent cần — được kích theo khớp ngữ nghĩa trong tệp SKILL.md. Nghĩa là khả năng luôn sẵn sàng nhưng không gây cản trở. Agent làm việc như bình thường, và kỹ năng chỉ hoạt động khi cần chụp trang web.
Bức tranh lớn hơn: Xây dựng hệ thống giám sát toàn diện
Kỹ năng website-screenshot-agent mạnh nhất khi kết hợp với các Felo Skills khác trong quy trình Antigravity của bạn:
- Kết hợp với felo-search để nghiên cứu thị trường trực tiếp, bổ sung dữ liệu giá và thông báo hiện tại cho phần hình ảnh.
- Dùng chung với felo-livedoc để duy trì cơ sở kiến thức lâu dài về định vị của đối thủ mà các agent có thể tham chiếu giữa các phiên làm việc.
- Sử dụng cùng felo-slides để tự động tạo slide thuyết trình từ báo cáo giám sát, phục vụ cập nhật cho các bên liên quan.
- Tích hợp với felo-web-fetch để trích xuất nội dung sâu hơn khi bạn cần dữ liệu có cấu trúc vượt ngoài khả năng của ảnh chụp.
Đây chính là mô hình mà Felo Skills mang lại: mỗi kỹ năng lấp đầy một khoảng trống cụ thể, và khi kết hợp, chúng biến Agent Manager của Antigravity từ công cụ lập kế hoạch thành hệ thống vận hành thực tế, tạo ra kết quả thực và có thể tái sử dụng.
Bắt đầu sử dụng
Cài đặt chỉ mất chưa đến một phút:
# Clone kho Felo Skills
git clone https://github.com/Felo-Inc/felo-skills.git
# Sao chép kỹ năng website-screenshot-agent vào thư mục kỹ năng của Antigravity
cp -r felo-skills/website-screenshot-agent ~/.gemini/antigravity/skills/
Sau đó, commit thư mục skill vào .agent/skills/ của nhóm bạn trong Git. Mọi bản Antigravity của developer sẽ tự động nhận trong lần pull kế tiếp.
Kỹ năng này hoàn toàn miễn phí và mở cho cộng đồng. Bạn có thể duyệt qua các kỹ năng khác, so sánh tính năng, và tìm hướng dẫn cài đặt đầy đủ tại felo.ai/skills/antigravity.
Kết luận
Giám sát trang web không cần phải là công việc thủ công hay dự án hạ tầng nặng nề. Kỹ năng website-screenshot-agent cho Google Antigravity mang đến cho các agent AI của bạn khả năng chụp trang web ở quy mô lớn, trích xuất nội dung có cấu trúc và tạo báo cáo — tất cả trong quy trình làm việc mà nhóm bạn đã quen thuộc.
Dù bạn đang theo dõi thay đổi của đối thủ, kiểm toán tuân thủ, nghiên cứu thị trường định kỳ, hay ghi lại trạng thái trang web khách hàng, kỹ năng này biến quá trình thủ công nhàm chán thành quy trình tự động, đáng tin cậy, và có thể tìm kiếm.
Khám phá thêm các kỹ năng và khả năng khác tại felo.ai.
Bài viết này cũng có sẵn bằng English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Türkçe, Italiano, ไทย, Español, বাংলা and Português.