Skip to main content

Felo Web Fetch cho Google Antigravity: Trích xuất thông tin sản phẩm và web dưới dạng dữ liệu có cấu trúc

· 11 phút đọc
Felo Search Tips Buddy
Committed to answers at your fingertips

Tìm hiểu cách kỹ năng Felo Web Fetch giúp các tác nhân Google Antigravity có khả năng trích xuất các trang web thành Markdown, HTML hoặc văn bản sạch phục vụ nghiên cứu sản phẩm, phân tích cạnh tranh và thu thập dữ liệu có cấu trúc.

Felo Web Fetch trích xuất các trang web thành dữ liệu Markdown có cấu trúc

Vấn đề mà các tác nhân Antigravity gặp phải đầu tiên

Bạn giao cho tác nhân Google Antigravity của mình một nhiệm vụ nghiên cứu. Có thể đó là so sánh giá SaaS, lấy danh sách tính năng của đối thủ hoặc thu thập tài liệu nguồn cho bản tóm tắt. Tác nhân lập kế hoạch rất tốt. Nó biết cần gì. Nhưng rồi nó gặp phải giới hạn: dữ liệu huấn luyện của Gemini 3 có ngày cắt, và tác nhân không thể tự truy cập web thời gian thực.

Đó là lúc Felo Skills xuất hiện. Cụ thể là kỹ năng Felo Web Fetch lấp đầy khoảng trống trích xuất — biến bất kỳ trang web nào thành Markdown, HTML hoặc văn bản thuần sạch mà tác nhân Antigravity của bạn có thể sử dụng.

Felo Web Fetch là gì?

Felo Web Fetch là một kỹ năng dạng thư mục mà bạn đặt vào thư mục .agent/skills/ của Google Antigravity. Sau khi cài đặt, nó trở thành một khả năng kích hoạt tự động — tác nhân của bạn không cần nhập lệnh slash hay sao chép-dán URL. Khi một nhiệm vụ yêu cầu đọc trang web, Agent Manager sẽ khớp nhiệm vụ với mô tả của kỹ năng và tự động chạy nó.

Kỹ năng này sử dụng Felo Web Extract API (POST /v2/web/extract) để lấy nội dung từ bất kỳ URL nào và trả về ở định dạng phù hợp với quy trình của bạn:

Định dạng đầu raKhi nào sử dụng
MarkdownTốt nhất cho AI — cấu trúc sạch với tiêu đề, danh sách và liên kết được giữ nguyên
HTMLKhi cần cấu trúc DOM thô để xử lý thêm
TextTrích xuất văn bản thuần, hữu ích cho việc quét nhanh hoặc xử lý văn bản tiếp theo

Cài đặt từ felo.ai/skills/antigravity — chỉ cần sao chép thư mục vào .agent/skills/ và commit vào Git. Mỗi nhà phát triển trong nhóm của bạn sẽ có khả năng này ngay sau lần pull tiếp theo.

Cách hoạt động bên trong Antigravity

Đường dẫn cài đặt được thiết kế để đơn giản:

# Sao chép kho kỹ năng Felo
git clone https://github.com/Felo-Inc/felo-skills.git

# Sao chép kỹ năng web-fetch vào thư mục kỹ năng Antigravity của bạn
cp -r felo-skills/felo-web-fetch ~/.gemini/antigravity/skills/

Khi thư mục felo-web-fetch nằm trong .agent/skills/, tệp SKILL.md thực hiện phần việc chính. Trường mô tả của nó hoạt động như một kích hoạt ngữ nghĩa. Khi tác nhân của bạn gặp nhiệm vụ như "so sánh giá giữa ba sản phẩm SaaS này" hoặc "trích xuất danh sách tính năng từ trang đối thủ này", Agent Manager sẽ tự động nạp kỹ năng — không cần gọi thủ công.

Khả năng cốt lõi

1. Chế độ đọc dễ hiểu để trích xuất bài viết sạch

Không phải trang web nào cũng có cấu trúc tốt. Blog, bài báo và trang tài liệu thường chứa thanh điều hướng, sidebar, footer và quảng cáo. Felo Web Fetch hỗ trợ chế độ đọc dễ hiểu (--with-readability true) giúp trích xuất chỉ nội dung chính của bài viết, loại bỏ mọi phần thừa.

Điều này đặc biệt hữu ích cho các tác nhân Antigravity khi nghiên cứu: thay vì phải xử lý 200KB “rác” của trang, tác nhân nhận được phần nội dung trọng tâm, dễ đọc — chính xác phần cần cho phân tích.

2. Nhắm mục tiêu bằng CSS Selector cho trích xuất chính xác

Đôi khi bạn không muốn toàn bộ trang. Bạn chỉ muốn bảng giá trong .pricing-section, hoặc phần nhật ký thay đổi trong div.changelog. Felo Web Fetch cho phép tham số --target-selector, giúp bạn trích xuất chỉ những phần tử DOM bạn cần.

Trong các quy trình phân tích cạnh tranh, điều này có nghĩa là tác nhân có thể lấy bảng giá có cấu trúc, bảng so sánh tính năng hoặc thông số kỹ thuật sản phẩm mà không cần lọc qua nội dung thừa.

3. Chế độ thu thập: Nhanh vs. Chi tiết

Chế độPhù hợp với
fastTrang tĩnh, tài liệu, bài đăng blog — các trang hiển thị ngay
fineTrang nhiều JavaScript, SPA, hoặc trang cần thời gian để tải nội dung động

Mặc định của Agent Manager là fast để đạt hiệu suất cao. Khi trích xuất từ trang sản phẩm dựa trên React hoặc bảng điều khiển cần đăng nhập, bạn nên chuyển sang fine để đảm bảo toàn bộ nội dung được tải trước khi trích xuất.

Đối với những trang yêu cầu đăng nhập, Felo Web Fetch hỗ trợ truyền cookie (--cookie "session_id=xxx") và chuỗi user-agent tùy chỉnh. Điều này cho phép tác nhân Antigravity trích xuất nội dung từ bảng điều khiển nội bộ, cổng tài liệu nội bộ hoặc trang đối tác — mở rộng nguồn dữ liệu vượt ra ngoài các URL công khai.

5. Tóm tắt có cấu trúc: Liên kết và hình ảnh

Ngoài nội dung thô, kỹ năng còn có thể bao gồm:

  • --with-links-summary true — trích xuất và tóm tắt tất cả liên kết
  • --with-images-summary true — trích xuất tất cả hình ảnh kèm metadata
  • --with-images-readability true — ghép hình ảnh với ngữ cảnh xung quanh

Đối với tác nhân nghiên cứu tổng hợp sản phẩm, các tóm tắt này trở thành điểm dữ liệu có cấu trúc — liên kết tham khảo để đối chiếu, URL hình ảnh để so sánh trực quan, và metadata ngữ cảnh làm phong phú nội dung đầu ra cuối cùng.

Ứng dụng thực tế

Quy trình thu thập dữ liệu web phục vụ phân tích cạnh tranh với Felo Web Fetch

Phân tích cạnh tranh quy mô lớn

Giả sử tác nhân Antigravity của bạn được giao nhiệm vụ theo dõi trang sản phẩm của ba đối thủ mỗi tuần. Với Felo Web Fetch, tác nhân:

  1. Tự động truy cập từng trang giá của đối thủ
  2. Trích xuất nội dung dưới dạng Markdown sạch
  3. So sánh tính năng, gói giá và cập nhật mới với chuẩn gốc của bạn
  4. Đánh dấu mọi thay đổi kể từ lần trích xuất gần nhất

Tác nhân không cần bạn tự đi lấy từng trang. Kỹ năng kích hoạt khi nhiệm vụ khớp, tự trích xuất dữ liệu và đưa lại vào luồng xử lý của tác nhân.

Nghiên cứu sản phẩm và quyết định mua hàng

Khi một nhiệm vụ của tác nhân yêu cầu đánh giá công cụ, dịch vụ hoặc nền tảng, Felo Web Fetch giúp truy cập các trang sản phẩm hiện tại — không dựa vào dữ liệu huấn luyện cũ. Tác nhân trích xuất thông số kỹ thuật, giá, danh sách tích hợp và đánh giá khách hàng trực tiếp từ nguồn gốc, tạo ra báo cáo mua hàng dựa trên thông tin thực tế và cập nhật.

Tài liệu nguồn cho sáng tạo nội dung

Các nhóm nội dung sử dụng Antigravity để soạn bản tóm tắt, phân tích thị trường và báo cáo nghiên cứu. Felo Web Fetch cung cấp tư liệu gốc cho tác nhân từ các trang web gốc — đảm bảo đầu ra của tác nhân được dựa trên nguồn chính xác thay vì suy diễn.

Phát hiện thay đổi tài liệu và API

Đối với các nhóm kỹ thuật, việc phát hiện thay đổi trong tài liệu API, SDK hoặc cổng nhà phát triển là điều quan trọng. Felo Web Fetch có thể trích xuất các trang tài liệu dưới dạng Markdown, sau đó tác nhân so sánh với phiên bản trước để nhận diện thay đổi gây hỏng, endpoint mới hoặc chức năng bị loại bỏ.

Tham chiếu API cho nhà phát triển

Nếu bạn tích hợp Felo Web Fetch thông qua lập trình (ngoài Antigravity), API rất dễ sử dụng:

curl -X POST "https://openapi.felo.ai/v2/web/extract" \
-H "Authorization: Bearer $FELO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"url": "https://example.com/product",
"output_format": "markdown",
"with_readability": true,
"crawl_mode": "fast"
}'

Các tham số yêu cầu chính:

Tham sốKiểuMặc địnhMô tả
urlstringURL trang web cần trích xuất
output_formatstringhtmlhtml, markdown, hoặc text
crawl_modestringfastfast hoặc fine
with_readabilitybooleanChỉ trích nội dung chính
target_selectorstringCSS selector cho phần tử cụ thể
wait_for_selectorstringChờ phần tử trước khi trích xuất
timeoutintegerThời gian chờ tính bằng mili giây
set_cookiesarrayCookie cho các trang yêu cầu đăng nhập

Phản hồi thành công sẽ trả về nội dung đã trích xuất trong data.content, được cấu trúc theo định dạng đầu ra bạn chọn.

Tại sao điều này quan trọng với đội Antigravity

Giá trị của Felo Web Fetch không chỉ nằm ở việc trích xuất — mà còn ở những gì việc trích xuất cho phép trong quy trình của tác nhân Antigravity:

1. Tác nhân làm việc với dữ liệu hiện tại, không phải kiến thức lưu trữ. Gemini 3 không thể duyệt web. Felo Web Fetch lấp khoảng trống đó, cung cấp cho tác nhân nội dung thật của bất kỳ URL nào tại thời điểm trích xuất.

2. Đầu ra có cấu trúc mang lại suy luận có cấu trúc. Khi nội dung ở dạng Markdown sạch, tác nhân có thể phân tích tiêu đề, danh sách, bảng và khối mã — giúp phân tích dựa trên cấu trúc thực tế của trang.

3. Không có sai lệch cấu hình. Vì kỹ năng nằm trong .agent/skills/ và được commit lên Git, tất cả nhà phát triển đều có cùng khả năng. Không cần cấu hình cá nhân, không có khác biệt môi trường.

4. Hoạt động liền mạch cùng các Felo Skills khác. Kết hợp Felo Web Fetch với Felo Search để xác minh nghiên cứu thời gian thực, hoặc với Felo Slides để biến nội dung trích xuất thành slide thuyết trình. Agent Manager tự động điều phối giữa các kỹ năng.

Bắt đầu sử dụng

Đưa Felo Web Fetch vào quy trình Antigravity của bạn chỉ mất vài phút:

  1. Truy cập felo.ai và tạo khóa API (Settings → API Keys)
  2. Đặt biến môi trường: export FELO_API_KEY="your-api-key-here"
  3. Sao chép thư mục kỹ năng vào thư mục .agent/skills/
  4. Commit lên Git để các tác nhân trong nhóm tự động nhận được

Vậy là xong. Tác vụ tiếp theo của tác nhân có liên quan đến việc đọc trang web sẽ tự động kích hoạt Felo Web Fetch — không cần thao tác thủ công, không gián đoạn ngữ cảnh.

Bức tranh toàn cảnh

Felo Web Fetch là một phần trong hệ sinh thái lớn hơn của Felo Skills cho Google Antigravity. Cùng nhau, các kỹ năng này biến Agent Manager của Antigravity từ một công cụ lập kế hoạch thành một nền tảng nghiên cứu và sản xuất hoàn chỉnh — thu hẹp khoảng trống kiến thức, duy trì trí nhớ nhóm và xuất ra sản phẩm hoàn thiện.

Lớp trích xuất mà Felo Web Fetch mang lại thường là kỹ năng đầu tiên các đội cài đặt, vì nó giải quyết ngay vấn đề lớn nhất: tác nhân của bạn cần đọc web, và Gemini 3 không thể tự làm điều đó. Khi trích xuất đã hoạt động, việc thêm tìm kiếm trực tiếp, cơ sở kiến thức bền vững và sinh nội dung đầu ra trở thành bước tiếp theo tự nhiên.

Sẵn sàng trao cho các tác nhân Antigravity khả năng trích xuất, phân tích và hành động dựa trên nội dung web thực? Bắt đầu với Felo Web Fetch — miễn phí, dạng thư mục và sẵn sàng cho đội của bạn ngay khi sử dụng.


Bài viết này cũng có sẵn bằng English, 简体中文, 日本語, 한국어, 繁體中文, हिन्दी, Français, العربية, Русский, اردو, Bahasa Indonesia, Deutsch, Türkçe, Italiano, ไทย, Español, বাংলা and Português.