Apify

Phát triển

Chạy các actor thu thập dữ liệu web và tự động hóa qua Neotask trên OpenClaw

Bạn Có Thể Làm Gì

Neotask kết nối với Apify qua OpenClaw, cho bạn quyền truy cập hội thoại vào nền tảng Apify — chạy actor thu thập dữ liệu, quản lý tập dữ liệu và trích xuất dữ liệu web mà không cần viết code hay điều hướng giao diện Apify.

Chạy Actor

  • Kích hoạt actor — Khởi động bất kỳ actor Apify nào theo tên với các tham số đầu vào phù hợp — URL cần thu thập, selector, cài đặt phân trang và định dạng đầu ra
  • Scraper dựng sẵn — Truy cập kho scraper Apify với các công cụ sẵn sàng dùng cho Amazon, Google, LinkedIn, Twitter/X, Google Maps và hàng trăm trang phổ biến khác
  • Theo dõi tiến trình — Kiểm tra trạng thái chạy actor — đang chạy, thành công hay thất bại — và lấy log để gỡ lỗi
  • Dừng tiến trình — Hủy actor đang chạy cho ra kết quả không mong muốn hay đã vượt quá thời gian
  • Quản Lý Tập Dữ Liệu

  • Lấy kết quả — Lấy dữ liệu từ bất kỳ tập dữ liệu Apify nào theo ID, tên hay từ tiến trình actor vừa hoàn thành
  • Lọc kết quả — Áp dụng bộ lọc và giới hạn khi lấy dữ liệu lớn
  • Xóa dữ liệu cũ — Dọn dẹp các tiến trình và tập dữ liệu không còn cần thiết
  • Kho Actor Apify

  • Tìm actor — Khám phá kho actor Apify để tìm scraper cho trang web hay trường hợp dùng cụ thể
  • Xem tài liệu actor — Lấy thông tin đầu vào/đầu ra của actor trước khi kích hoạt
  • Thử Hỏi

  • "Chạy actor Google Search Scraper của Apify với từ khóa 'best vector databases' và lấy 50 kết quả hàng đầu"
  • "Thu thập tất cả danh sách sản phẩm từ trang này: [URL]"
  • "Trạng thái các tiến trình actor Apify đang chạy của tôi là gì?"
  • "Lấy dữ liệu từ tập dữ liệu Apify vừa hoàn thành"
  • "Tìm actor Apify để thu thập dữ liệu LinkedIn công ty"
  • "Hủy tiến trình actor đang chạy của tôi"
  • Mẹo Chuyên Nghiệp

  • Khi kích hoạt actor thu thập dữ liệu, hãy cụ thể về các trường đầu ra bạn cần để tránh lấy dữ liệu thừa làm chậm tiến trình
  • Kiểm tra tài liệu actor trước khi chạy — mỗi actor có yêu cầu đầu vào khác nhau
  • Đối với các trang web thường xuyên thay đổi, hãy lập lịch chạy actor định kỳ thay vì chạy thủ công
  • Kết hợp kết quả scraping Apify với xử lý dữ liệu: thu thập dữ liệu cạnh tranh rồi tóm tắt và xuất sang Google Sheets
  • Works Well With