Platform Overview - Neotask by Neotask Documentation | Neotask
Tổng quan nền tảng
Open Claw là gì?
Open Claw là công cụ cốt lõi cung cấp sức mạnh cho hệ sinh thái Neotask. Đây là một Gateway — một dịch vụ chạy lâu dài duy nhất quản lý mọi thứ: các phiên tác nhân, tích hợp nhắn tin, thực thi công cụ, các tự động hóa theo lịch và kết nối thiết bị.
Hãy nghĩ về nó như não bộ mà ứng dụng desktop Neotask, ứng dụng di động và bảng điều khiển web của bạn đều kết nối vào. Trong khi bạn tương tác qua các giao diện đó, Open Claw đang làm phần công việc nặng nhọc phía sau hậu trường.
Kiến trúc
Open Claw sử dụng mô hình hub-and-spoke:
Gateway là hub trung tâm — một máy chủ WebSocket chạy trên máy của bạn (hoặc trên đám mây). Nó quản lý tất cả các phiên tác nhân, định tuyến tin nhắn giữa các kênh, điều phối thực thi công cụ và duy trì trạng thái.
Máy khách (ứng dụng desktop, ứng dụng di động, bảng điều khiển web hoặc terminal) kết nối với Gateway và gửi/nhận tin nhắn qua nó.
Node (ứng dụng đồng hành trên iOS, Android, macOS) hiển thị khả năng thiết bị — camera, canvas, ghi màn hình, vị trí và giọng nói — cho các tác nhân chạy trên Gateway.
Kênh (WhatsApp, Telegram, Discord, Slack, v.v.) là các phương tiện truyền tải nhắn tin mà Gateway kết nối để gửi và nhận tin nhắn.Tất cả các hoạt động AI đi qua pipeline Gateway → Nhà cung cấp LLM. Ứng dụng desktop không bao giờ gọi LLM trực tiếp.
Khả năng chính
Nhắn tin đa kênh
Kết nối đồng thời với 20+ nền tảng nhắn tin. Các tác nhân của bạn có thể gửi và nhận tin nhắn trên WhatsApp, Telegram, Discord, Slack, Signal, iMessage, Google Chat, Microsoft Teams, Matrix, IRC và nhiều nền tảng khác — tất cả từ một phiên bản Gateway duy nhất. Xem
Kênh.
Hệ thống đa tác nhân
Chạy nhiều tác nhân được cô lập, mỗi tác nhân có không gian làm việc, cá tính, cấu hình mô hình và các liên kết kênh riêng. Định tuyến tin nhắn đến từ các kênh, máy chủ hoặc liên hệ cụ thể đến đúng tác nhân một cách tự động. Xem
Tác nhân.
Khả năng thiết bị qua Node
Kết nối các ứng dụng đồng hành iOS, Android và macOS dưới dạng "node" hiển thị phần cứng thiết bị cho các tác nhân của bạn. Các tác nhân có thể chụp ảnh, ghi video, chụp màn hình, lấy vị trí GPS, kết xuất canvas tương tác và chạy lệnh hệ thống — tất cả qua ngôn ngữ tự nhiên. Xem
Ứng dụng đồng hành.
Tự động hóa trình duyệt
Các tác nhân có thể điều khiển trình duyệt Chromium đầy đủ — mở trang, nhấp vào phần tử, điền biểu mẫu, chụp ảnh màn hình, trích xuất nội dung, tải lên tệp và chạy JavaScript. Nhiều hồ sơ trình duyệt được hỗ trợ để cô lập tài khoản. Xem
Công cụ & Khả năng.
Canvas & A2UI
Hệ thống Agent-to-UI (A2UI) cho phép các tác nhân kết xuất nội dung trực quan tương tác trên các thiết bị kết nối. Các tác nhân có thể trình bày trang web, đẩy các cập nhật giao diện người dùng có cấu trúc, thực thi JavaScript trong ngữ cảnh canvas và chụp ảnh nhanh những gì đang hiển thị. Xem
Công cụ & Khả năng.
Hỗ trợ mô hình linh hoạt
Sử dụng bất kỳ nhà cung cấp LLM lớn nào — Anthropic (Claude), OpenAI (GPT), Google (Gemini), Together AI, Moonshot, OpenRouter và nhiều hơn nữa. Cấu hình chuỗi dự phòng mô hình, bí danh và ghi đè mô hình theo từng tác nhân. Chạy các mô hình cục bộ qua Ollama hoặc vLLM. Xem
Mô hình & Nhà cung cấp.
Hệ sinh thái plugin & kỹ năng
Mở rộng Open Claw với các plugin thêm các kênh, công cụ, phương thức RPC và khả năng mới. Duyệt và cài đặt kỹ năng từ ClawHub, thị trường kỹ năng cộng đồng. Tạo kỹ năng của riêng bạn để dạy tác nhân các quy trình làm việc mới. Xem
Plugin & Kỹ năng.
Lập lịch & Tự động hóa
Lên lịch đánh thức tác nhân với biểu thức cron, lời nhắc một lần hoặc các kích hoạt dựa trên khoảng thời gian. Các tác nhân có thể chạy các nhiệm vụ tự động, giao kết quả đến các kênh hoặc đăng lên webhook. Xem
Tự động hóa.
Tương tác giọng nói
Sử dụng từ đánh thức để kích hoạt tác nhân bằng giọng nói. Chế độ nói chuyện cho phép các cuộc trò chuyện giọng nói liên tục với chuyển giọng nói thành văn bản theo thời gian thực và chuyển văn bản thành giọng nói (ElevenLabs, OpenAI). Daemon Swabble trên macOS cung cấp phát hiện giọng nói luôn bật, trên thiết bị. Xem
Giọng nói.
Thông minh phiên
Các phiên tự động đặt lại hàng ngày, nén khi tiếp cận giới hạn ngữ cảnh và tồn tại qua các lần khởi động lại. Tìm kiếm bộ nhớ cho phép các tác nhân nhớ lại thông tin từ các cuộc trò chuyện trước đó bằng cách sử dụng độ tương tự vector. Xem
Phiên & Bộ nhớ.
Tự lưu trữ & Riêng tư
Mọi thứ chạy trên cơ sở hạ tầng của bạn. Tin nhắn, API key và dữ liệu tác nhân của bạn không bao giờ rời khỏi máy của bạn trừ khi bạn cấu hình rõ ràng một dịch vụ bên ngoài. Gateway mặc định ràng buộc với localhost — không có tiếp xúc mạng bên ngoài.
Thực thi có hộp cát
Chạy lệnh tác nhân trong các container Docker được cô lập với giới hạn tài nguyên có thể cấu hình, chính sách mạng và giới hạn hệ thống tệp. Hồ sơ hộp cát theo từng tác nhân cho phép bạn kiểm soát chính xác những gì mỗi tác nhân có thể truy cập. Xem
Bảo mật.
Cách mọi thứ kết hợp với nhau
Bạn tương tác với các tác nhân của mình qua ứng dụng desktop Neotask, một ứng dụng đồng hành di động hoặc trực tiếp qua các nền tảng nhắn tin như WhatsApp hoặc Telegram.
Gateway nhận tin nhắn của bạn, định tuyến nó đến đúng tác nhân và bắt đầu một lượt AI.
Tác nhân xử lý yêu cầu của bạn bằng cách sử dụng LLM được cấu hình (Claude, GPT, v.v.), gọi bất kỳ công cụ nào cần thiết (trình duyệt, canvas, thao tác tệp, lệnh shell) và tạo ra phản hồi.
Phản hồi được gửi lại cho bạn qua cùng một kênh, hoặc được thông báo trên một kênh khác nếu được cấu hình.
Trạng thái (bản ghi phiên, cấu hình tác nhân, các công việc theo lịch) được duy trì cục bộ để mọi thứ tồn tại qua các lần khởi động lại.
View full documentation