Platform Overview - Neotask by Neotask Documentation | Neotask
ภาพรวมแพลตฟอร์ม
Open Claw คืออะไร?
Open Claw คือเอ็นจินหลักที่ขับเคลื่อนระบบนิเวศ Neotask มันคือ Gateway — บริการที่รันระยะยาวตัวเดียวที่จัดการทุกอย่าง: เซสชันเอเจนต์ การผสานรวมการส่งข้อความ การรันเครื่องมือ ระบบอัตโนมัติตามกำหนดการ และการเชื่อมต่ออุปกรณ์
ลองนึกถึงมันเป็นสมองที่แอปเดสก์ท็อป Neotask, แอปมือถือ และ web dashboard ของคุณเชื่อมต่อทั้งหมด ในขณะที่คุณโต้ตอบผ่านอินเทอร์เฟซเหล่านั้น Open Claw กำลังทำงานหนักอยู่เบื้องหลัง
สถาปัตยกรรม
Open Claw ใช้โมเดล hub-and-spoke:
Gateway คือ central hub — WebSocket server ที่รันบนเครื่องของคุณ (หรือในคลาวด์) มันจัดการเซสชันเอเจนต์ทั้งหมด กำหนดเส้นทางข้อความระหว่างช่องทาง ออร์เคสเตรทการรันเครื่องมือ และคงสถานะ
Client (แอปเดสก์ท็อป, แอปมือถือ, web dashboard หรือเทอร์มินัล) เชื่อมต่อกับ Gateway และส่ง/รับข้อความผ่านมัน
Node (แอปคู่หูบน iOS, Android, macOS) เปิดเผยความสามารถของอุปกรณ์ — กล้อง, canvas, การบันทึกหน้าจอ, ตำแหน่ง และเสียง — ให้กับเอเจนต์ที่รันบน Gateway
Channel (WhatsApp, Telegram, Discord, Slack เป็นต้น) คือ transport การส่งข้อความที่ Gateway เชื่อมต่อสำหรับการส่งและรับข้อความการดำเนินการ AI ทั้งหมดผ่านไปทาง pipeline Gateway → LLM Provider แอปเดสก์ท็อปไม่เรียก LLM โดยตรง
ความสามารถหลัก
การส่งข้อความหลายช่องทาง
เชื่อมต่อกับแพลตฟอร์มการส่งข้อความ 20+ พร้อมกัน เอเจนต์ของคุณสามารถส่งและรับข้อความบน WhatsApp, Telegram, Discord, Slack, Signal, iMessage, Google Chat, Microsoft Teams, Matrix, IRC และอื่น ๆ — ทั้งหมดจาก Gateway instance เดียว ดูที่
Channelsระบบหลายเอเจนต์
รันหลายเอเจนต์แบบแยกตัว แต่ละตัวมี workspace, บุคลิกภาพ, การกำหนดค่า model และการเชื่อมต่อช่องทางของตัวเอง กำหนดเส้นทางข้อความขาเข้าจากช่องทาง server หรือผู้ติดต่อเฉพาะไปยังเอเจนต์ที่ถูกต้องโดยอัตโนมัติ ดูที่
Agentsความสามารถของอุปกรณ์ผ่าน Node
เชื่อมต่อแอปคู่หู iOS, Android และ macOS เป็น "node" ที่เปิดเผย hardware อุปกรณ์ให้กับเอเจนต์ของคุณ เอเจนต์สามารถถ่ายรูป บันทึกวิดีโอ จับหน้าจอ รับตำแหน่ง GPS เรนเดอร์ canvas แบบโต้ตอบ และรันคำสั่งระบบ — ทั้งหมดผ่านภาษาธรรมชาติ ดูที่
Companion Appsการทำงานอัตโนมัติของเบราว์เซอร์
เอเจนต์สามารถควบคุมเบราว์เซอร์ Chromium เต็มรูปแบบ — เปิดหน้า คลิกองค์ประกอบ กรอกฟอร์ม ถ่ายภาพหน้าจอ ดึงเนื้อหา อัปโหลดไฟล์ และรัน JavaScript รองรับหลาย browser profile สำหรับการแยก account ดูที่
Tools & CapabilitiesCanvas และ A2UI
ระบบ Agent-to-UI (A2UI) ช่วยให้เอเจนต์เรนเดอร์เนื้อหาภาพแบบโต้ตอบบนอุปกรณ์ที่เชื่อมต่อ เอเจนต์สามารถนำเสนอหน้าเว็บ ส่งการอัปเดต UI ที่มีโครงสร้าง รัน JavaScript ใน canvas context และจับภาพสิ่งที่แสดง ดูที่
Tools & Capabilitiesการรองรับ Model ที่ยืดหยุ่น
ใช้ผู้ให้บริการ LLM หลักใด ๆ — Anthropic (Claude), OpenAI (GPT), Google (Gemini), Together AI, Moonshot, OpenRouter และอื่น ๆ กำหนดค่า fallback chain ของ model, alias และการแทนที่ model ต่อเอเจนต์ รัน local model ผ่าน Ollama หรือ vLLM ดูที่
Models & Providersระบบนิเวศ Plugin และ Skill
ขยาย Open Claw ด้วย plugin ที่เพิ่มช่องทางใหม่ เครื่องมือ RPC method และความสามารถ เรียกดูและติดตั้งทักษะจาก ClawHub ตลาดทักษะของชุมชน สร้างทักษะของคุณเองเพื่อสอนเอเจนต์เวิร์กโฟลว์ใหม่ ดูที่
Plugins & Skillsการจัดกำหนดการและระบบอัตโนมัติ
กำหนดเวลาการปลุกเอเจนต์ด้วย cron expression, การเตือนความจำ one-shot หรือทริกเกอร์แบบ interval เอเจนต์สามารถรันงานอัตโนมัติ ส่งมอบผลลัพธ์ไปยังช่องทาง หรือโพสต์ไปยัง webhook ดูที่
Automationการโต้ตอบด้วยเสียง
ใช้ wake word เพื่อเปิดใช้งานเอเจนต์ด้วยเสียง Talk mode เปิดใช้งานการสนทนาด้วยเสียงอย่างต่อเนื่องพร้อม speech-to-text และ text-to-speech แบบ real-time (ElevenLabs, OpenAI) Swabble daemon บน macOS ให้การตรวจจับเสียงแบบ always-on, on-device ดูที่
Voiceความฉลาดของเซสชัน
เซสชันรีเซ็ตอัตโนมัติทุกวัน บีบอัดเมื่อใกล้ถึงขีดจำกัด context และคงอยู่ข้ามการรีสตาร์ท การค้นหาหน่วยความจำช่วยให้เอเจนต์จำข้อมูลจากการสนทนาก่อนหน้าโดยใช้ vector similarity ดูที่
Sessions & MemorySelf-Hosted และส่วนตัว
ทุกอย่างรันบนโครงสร้างพื้นฐานของคุณ ข้อความ API key และข้อมูลเอเจนต์ของคุณไม่เคยออกจากเครื่องของคุณเว้นแต่คุณจะกำหนดค่าบริการภายนอกอย่างชัดแจ้ง Gateway bind กับ localhost โดยค่าเริ่มต้น — ไม่มีการเปิดเผยเครือข่ายภายนอก
การรันแบบ Sandbox
รันคำสั่งเอเจนต์ใน Docker container แบบแยกตัวพร้อมขีดจำกัดทรัพยากรที่กำหนดค่าได้ นโยบายเครือข่าย และการจำกัด filesystem Sandbox profile ต่อเอเจนต์ช่วยให้คุณควบคุมอย่างแม่นยำว่าแต่ละเอเจนต์สามารถเข้าถึงอะไรได้บ้าง ดูที่
Securityวิธีที่ทุกอย่างเชื่อมต่อกัน
คุณ โต้ตอบกับเอเจนต์ผ่านแอปเดสก์ท็อป Neotask, แอปคู่หูมือถือ หรือโดยตรงผ่านแพลตฟอร์มการส่งข้อความอย่าง WhatsApp หรือ Telegram
Gateway รับข้อความของคุณ กำหนดเส้นทางไปยังเอเจนต์ที่ถูกต้อง และเริ่ม AI turn
เอเจนต์ ประมวลผลคำขอของคุณโดยใช้ LLM ที่กำหนดค่า (Claude, GPT เป็นต้น) เรียกเครื่องมือที่ต้องการ (เบราว์เซอร์, canvas, การดำเนินการไฟล์, คำสั่งเชลล์) และสร้างการตอบสนอง
การตอบสนอง ถูกส่งมอบกลับมาให้คุณผ่านช่องทางเดียวกัน หรือประกาศบนช่องทางอื่นหากกำหนดค่าไว้
State (session transcript, agent config, งานตามกำหนดการ) ถูกคงไว้ในเครื่องเพื่อให้ทุกอย่างรอดพ้นการรีสตาร์ท
View full documentation