Platform Overview - Neotask by Neotask Documentation | Neotask

ภาพรวมแพลตฟอร์ม

Open Claw คืออะไร?

Open Claw คือเอ็นจินหลักที่ขับเคลื่อนระบบนิเวศ Neotask มันคือ Gateway — บริการที่รันระยะยาวตัวเดียวที่จัดการทุกอย่าง: เซสชันเอเจนต์ การผสานรวมการส่งข้อความ การรันเครื่องมือ ระบบอัตโนมัติตามกำหนดการ และการเชื่อมต่ออุปกรณ์

ลองนึกถึงมันเป็นสมองที่แอปเดสก์ท็อป Neotask, แอปมือถือ และ web dashboard ของคุณเชื่อมต่อทั้งหมด ในขณะที่คุณโต้ตอบผ่านอินเทอร์เฟซเหล่านั้น Open Claw กำลังทำงานหนักอยู่เบื้องหลัง

สถาปัตยกรรม

Open Claw ใช้โมเดล hub-and-spoke:

Gateway คือ central hub — WebSocket server ที่รันบนเครื่องของคุณ (หรือในคลาวด์) มันจัดการเซสชันเอเจนต์ทั้งหมด กำหนดเส้นทางข้อความระหว่างช่องทาง ออร์เคสเตรทการรันเครื่องมือ และคงสถานะ

Client (แอปเดสก์ท็อป, แอปมือถือ, web dashboard หรือเทอร์มินัล) เชื่อมต่อกับ Gateway และส่ง/รับข้อความผ่านมัน

Node (แอปคู่หูบน iOS, Android, macOS) เปิดเผยความสามารถของอุปกรณ์ — กล้อง, canvas, การบันทึกหน้าจอ, ตำแหน่ง และเสียง — ให้กับเอเจนต์ที่รันบน Gateway

Channel (WhatsApp, Telegram, Discord, Slack เป็นต้น) คือ transport การส่งข้อความที่ Gateway เชื่อมต่อสำหรับการส่งและรับข้อความ

การดำเนินการ AI ทั้งหมดผ่านไปทาง pipeline Gateway → LLM Provider แอปเดสก์ท็อปไม่เรียก LLM โดยตรง

ความสามารถหลัก

การส่งข้อความหลายช่องทาง

เชื่อมต่อกับแพลตฟอร์มการส่งข้อความ 20+ พร้อมกัน เอเจนต์ของคุณสามารถส่งและรับข้อความบน WhatsApp, Telegram, Discord, Slack, Signal, iMessage, Google Chat, Microsoft Teams, Matrix, IRC และอื่น ๆ — ทั้งหมดจาก Gateway instance เดียว ดูที่ Channels

ระบบหลายเอเจนต์

รันหลายเอเจนต์แบบแยกตัว แต่ละตัวมี workspace, บุคลิกภาพ, การกำหนดค่า model และการเชื่อมต่อช่องทางของตัวเอง กำหนดเส้นทางข้อความขาเข้าจากช่องทาง server หรือผู้ติดต่อเฉพาะไปยังเอเจนต์ที่ถูกต้องโดยอัตโนมัติ ดูที่ Agents

ความสามารถของอุปกรณ์ผ่าน Node

เชื่อมต่อแอปคู่หู iOS, Android และ macOS เป็น "node" ที่เปิดเผย hardware อุปกรณ์ให้กับเอเจนต์ของคุณ เอเจนต์สามารถถ่ายรูป บันทึกวิดีโอ จับหน้าจอ รับตำแหน่ง GPS เรนเดอร์ canvas แบบโต้ตอบ และรันคำสั่งระบบ — ทั้งหมดผ่านภาษาธรรมชาติ ดูที่ Companion Apps

การทำงานอัตโนมัติของเบราว์เซอร์

เอเจนต์สามารถควบคุมเบราว์เซอร์ Chromium เต็มรูปแบบ — เปิดหน้า คลิกองค์ประกอบ กรอกฟอร์ม ถ่ายภาพหน้าจอ ดึงเนื้อหา อัปโหลดไฟล์ และรัน JavaScript รองรับหลาย browser profile สำหรับการแยก account ดูที่ Tools & Capabilities

Canvas และ A2UI

ระบบ Agent-to-UI (A2UI) ช่วยให้เอเจนต์เรนเดอร์เนื้อหาภาพแบบโต้ตอบบนอุปกรณ์ที่เชื่อมต่อ เอเจนต์สามารถนำเสนอหน้าเว็บ ส่งการอัปเดต UI ที่มีโครงสร้าง รัน JavaScript ใน canvas context และจับภาพสิ่งที่แสดง ดูที่ Tools & Capabilities

การรองรับ Model ที่ยืดหยุ่น

ใช้ผู้ให้บริการ LLM หลักใด ๆ — Anthropic (Claude), OpenAI (GPT), Google (Gemini), Together AI, Moonshot, OpenRouter และอื่น ๆ กำหนดค่า fallback chain ของ model, alias และการแทนที่ model ต่อเอเจนต์ รัน local model ผ่าน Ollama หรือ vLLM ดูที่ Models & Providers

ระบบนิเวศ Plugin และ Skill

ขยาย Open Claw ด้วย plugin ที่เพิ่มช่องทางใหม่ เครื่องมือ RPC method และความสามารถ เรียกดูและติดตั้งทักษะจาก ClawHub ตลาดทักษะของชุมชน สร้างทักษะของคุณเองเพื่อสอนเอเจนต์เวิร์กโฟลว์ใหม่ ดูที่ Plugins & Skills

การจัดกำหนดการและระบบอัตโนมัติ

กำหนดเวลาการปลุกเอเจนต์ด้วย cron expression, การเตือนความจำ one-shot หรือทริกเกอร์แบบ interval เอเจนต์สามารถรันงานอัตโนมัติ ส่งมอบผลลัพธ์ไปยังช่องทาง หรือโพสต์ไปยัง webhook ดูที่ Automation

การโต้ตอบด้วยเสียง

ใช้ wake word เพื่อเปิดใช้งานเอเจนต์ด้วยเสียง Talk mode เปิดใช้งานการสนทนาด้วยเสียงอย่างต่อเนื่องพร้อม speech-to-text และ text-to-speech แบบ real-time (ElevenLabs, OpenAI) Swabble daemon บน macOS ให้การตรวจจับเสียงแบบ always-on, on-device ดูที่ Voice

ความฉลาดของเซสชัน

เซสชันรีเซ็ตอัตโนมัติทุกวัน บีบอัดเมื่อใกล้ถึงขีดจำกัด context และคงอยู่ข้ามการรีสตาร์ท การค้นหาหน่วยความจำช่วยให้เอเจนต์จำข้อมูลจากการสนทนาก่อนหน้าโดยใช้ vector similarity ดูที่ Sessions & Memory

Self-Hosted และส่วนตัว

ทุกอย่างรันบนโครงสร้างพื้นฐานของคุณ ข้อความ API key และข้อมูลเอเจนต์ของคุณไม่เคยออกจากเครื่องของคุณเว้นแต่คุณจะกำหนดค่าบริการภายนอกอย่างชัดแจ้ง Gateway bind กับ localhost โดยค่าเริ่มต้น — ไม่มีการเปิดเผยเครือข่ายภายนอก

การรันแบบ Sandbox

รันคำสั่งเอเจนต์ใน Docker container แบบแยกตัวพร้อมขีดจำกัดทรัพยากรที่กำหนดค่าได้ นโยบายเครือข่าย และการจำกัด filesystem Sandbox profile ต่อเอเจนต์ช่วยให้คุณควบคุมอย่างแม่นยำว่าแต่ละเอเจนต์สามารถเข้าถึงอะไรได้บ้าง ดูที่ Security

วิธีที่ทุกอย่างเชื่อมต่อกัน

คุณ โต้ตอบกับเอเจนต์ผ่านแอปเดสก์ท็อป Neotask, แอปคู่หูมือถือ หรือโดยตรงผ่านแพลตฟอร์มการส่งข้อความอย่าง WhatsApp หรือ Telegram

Gateway รับข้อความของคุณ กำหนดเส้นทางไปยังเอเจนต์ที่ถูกต้อง และเริ่ม AI turn

เอเจนต์ ประมวลผลคำขอของคุณโดยใช้ LLM ที่กำหนดค่า (Claude, GPT เป็นต้น) เรียกเครื่องมือที่ต้องการ (เบราว์เซอร์, canvas, การดำเนินการไฟล์, คำสั่งเชลล์) และสร้างการตอบสนอง

การตอบสนอง ถูกส่งมอบกลับมาให้คุณผ่านช่องทางเดียวกัน หรือประกาศบนช่องทางอื่นหากกำหนดค่าไว้

State (session transcript, agent config, งานตามกำหนดการ) ถูกคงไว้ในเครื่องเพื่อให้ทุกอย่างรอดพ้นการรีสตาร์ท

View full documentation