Platform Overview - Neotask by Neotask Documentation | Neotask

ภาพรวมแพลตฟอร์ม

Open Claw คืออะไร?

Open Claw คือเอ็นจินหลักที่ขับเคลื่อนระบบนิเวศ Neotask มันคือ Gateway — บริการที่รันระยะยาวตัวเดียวที่จัดการทุกอย่าง: เซสชันเอเจนต์ การผสานรวมการส่งข้อความ การรันเครื่องมือ ระบบอัตโนมัติตามกำหนดการ และการเชื่อมต่ออุปกรณ์

ลองนึกถึงมันเป็นสมองที่แอปเดสก์ท็อป Neotask, แอปมือถือ และ web dashboard ของคุณเชื่อมต่อทั้งหมด ในขณะที่คุณโต้ตอบผ่านอินเทอร์เฟซเหล่านั้น Open Claw กำลังทำงานหนักอยู่เบื้องหลัง

สถาปัตยกรรม

Open Claw ใช้โมเดล hub-and-spoke:

  • Gateway คือ central hub — WebSocket server ที่รันบนเครื่องของคุณ (หรือในคลาวด์) มันจัดการเซสชันเอเจนต์ทั้งหมด กำหนดเส้นทางข้อความระหว่างช่องทาง ออร์เคสเตรทการรันเครื่องมือ และคงสถานะ
  • Client (แอปเดสก์ท็อป, แอปมือถือ, web dashboard หรือเทอร์มินัล) เชื่อมต่อกับ Gateway และส่ง/รับข้อความผ่านมัน
  • Node (แอปคู่หูบน iOS, Android, macOS) เปิดเผยความสามารถของอุปกรณ์ — กล้อง, canvas, การบันทึกหน้าจอ, ตำแหน่ง และเสียง — ให้กับเอเจนต์ที่รันบน Gateway
  • Channel (WhatsApp, Telegram, Discord, Slack เป็นต้น) คือ transport การส่งข้อความที่ Gateway เชื่อมต่อสำหรับการส่งและรับข้อความ
  • การดำเนินการ AI ทั้งหมดผ่านไปทาง pipeline Gateway → LLM Provider แอปเดสก์ท็อปไม่เรียก LLM โดยตรง

    ความสามารถหลัก

    การส่งข้อความหลายช่องทาง

    เชื่อมต่อกับแพลตฟอร์มการส่งข้อความ 20+ พร้อมกัน เอเจนต์ของคุณสามารถส่งและรับข้อความบน WhatsApp, Telegram, Discord, Slack, Signal, iMessage, Google Chat, Microsoft Teams, Matrix, IRC และอื่น ๆ — ทั้งหมดจาก Gateway instance เดียว ดูที่ Channels

    ระบบหลายเอเจนต์

    รันหลายเอเจนต์แบบแยกตัว แต่ละตัวมี workspace, บุคลิกภาพ, การกำหนดค่า model และการเชื่อมต่อช่องทางของตัวเอง กำหนดเส้นทางข้อความขาเข้าจากช่องทาง server หรือผู้ติดต่อเฉพาะไปยังเอเจนต์ที่ถูกต้องโดยอัตโนมัติ ดูที่ Agents

    ความสามารถของอุปกรณ์ผ่าน Node

    เชื่อมต่อแอปคู่หู iOS, Android และ macOS เป็น "node" ที่เปิดเผย hardware อุปกรณ์ให้กับเอเจนต์ของคุณ เอเจนต์สามารถถ่ายรูป บันทึกวิดีโอ จับหน้าจอ รับตำแหน่ง GPS เรนเดอร์ canvas แบบโต้ตอบ และรันคำสั่งระบบ — ทั้งหมดผ่านภาษาธรรมชาติ ดูที่ Companion Apps

    การทำงานอัตโนมัติของเบราว์เซอร์

    เอเจนต์สามารถควบคุมเบราว์เซอร์ Chromium เต็มรูปแบบ — เปิดหน้า คลิกองค์ประกอบ กรอกฟอร์ม ถ่ายภาพหน้าจอ ดึงเนื้อหา อัปโหลดไฟล์ และรัน JavaScript รองรับหลาย browser profile สำหรับการแยก account ดูที่ Tools & Capabilities

    Canvas และ A2UI

    ระบบ Agent-to-UI (A2UI) ช่วยให้เอเจนต์เรนเดอร์เนื้อหาภาพแบบโต้ตอบบนอุปกรณ์ที่เชื่อมต่อ เอเจนต์สามารถนำเสนอหน้าเว็บ ส่งการอัปเดต UI ที่มีโครงสร้าง รัน JavaScript ใน canvas context และจับภาพสิ่งที่แสดง ดูที่ Tools & Capabilities

    การรองรับ Model ที่ยืดหยุ่น

    ใช้ผู้ให้บริการ LLM หลักใด ๆ — Anthropic (Claude), OpenAI (GPT), Google (Gemini), Together AI, Moonshot, OpenRouter และอื่น ๆ กำหนดค่า fallback chain ของ model, alias และการแทนที่ model ต่อเอเจนต์ รัน local model ผ่าน Ollama หรือ vLLM ดูที่ Models & Providers

    ระบบนิเวศ Plugin และ Skill

    ขยาย Open Claw ด้วย plugin ที่เพิ่มช่องทางใหม่ เครื่องมือ RPC method และความสามารถ เรียกดูและติดตั้งทักษะจาก ClawHub ตลาดทักษะของชุมชน สร้างทักษะของคุณเองเพื่อสอนเอเจนต์เวิร์กโฟลว์ใหม่ ดูที่ Plugins & Skills

    การจัดกำหนดการและระบบอัตโนมัติ

    กำหนดเวลาการปลุกเอเจนต์ด้วย cron expression, การเตือนความจำ one-shot หรือทริกเกอร์แบบ interval เอเจนต์สามารถรันงานอัตโนมัติ ส่งมอบผลลัพธ์ไปยังช่องทาง หรือโพสต์ไปยัง webhook ดูที่ Automation

    การโต้ตอบด้วยเสียง

    ใช้ wake word เพื่อเปิดใช้งานเอเจนต์ด้วยเสียง Talk mode เปิดใช้งานการสนทนาด้วยเสียงอย่างต่อเนื่องพร้อม speech-to-text และ text-to-speech แบบ real-time (ElevenLabs, OpenAI) Swabble daemon บน macOS ให้การตรวจจับเสียงแบบ always-on, on-device ดูที่ Voice

    ความฉลาดของเซสชัน

    เซสชันรีเซ็ตอัตโนมัติทุกวัน บีบอัดเมื่อใกล้ถึงขีดจำกัด context และคงอยู่ข้ามการรีสตาร์ท การค้นหาหน่วยความจำช่วยให้เอเจนต์จำข้อมูลจากการสนทนาก่อนหน้าโดยใช้ vector similarity ดูที่ Sessions & Memory

    Self-Hosted และส่วนตัว

    ทุกอย่างรันบนโครงสร้างพื้นฐานของคุณ ข้อความ API key และข้อมูลเอเจนต์ของคุณไม่เคยออกจากเครื่องของคุณเว้นแต่คุณจะกำหนดค่าบริการภายนอกอย่างชัดแจ้ง Gateway bind กับ localhost โดยค่าเริ่มต้น — ไม่มีการเปิดเผยเครือข่ายภายนอก

    การรันแบบ Sandbox

    รันคำสั่งเอเจนต์ใน Docker container แบบแยกตัวพร้อมขีดจำกัดทรัพยากรที่กำหนดค่าได้ นโยบายเครือข่าย และการจำกัด filesystem Sandbox profile ต่อเอเจนต์ช่วยให้คุณควบคุมอย่างแม่นยำว่าแต่ละเอเจนต์สามารถเข้าถึงอะไรได้บ้าง ดูที่ Security

    วิธีที่ทุกอย่างเชื่อมต่อกัน

  • คุณ โต้ตอบกับเอเจนต์ผ่านแอปเดสก์ท็อป Neotask, แอปคู่หูมือถือ หรือโดยตรงผ่านแพลตฟอร์มการส่งข้อความอย่าง WhatsApp หรือ Telegram
  • Gateway รับข้อความของคุณ กำหนดเส้นทางไปยังเอเจนต์ที่ถูกต้อง และเริ่ม AI turn
  • เอเจนต์ ประมวลผลคำขอของคุณโดยใช้ LLM ที่กำหนดค่า (Claude, GPT เป็นต้น) เรียกเครื่องมือที่ต้องการ (เบราว์เซอร์, canvas, การดำเนินการไฟล์, คำสั่งเชลล์) และสร้างการตอบสนอง
  • การตอบสนอง ถูกส่งมอบกลับมาให้คุณผ่านช่องทางเดียวกัน หรือประกาศบนช่องทางอื่นหากกำหนดค่าไว้
  • State (session transcript, agent config, งานตามกำหนดการ) ถูกคงไว้ในเครื่องเพื่อให้ทุกอย่างรอดพ้นการรีสตาร์ท
  • View full documentation