Platform Overview - Neotask by Neotask Documentation | Neotask

Przegląd platformy

Czym jest Open Claw?

Open Claw to silnik rdzenia zasilający ekosystem Neotask. To brama -- pojedyncza długo działająca usługa, która zarządza wszystkim: sesjami agentów, integracjami komunikacyjnymi, wykonywaniem narzędzi, zaplanowanymi automatyzacjami i połączeniami urządzeń.

Pomyśl o niej jak o mózgu, z którym łączą się Twoja aplikacja desktopowa Neotask, aplikacje mobilne i panel internetowy. Podczas gdy Ty wchodzisz w interakcję przez te interfejsy, Open Claw ciężko pracuje w tle.

Architektura

Open Claw używa modelu hub-and-spoke:

  • Brama to centralne centrum -- serwer WebSocket działający na Twojej maszynie (lub w chmurze). Zarządza wszystkimi sesjami agentów, kieruje wiadomości między kanałami, orkiestruje wykonanie narzędzi i utrzymuje stan.
  • Klienci (aplikacja desktopowa, aplikacje mobilne, panel internetowy lub terminal) łączą się z bramą i wysyłają/odbierają przez nią wiadomości.
  • Węzły (aplikacje towarzyszące na iOS, Android, macOS) udostępniają możliwości urządzeń -- kamera, kanwa, nagrywanie ekranu, lokalizacja i głos -- agentom działającym na bramie.
  • Kanały (WhatsApp, Telegram, Discord, Slack itp.) to transporty komunikacyjne, z którymi brama łączy się do wysyłania i odbierania wiadomości.
  • Wszystkie operacje AI przechodzą przez potok Brama → Dostawca LLM. Aplikacja desktopowa nigdy nie wywołuje bezpośrednio LLM.

    Kluczowe możliwości

    Wielokanałowa komunikacja

    Połącz się jednocześnie z ponad 20 platformami komunikacyjnymi. Twoi agenci mogą wysyłać i odbierać wiadomości na WhatsApp, Telegram, Discord, Slack, Signal, iMessage, Google Chat, Microsoft Teams, Matrix, IRC i innych -- wszystko z jednej instancji bramy. Zob. Kanały.

    System wieloagentowy

    Uruchamiaj wielu izolowanych agentów, każdego z własną przestrzenią roboczą, osobowością, konfiguracją modelu i powiązaniami z kanałami. Automatycznie kieruj przychodzące wiadomości z konkretnych kanałów, serwerów lub kontaktów do właściwego agenta. Zob. Agenci.

    Możliwości urządzeń przez węzły

    Połącz towarzyszące aplikacje iOS, Android i macOS jako „węzły", które udostępniają sprzęt urządzenia Twoim agentom. Agenci mogą robić zdjęcia, nagrywać wideo, przechwytywać ekran, uzyskiwać lokalizację GPS, renderować interaktywne kanwy i uruchamiać polecenia systemowe -- wszystko przez język naturalny. Zob. Aplikacje towarzyszące.

    Automatyzacja przeglądarki

    Agenci mogą sterować pełną przeglądarką Chromium -- otwierać strony, klikać elementy, wypełniać formularze, robić zrzuty ekranu, wyodrębniać treści, przesyłać pliki i uruchamiać JavaScript. Obsługiwanych jest wiele profili przeglądarki dla izolacji kont. Zob. Narzędzia i możliwości.

    Kanwa i A2UI

    System Agent-to-UI (A2UI) pozwala agentom renderować interaktywne treści wizualne na połączonych urządzeniach. Agenci mogą prezentować strony internetowe, przesyłać strukturalne aktualizacje interfejsu użytkownika, wykonywać JavaScript w kontekście kanwy i robić zrzuty wyświetlanego. Zob. Narzędzia i możliwości.

    Elastyczna obsługa modeli

    Używaj dowolnego głównego dostawcy LLM -- Anthropic (Claude), OpenAI (GPT), Google (Gemini), Together AI, Moonshot, OpenRouter i więcej. Konfiguruj łańcuchy awaryjne modeli, aliasy i zastąpienia modeli per agent. Uruchamiaj lokalne modele przez Ollama lub vLLM. Zob. Modele i dostawcy.

    Ekosystem wtyczek i umiejętności

    Rozszerzaj Open Claw za pomocą wtyczek, które dodają nowe kanały, narzędzia, metody RPC i możliwości. Przeglądaj i instaluj umiejętności z ClawHub, rynku umiejętności społeczności. Twórz własne umiejętności, aby uczyć agentów nowych przepływów pracy. Zob. Wtyczki i umiejętności.

    Harmonogramowanie i automatyzacja

    Planuj przebudzenia agentów za pomocą wyrażeń cron, jednorazowych przypomnień lub wyzwalaczy opartych na interwałach. Agenci mogą uruchamiać zautomatyzowane zadania, dostarczać wyniki do kanałów lub publikować do webhooków. Zob. Automatyzacja.

    Interakcja głosowa

    Używaj słów aktywacyjnych, aby aktywować agenta głosem. Tryb mówienia umożliwia ciągłe rozmowy głosowe z zamianą mowy na tekst i tekstu na mowę w czasie rzeczywistym (ElevenLabs, OpenAI). Demon Swabble na macOS zapewnia zawsze aktywne, lokalne wykrywanie głosu. Zob. Głos.

    Inteligencja sesji

    Sesje automatycznie resetują się codziennie, kompaktują po zbliżeniu się do limitów okna kontekstu i utrzymują się po ponownym uruchomieniu. Wyszukiwanie pamięci pozwala agentom przywoływać informacje z poprzednich rozmów przy użyciu podobieństwa wektorowego. Zob. Sesje i pamięć.

    Hostowane samodzielnie i prywatne

    Wszystko działa na Twojej infrastrukturze. Twoje wiadomości, klucze API i dane agentów nigdy nie opuszczają Twoich maszyn, chyba że wyraźnie skonfigurujesz zewnętrzną usługę. Brama domyślnie jest powiązana z localhost -- zerowa zewnętrzna ekspozycja sieciowa.

    Wykonanie w piaskownicy

    Uruchamiaj polecenia agenta w izolowanych kontenerach Docker z konfigurowalnymi limitami zasobów, zasadami sieci i ograniczeniem systemu plików. Profile piaskownicy per agent pozwalają precyzyjnie kontrolować dostęp każdego agenta. Zob. Bezpieczeństwo.

    Jak to wszystko pasuje do siebie

  • Ty wchodzisz w interakcję ze swoimi agentami przez aplikację desktopową Neotask, mobilną aplikację towarzyszącą lub bezpośrednio przez platformy komunikacyjne, takie jak WhatsApp lub Telegram.
  • Brama odbiera Twoją wiadomość, kieruje ją do właściwego agenta i rozpoczyna turę AI.
  • Agent przetwarza Twoje żądanie używając skonfigurowanego LLM (Claude, GPT itp.), wywołuje wszelkie potrzebne narzędzia (przeglądarka, kanwa, operacje na plikach, polecenia powłoki) i generuje odpowiedź.
  • Odpowiedź jest dostarczana z powrotem do Ciebie przez ten sam kanał lub ogłaszana na innym kanale, jeśli jest skonfigurowane.
  • Stan (transkrypty sesji, konfiguracja agenta, zaplanowane zadania) jest utrzymywany lokalnie, więc wszystko przeżywa ponowne uruchomienia.
  • View full documentation