Usage Rates - Neotask Documentation | Neotask

Aufschluesselung der Nutzungsraten

Diese Seite beschreibt genau, wie Neotask nutzungsbasierte Gebuehren berechnet. Die meisten Nutzer des Single-Agent-Tarifs werden diese Gebuehren nie sehen. Diese Aufschluesselung ist fuer Enterprise-Power-User gedacht, deren Agenten im grossen Massstab laufen.

Fuer eine Uebersicht der Tarife und wie die Abrechnung funktioniert, siehe Abrechnung & Tarife.

---

Wie die Nutzung berechnet wird

Jedes Mal, wenn Ihr Agent eine Nachricht verarbeitet, verbraucht er KI-Tokens (Eingabe und Ausgabe). Die Kosten dieser Tokens haengen davon ab, welches KI-Modell Ihr Agent verwendet. Das System verfolgt vier Arten von Tokens separat, jede mit ihrem eigenen Tarif:

  • Eingabe-Tokens: Der Prompt und Kontext, der an das Modell gesendet wird
  • Ausgabe-Tokens: Die Antwort, die das Modell generiert
  • Cache-Read-Tokens: Tokens, die aus dem Prompt-Cache bedient werden (guenstiger als Eingabe)
  • Cache-Write-Tokens: Tokens, die in den Prompt-Cache fuer zukuenftige Wiederverwendung geschrieben werden
  • Token-Kostenformel

    
    Kosten = (Eingabe-Tokens / 1.000.000) x Eingaberate
           + (Ausgabe-Tokens / 1.000.000) x Ausgaberate
           + (Cache-Read-Tokens / 1.000.000) x Cache-Read-Rate
           + (Cache-Write-Tokens / 1.000.000) x Cache-Write-Rate
    

    Quelle: server/src/config/modelPricing.ts

    ---

    KI-Modell-Token-Raten

    Dies sind die Pro-Token-Raten fuer jedes unterstuetzte KI-Modell. Alle Raten sind in USD pro 1 Million Tokens.

    Anthropic Claude

    | Modell | Eingabe | Ausgabe | Cache Read | Cache Write | |-------|------:|-------:|-----------:|------------:| | Claude Opus 4.6 | $15,00 | $75,00 | $1,50 | $18,75 | | Claude Sonnet 4.5 | $3,00 | $15,00 | $0,30 | $3,75 | | Claude Haiku 4.5 | $0,80 | $4,00 | $0,08 | $1,00 | | Claude 3.5 Sonnet | $3,00 | $15,00 | $0,30 | $3,75 | | Claude 3.5 Haiku | $0,80 | $4,00 | $0,08 | $1,00 | | Claude 3 Opus | $15,00 | $75,00 | $1,50 | $18,75 | | Claude 3 Sonnet | $3,00 | $15,00 | $0,30 | $3,75 | | Claude 3 Haiku | $0,25 | $1,25 | $0,03 | $0,30 |

    OpenAI

    | Modell | Eingabe | Ausgabe | Cache Read | Cache Write | |-------|------:|-------:|-----------:|------------:| | GPT-4o | $2,50 | $10,00 | $1,25 | $2,50 | | GPT-4o Mini | $0,15 | $0,60 | $0,075 | $0,15 | | GPT-4 Turbo | $10,00 | $30,00 | $5,00 | $10,00 | | GPT-4 | $30,00 | $60,00 | $15,00 | $30,00 | | o1 | $15,00 | $60,00 | $7,50 | $15,00 | | o1-mini | $3,00 | $12,00 | $1,50 | $3,00 | | o3-mini | $1,10 | $4,40 | $0,55 | $1,10 |

    Google Gemini

    | Modell | Eingabe | Ausgabe | Cache Read | Cache Write | |-------|------:|-------:|-----------:|------------:| | Gemini 2.0 Flash | $0,10 | $0,40 | $0,025 | $0,10 | | Gemini 1.5 Pro | $1,25 | $5,00 | $0,3125 | $1,25 | | Gemini 1.5 Flash | $0,075 | $0,30 | $0,01875 | $0,075 |

    Quelle: server/src/config/modelPricing.ts Zeilen 8-42

    ---

    Plattformgebuehren & Aufschlaege

    Es gibt mehrere unterschiedliche Gebuehren, die je nach Nutzung Ihres Agenten anfallen koennen. Diese sind kein einheitlicher Pauschaltarif; jede gilt in verschiedenen Situationen.

    1. Credit-Modus-Aufschlag (System Key): 20%

    Bei Verwendung der verwalteten API-Schluessel von Neotask (System-Key-Modus) wird ein 20% Aufschlag auf die rohen Token-Kosten erhoben. Dies deckt API-Schluesselverwaltung, automatisches Failover zwischen Anbietern, Modell-Routing und Infrastruktur ab.

    Wenn Sie den BYOK-Modus (Bring Your Own Keys) verwenden, gehen Token-Kosten direkt an Ihren KI-Anbieter, jedoch wird eine Plattformgebuehr von 20% von Ihrem Guthaben abgezogen.

    Quelle: server/src/config/modelPricing.ts Zeile 53, CREDIT_MODE_MARKUP_PCT = 0.20

    2. Ueberverbrauchs-Plattformgebuehr (variabel)

    Wenn Ihre Nutzung Ihren enthaltenen Guthabenpool ueberschreitet, wird der verbleibende Betrag zum Ueberverbrauch. Eine Plattformgebuehr wird auf den Ueberverbrauchsbetrag erhoben. Der Satz haengt von Ihrer Tarifstufe ab:

    | Stufe | Ueberverbrauchsgebuehr | |------|------------:| | Enterprise (Standard) | 10% - 25% |

    Die Ueberverbrauchsgebuehr wird nur auf den Betrag erhoben, der Ihren Guthabenpool ueberschreitet. Nutzung innerhalb Ihres Pools hat keine zusaetzliche Gebuehr.

    Der Ueberverbrauch wird automatisch von Ihrer Karte abgebucht, wenn der offene Betrag $20 erreicht (Stripe-Mindestbetrag: $0,50).

    Quelle: server/src/config/planConfig.ts, overageFeePct und overageChargeThreshold

    3. Automatisierungsaufschlag: Progressiv 50% bis 33%

    Wenn Ihre Agenten automatisierte Aufgaben ausfuehren (geplante Aufgaben, Cron-Jobs, wiederkehrende Automatisierungen), wird ein zusaetzlicher Automatisierungsaufschlag auf die Token-Kosten erhoben. Dies liegt daran, dass automatisierte Agenten manuelle Arbeit ersetzen. Sie laufen unbeaufsichtigt, nach Zeitplan, und erledigen Aufgaben, die sonst Mitarbeiter erfordern wuerden.

    Der Automatisierungsaufschlag verwendet progressive Stufen (wie bei der Einkommensteuer). Sie zahlen einen hoeheren Satz auf Ihre ersten Dollar automatisierter Nutzung und einen niedrigeren Satz, je mehr Ihre automatisierten Ausgaben wachsen. Es gibt keine Sprungeffekte; jeder Dollar wird nur zum Satz seiner Stufe berechnet.

    | Kumulierte automatisierte Ausgaben (pro Abrechnungszyklus) | Marginaler Aufschlagsatz | |------------------------------------------------|--------------------:| | $0 - $10 | 50% | | $10,01 - $25 | 45% | | $25,01 - $50 | 40% | | $50,01 - $100 | 37% | | $100,01+ | 33% |

    Quelle: server/src/config/automationMarkup.ts Zeilen 38-44, DEFAULT_AUTOMATION_BRACKETS

    4. Coding-Aufgaben-Aufschlag: Pauschal 50%

    Automatisierte Aufgaben, die Coding-Tools beinhalten (Datei lesen, schreiben, Code-Ausfuehrung, Bash-Befehle), werden mit einem pauschalen 50% Aufschlag berechnet. Die progressive Reduktion gilt nicht fuer Coding-Aufgaben; es sind immer 50%, unabhaengig von den kumulierten Ausgaben.

    Coding-Tools: exec, read, write, bash, code

    Quelle: server/src/config/automationMarkup.ts Zeile 49, CODING_TASK_MARKUP_RATE = 0.50

    ---

    Wie sich Kosten stapeln

    Diese Gebuehren koennen sich je nach Situation stapeln:

    Interaktiver Chat (System-Key-Modus):

  • Rohe Token-Kosten + 20% Credit-Modus-Aufschlag
  • Kein Automatisierungsaufschlag (nicht automatisiert)
  • Interaktiver Chat (BYOK-Modus):

  • Rohe Token-Kosten + 20% Plattformgebuehr vom Guthaben
  • Automatisierter Cron-Job (System-Key-Modus):

  • Rohe Token-Kosten + 20% Credit-Modus-Aufschlag + Automatisierungsaufschlag (50%-33%)
  • Automatisierte Coding-Aufgabe (System-Key-Modus):

  • Rohe Token-Kosten + 20% Credit-Modus-Aufschlag + 50% Coding-Aufgaben-Aufschlag
  • ---

    Automatisierungsabrechnungsbeispiel

    Ein geplanter Cron-Job laeuft taeglich. Der KI-Agent braucht etwa 2-3 Stunden, um seine Arbeit abzuschliessen. Der Job verbraucht $10 an rohen Tokens (die tatsaechlichen Kosten fuer den KI-Anbieter).

    Aufschluesselung:

  • Token-Kosten: $10 (an den KI-Anbieter weitergegeben; das sind die Rechenkosten)
  • Automatisierungsaufschlag: $10 x 50% = $5 (Plattformgebuehr fuer die unbeaufsichtigte Ausfuehrung des Jobs)
  • Gesamtbetrag: $15
  • Die $10 decken die tatsaechliche KI-Rechenleistung ab, die Ihr Agent verbraucht hat. Die $5 sind die Automatisierungsgebuehr. Die Plattform hat den Job nach Zeitplan ausgefuehrt, die Ausfuehrung ueberwacht, Wiederholungen bearbeitet und Ergebnisse geliefert -- alles ohne dass jemand am Computer sein musste.

    Warum Automatisierung mehr kostet: Automatisierte Agenten ersetzen menschliche Arbeit. Ein Cron-Job, der jeden Morgen Ihre Analysen prueft, Berichte erstellt, den Bestand ueberwacht oder eingehende Bestellungen verarbeitet, erledigt Arbeit, die sonst die Zeit einer Person erfordern wuerde. Der Automatisierungsaufschlag spiegelt den Wert dieser unbeaufsichtigten Ausfuehrung wider und sinkt, je mehr Sie automatisieren, was Skalierung belohnt. Ein Tenant, der $100+/Zyklus fuer automatisierte Aufgaben ausgibt, zahlt nur 33% Aufschlag statt 50%.

    ---

    Guthaben-Aufladungen

    Sie koennen jederzeit zusaetzliches Guthaben erwerben, um die Nutzung vorauszubezahlen:

  • Mindestaufladung: $5
  • Maximalaufladung: $10.000
  • Guthaben verfaellt nie. Es bleibt auf Ihrem Konto, bis es verwendet wird.
  • Auto-Aufladung: Optional koennen Sie automatische Aufladungen konfigurieren, wenn Ihr Guthaben unter einen Schwellenwert faellt (Standard: $2 Guthaben loest eine $10 Aufladung aus)
  • Aufladeguthaben wird nach Erschoepfung Ihres Guthaben-Pools und vor Anfall von Ueberverbrauch verwendet. Das bedeutet, Aufladungen dienen als Puffer zwischen Ihrem enthaltenen Guthaben und Ueberverbrauchsgebuehren.

    Quelle: server/src/services/overageCharger.ts, server/src/services/balanceService.ts

    ---

    Guthabenabzugsreihenfolge

    Wenn Ihr Agent eine Aufgabe abschliesst, werden die Kosten in dieser Reihenfolge abgezogen:

  • Startguthaben (einmaliges $10 Guthaben bei Registrierung, wird nicht zurueckgesetzt)
  • Aufladeguthaben (erworbenes Guthaben, verfaellt nie)
  • Ueberverbrauch (wird von Ihrer Karte mit angewandter Plattformgebuehr abgebucht)
  • Das bedeutet, Ihr enthaltenes Guthaben wird immer zuerst verwendet, dann eventuelle Aufladungen, und erst nachdem beides erschoepft ist, beginnt die Ueberverbrauchsabrechnung.

    Quelle: server/src/services/balanceService.ts Zeilen 240-286

    ---

    Budgetsteuerung

    Enterprise-Nutzer haben integrierte Budgetdurchsetzung:

  • Globales Tagesbudget: Standard $500/Tag (konfigurierbar). Bei Ueberschreitung wird das Agenten-Gateway automatisch heruntergefahren, um unkontrollierte Kosten zu verhindern.
  • Pro-Agent-Ausgabenlimits: Legen Sie ein Tageslimit fuer jeden einzelnen Agenten fest. Wenn ein Agent sein Limit erreicht, werden seine Sitzungen automatisch pausiert.
  • Auto-Abschaltung: Konfigurierbar. Automatisches Gateway-Herunterfahren bei Budgetueberschreitung aktivieren oder deaktivieren.
  • Echtzeitdurchsetzung: Das Budget wird alle 30 Sekunden ueberprueft.
  • Quelle: SwiftClaw-Electron/src/main/budgetEnforcer.ts, SwiftClaw-Electron/src/main/agentSpendLimitStore.ts

    ---

    Ihre Nutzung anzeigen

    Verfolgen Sie all dies in Echtzeit auf der Nutzungsseite in der Desktop-App:

  • Token-Level-Aufschluesselung nach Modell, Anbieter, Agent, Kanal und Datum
  • Kostenaufschluesselung: Eingabe-, Ausgabe-, Cache-Read-, Cache-Write-Kosten separat angezeigt
  • Zeitgranularitaet: Heute, letzte 24h, 7 Tage, 30 Tage, 365 Tage oder benutzerdefinierter Bereich
  • Pro-Agent-Zuordnung: Genau sehen, welcher Agent was verbraucht
  • Pro-Kanal-Zuordnung: Kostenaufschluesselung nach Messaging-Kanal
  • Pro-Anbieter-Zuordnung: Kosten nach KI-Anbieter (Anthropic, OpenAI, Google)
  • CSV/JSON-Export fuer externe Analyse
  • Siehe Abrechnung & Tarife fuer mehr zur Verwaltung Ihres Abonnements.

    View full documentation