Usage Rates - Neotask Documentation | Neotask

Detalhamento de Taxas de Uso

Esta pagina detalha exatamente como o Neotask calcula cobranças baseadas em uso. A maioria dos usuarios no plano single-agent nunca vera essas cobranças. Este detalhamento e para usuarios avancados enterprise cujos agentes operam em escala.

Para uma visao geral dos planos e como a cobranca funciona, veja Cobranca e Planos.

---

Como o Uso E Calculado

Toda vez que seu agente processa uma mensagem, ele consome tokens de IA (entrada e saida). O custo desses tokens depende de qual modelo de IA seu agente usa. O sistema rastreia quatro tipos de tokens separadamente, cada um com sua propria taxa:

  • Tokens de entrada: o prompt e contexto enviados ao modelo
  • Tokens de saida: a resposta que o modelo gera
  • Tokens de leitura de cache: tokens servidos do cache de prompts (mais baratos que entrada)
  • Tokens de escrita de cache: tokens escritos no cache de prompts para reutilizacao futura
  • Formula de Custo de Tokens

    
    Custo = (tokens de entrada / 1.000.000) x taxa de entrada
         + (tokens de saida / 1.000.000) x taxa de saida
         + (tokens de leitura de cache / 1.000.000) x taxa de leitura de cache
         + (tokens de escrita de cache / 1.000.000) x taxa de escrita de cache
    

    Fonte: server/src/config/modelPricing.ts

    ---

    Taxas de Token por Modelo de IA

    Estas sao as taxas por token para cada modelo de IA suportado. Todas as taxas sao em USD por 1 milhao de tokens.

    Anthropic Claude

    | Modelo | Entrada | Saida | Leitura de Cache | Escrita de Cache | |--------|--------:|------:|-----------------:|-----------------:| | Claude Opus 4.6 | $15,00 | $75,00 | $1,50 | $18,75 | | Claude Sonnet 4.5 | $3,00 | $15,00 | $0,30 | $3,75 | | Claude Haiku 4.5 | $0,80 | $4,00 | $0,08 | $1,00 | | Claude 3.5 Sonnet | $3,00 | $15,00 | $0,30 | $3,75 | | Claude 3.5 Haiku | $0,80 | $4,00 | $0,08 | $1,00 | | Claude 3 Opus | $15,00 | $75,00 | $1,50 | $18,75 | | Claude 3 Sonnet | $3,00 | $15,00 | $0,30 | $3,75 | | Claude 3 Haiku | $0,25 | $1,25 | $0,03 | $0,30 |

    OpenAI

    | Modelo | Entrada | Saida | Leitura de Cache | Escrita de Cache | |--------|--------:|------:|-----------------:|-----------------:| | GPT-4o | $2,50 | $10,00 | $1,25 | $2,50 | | GPT-4o Mini | $0,15 | $0,60 | $0,075 | $0,15 | | GPT-4 Turbo | $10,00 | $30,00 | $5,00 | $10,00 | | GPT-4 | $30,00 | $60,00 | $15,00 | $30,00 | | o1 | $15,00 | $60,00 | $7,50 | $15,00 | | o1-mini | $3,00 | $12,00 | $1,50 | $3,00 | | o3-mini | $1,10 | $4,40 | $0,55 | $1,10 |

    Google Gemini

    | Modelo | Entrada | Saida | Leitura de Cache | Escrita de Cache | |--------|--------:|------:|-----------------:|-----------------:| | Gemini 2.0 Flash | $0,10 | $0,40 | $0,025 | $0,10 | | Gemini 1.5 Pro | $1,25 | $5,00 | $0,3125 | $1,25 | | Gemini 1.5 Flash | $0,075 | $0,30 | $0,01875 | $0,075 |

    Fonte: server/src/config/modelPricing.ts linhas 8-42

    ---

    Taxas e Markups da Plataforma

    Ha varias taxas distintas que podem ser aplicadas dependendo de como seu agente esta sendo usado. Estas nao sao uma unica taxa fixa; cada uma se aplica em situacoes diferentes.

    1. Markup do Modo Creditos (Chave do Sistema): 20%

    Ao usar as chaves de API gerenciadas do Neotask (modo Chave do Sistema), um markup de 20% e aplicado sobre o custo bruto de tokens. Isso cobre gerenciamento de chaves de API, failover automatico entre provedores, roteamento de modelos e infraestrutura.

    Se voce usar o modo BYOK (Traga Suas Proprias Chaves), custos de tokens vao diretamente para seu provedor de IA, mas uma taxa de plataforma de 20% e deduzida dos seus creditos.

    Fonte: server/src/config/modelPricing.ts linha 53, CREDIT_MODE_MARKUP_PCT = 0.20

    2. Taxa de Plataforma por Excedente (Variavel)

    Quando seu uso excede o pool de creditos incluido, o custo restante se torna excedente. Uma taxa de plataforma e aplicada sobre o valor do excedente. A taxa depende do nivel do seu plano:

    | Nivel | Taxa de Excedente | |-------|------------------:| | Enterprise (padrao) | 10% - 25% |

    A taxa de excedente e cobrada apenas sobre o valor que excede seu pool de creditos. Uso dentro do seu pool nao tem taxa adicional.

    O excedente e automaticamente cobrado no seu cartao quando o valor nao liquidado atinge $20 (cobranca minima Stripe: $0,50).

    Fonte: server/src/config/planConfig.ts, overageFeePct e overageChargeThreshold

    3. Markup de Automacao: Progressivo de 50% ate 33%

    Quando seus agentes executam trabalhos automatizados (tarefas agendadas, cron jobs, automacoes recorrentes), um markup adicional de automacao e aplicado sobre o custo de tokens. Isso porque agentes automatizados substituem trabalho manual. Eles rodam sem atencao, por agendamento, lidando com tarefas que de outra forma exigiriam funcionarios.

    O markup de automacao usa faixas progressivas (como imposto de renda). Voce paga uma taxa mais alta nos primeiros dolares de uso automatizado e uma taxa menor conforme seus gastos automatizados crescem. Nao ha efeitos de degrau; cada dolar e cobrado apenas pela taxa da sua faixa.

    | Gasto Automatizado Acumulado (por ciclo de cobranca) | Taxa Marginal de Markup | |-------------------------------------------------------|------------------------:| | $0 - $10 | 50% | | $10,01 - $25 | 45% | | $25,01 - $50 | 40% | | $50,01 - $100 | 37% | | $100,01+ | 33% |

    Fonte: server/src/config/automationMarkup.ts linhas 38-44, DEFAULT_AUTOMATION_BRACKETS

    4. Markup de Tarefa de Codificacao: Fixo em 50%

    Trabalhos automatizados que envolvem ferramentas de codificacao (leituras de arquivo, escritas, execucao de codigo, comandos bash) sao cobrados com um markup fixo de 50%. A reducao progressiva nao se aplica a tarefas de codificacao; e sempre 50% independentemente do gasto acumulado.

    Ferramentas de codificacao: exec, read, write, bash, code

    Fonte: server/src/config/automationMarkup.ts linha 49, CODING_TASK_MARKUP_RATE = 0.50

    ---

    Como os Custos se Acumulam

    Essas taxas podem se acumular dependendo da situacao:

    Chat interativo (modo Chave do Sistema):

  • Custo bruto de tokens + 20% markup do modo creditos
  • Sem markup de automacao (nao e automatizado)
  • Chat interativo (modo BYOK):

  • Custo bruto de tokens + taxa de plataforma de 20% dos creditos
  • Cron job automatizado (modo Chave do Sistema):

  • Custo bruto de tokens + 20% markup do modo creditos + markup de automacao (50%-33%)
  • Tarefa de codificacao automatizada (modo Chave do Sistema):

  • Custo bruto de tokens + 20% markup do modo creditos + 50% markup de tarefa de codificacao
  • ---

    Exemplo de Cobranca de Automacao

    Um cron job agendado roda diariamente. O agente de IA leva cerca de 2-3 horas para completar seu trabalho. O job consome $10 em tokens brutos (o custo real para o provedor de IA).

    Discriminacao:

  • Custo de tokens: $10 (repassado ao provedor de IA; e o que a computacao custa)
  • Markup de automacao: $10 x 50% = $5 (taxa da plataforma por executar o trabalho sem atencao)
  • Cobranca total: $15
  • Os $10 cobrem a computacao de IA real que seu agente consumiu. Os $5 sao a taxa de automacao. A plataforma executou o trabalho por agendamento, monitorou a execucao, tratou tentativas e entregou resultados, tudo sem ninguem precisar estar no computador.

    Por que automacao custa mais: Agentes automatizados substituem trabalho humano. Um cron job que verifica suas analytics toda manha, redige relatorios, monitora estoque ou processa pedidos recebidos esta fazendo trabalho que de outra forma exigiria o tempo de uma pessoa. O markup de automacao reflete o valor dessa execucao sem atencao, e ele diminui quanto mais voce automatiza, recompensando a escala. Um tenant gastando $100+/ciclo em trabalhos automatizados paga apenas 33% de markup em vez de 50%.

    ---

    Creditos de Recarga

    Voce pode comprar creditos adicionais a qualquer momento para pre-pagar pelo uso:

  • Recarga minima: $5
  • Recarga maxima: $10.000
  • Creditos nunca expiram. Eles permanecem na sua conta ate serem usados.
  • Recarga automatica: Opcionalmente, configure recargas automaticas quando seu saldo cair abaixo de um limite (padrao: saldo de $2 aciona uma recarga de $10)
  • Creditos de recarga sao consumidos apos o pool de creditos se esgotar e antes do excedente acumular. Isso significa que as recargas atuam como um buffer entre seus creditos incluidos e cobranças de excedente.

    Fonte: server/src/services/overageCharger.ts, server/src/services/balanceService.ts

    ---

    Ordem de Deducao de Creditos

    Quando seu agente completa uma tarefa, o custo e deduzido nesta ordem:

  • Creditos de registro ($10 unicos no registro, nao redefinem)
  • Saldo de recarga (creditos comprados, nunca expiram)
  • Excedente (cobrado no seu cartao com taxa de plataforma aplicada)
  • Isso significa que seus creditos incluidos sao sempre usados primeiro, depois quaisquer recargas compradas, e somente apos ambos serem esgotados a cobranca de excedente comeca.

    Fonte: server/src/services/balanceService.ts linhas 240-286

    ---

    Controles de Orcamento

    Usuarios Enterprise tem aplicacao de orcamento integrada:

  • Orcamento diario global: Padrao $500/dia (configuravel). Quando excedido, o gateway do agente desliga automaticamente para prevenir custos descontrolados.
  • Limites de gasto por agente: Defina um limite diario para cada agente individual. Quando um agente atinge seu limite, suas sessoes sao automaticamente pausadas.
  • Desligamento automatico: Configuravel. Ative ou desative o desligamento automatico do gateway ao exceder o orcamento.
  • Aplicacao em tempo real: O orcamento e verificado a cada 30 segundos.
  • Fonte: SwiftClaw-Electron/src/main/budgetEnforcer.ts, SwiftClaw-Electron/src/main/agentSpendLimitStore.ts

    ---

    Visualizando Seu Uso

    Acompanhe tudo isso em tempo real na pagina de Uso no aplicativo desktop:

  • Discriminacao no nivel de token por modelo, provedor, agente, canal e data
  • Discriminacao de custos: custos de entrada, saida, leitura de cache e escrita de cache mostrados separadamente
  • Granularidade temporal: hoje, ultimas 24h, 7 dias, 30 dias, 365 dias ou intervalo personalizado
  • Atribuicao por agente: veja exatamente qual agente esta consumindo o que
  • Atribuicao por canal: discriminacao de custos por canal de mensagens
  • Atribuicao por provedor: custo por provedor de IA (Anthropic, OpenAI, Google)
  • Exportacao CSV/JSON para analise externa
  • Veja Cobranca e Planos para mais sobre como gerenciar sua assinatura.

    View full documentation