Voice Control - Neotask Documentation | Neotask

Controle por Voz

O Neotask inclui um sistema completo de controle por voz que permite interagir com seus agentes de IA inteiramente por fala. Voce pode ativar agentes, emitir comandos, navegar pela interface e receber respostas faladas, tudo sem as maos.

---

Visao Geral

Metodos de Ativacao

Ha duas maneiras de ativar a entrada de voz:

  • Palavra de ativacao sempre ouvindo. Diga uma frase de gatilho (ex.: "Hey Neotask") e o aplicativo comeca a ouvir. Nenhuma tecla para pressionar.
  • Atalho de teclado. Pressione uma combinacao de teclas para iniciar a entrada de voz sob demanda.
  • Voce pode escolher seu metodo preferido em Configuracoes > Modo de Ativacao.

    Fluxo de Interacao por Voz

    Cada interacao por voz segue este ciclo:

  • Ativar. Ativacao via palavra de ativacao ou atalho de teclado.
  • Ouvir. O Neotask ouve sua entrada falada.
  • Transcrever. A fala e convertida em texto em tempo real.
  • Pensar. A IA processa sua solicitacao e determina as acoes apropriadas.
  • Falar. A resposta e falada de volta para voce usando texto-para-fala natural.
  • Ouvir. O sistema retorna a ouvir seu proximo comando, mantendo a conversa fluindo.
  • ---

    Ativacao por Palavra de Ativacao

    Palavra de Ativacao Padrao

    A palavra de ativacao padrao e:

    > "Hey Neotask"

    Simplesmente diga esta frase e o Neotask comecara a ouvir seu comando.

    Palavras de Ativacao Personalizadas

    Voce pode definir uma palavra de ativacao personalizada em Configuracoes > Palavra de Ativacao. Escolha qualquer frase curta e distinta que seja facil para voce dizer e improvavel de ocorrer em conversa normal.

    Desempenho

    A deteccao de palavra de ativacao roda inteiramente na sua maquina local; nenhum audio e enviado para a nuvem para processamento de palavra de ativacao. O motor de deteccao e otimizado para uso de CPU ultra-baixo, para que possa permanecer ativo em segundo plano sem impactar o desempenho do sistema.

    Sensibilidade

    A sensibilidade da palavra de ativacao e configuravel. Se voce achar que a palavra de ativacao dispara facilmente demais (falsos positivos) ou nao com frequencia suficiente (ativacoes perdidas), ajuste o controle deslizante de sensibilidade em Configuracoes > Palavra de Ativacao > Sensibilidade.

    ---

    Ativacao por Atalho de Teclado

    Atalhos Padrao

    | Plataforma | Atalho | |------------|--------| | macOS | Cmd + Shift + Space | | Windows / Linux | Ctrl + Shift + Space |

    Personalizacao

    O atalho de teclado e totalmente personalizavel. Va em Configuracoes > Modo de Ativacao > Atalho de Teclado para definir sua combinacao de teclas preferida.

    ---

    Recursos de Voz

    Fala para Texto

    O Neotask usa Deepgram para transcricao de fala para texto em tempo real. Suas palavras faladas aparecem como texto na conversa conforme voce fala, com latencia minima.

    Texto para Fala

    Respostas sao faladas em voz alta usando tecnologia de texto-para-fala natural da ElevenLabs. A biblioteca de vozes inclui 100+ vozes abrangendo uma ampla variedade de estilos.

    Selecao de Voz

    Escolha sua voz preferida em Configuracoes > Voz. Voce pode filtrar vozes por:

  • Genero: Masculino, feminino ou neutro.
  • Sotaque: Americano, britanico, australiano e muitos outros.
  • Idade: Jovem, meia-idade ou maduro.
  • Um botao de pre-visualizacao de voz esta disponivel ao lado de cada voz para que voce possa ouvir uma amostra antes de selecionar.

    Controles de Conversa

  • Pausar. Pause a conversa por voz a qualquer momento. A IA parara de ouvir e falar ate voce retomar.
  • Retomar. Continue a conversa de onde parou.
  • Anexos de Arquivos

    Voce pode anexar arquivos durante uma sessao de voz. Por exemplo, diga "Quero compartilhar um arquivo" e use o dialogo de anexo, ou arraste e solte um arquivo na janela de conversa enquanto o modo de voz esta ativo. A IA pode entao referenciar e trabalhar com o arquivo anexado.

    ---

    Comandos de Voz

    O Neotask entende uma ampla variedade de comandos em linguagem natural. Abaixo estao categorias comuns com exemplos.

    Abrir Sites

    | Exemplo de Comando | |--------------------| | "Abrir YouTube" | | "Ir para github.com" | | "Abrir a documentacao do Neotask" |

    Pesquisar na Web

    | Exemplo de Comando | |--------------------| | "Pesquisar tutoriais de Python no Google" | | "Procurar a previsao do tempo em Sao Paulo" | | "Pesquisar no Stack Overflow por React hooks" |

    Abrir Aplicativos

    | Exemplo de Comando | |--------------------| | "Abrir Safari" | | "Abrir Finder" | | "Abrir Visual Studio Code" | | "Abrir Terminal" |

    Controle do Navegador

    | Exemplo de Comando | |--------------------| | "Rolar para baixo" | | "Voltar" | | "Atualizar a pagina" | | "Rolar para o topo" |

    Operacoes do Agente

    | Exemplo de Comando | |--------------------| | "Criar um agente chamado Assistente de Pesquisa" | | "Iniciar o agente" | | "Parar o agente" | | "Mostrar o status do agente" |

    Cadeias de Multiplos Comandos

    Voce pode combinar multiplas instrucoes em um unico comando falado:

    | Exemplo de Comando | |--------------------| | "Criar um agente chamado Analisador de Dados, ativar voz e inicia-lo" | | "Abrir YouTube e pesquisar tutoriais de machine learning" | | "Parar o agente e mostrar o log da sessao" |

    ---

    Execucao de Ferramentas Durante a Voz

    Quando seu comando de voz aciona uma ferramenta ou acao, o Neotask fornece feedback falado em tempo real para que voce saiba o que esta acontecendo:

  • "Estou abrindo o editor de arquivos..."
  • "Executando o comando shell agora..."
  • "Buscando a pagina web..."
  • Acoes de Ferramentas Suportadas

    Ferramentas que podem ser acionadas por voz incluem:

  • Comandos shell. Executar comandos de terminal na sua maquina.
  • Operacoes de arquivo. Criar, ler, editar e organizar arquivos.
  • Requisicoes web. Buscar dados de URLs e APIs.
  • Fluxo de Aprovacao

    Quando o Modo Seguro esta ativado (ligado por padrao), acoes sensiveis requerem sua aprovacao explicita falada ou clicada antes da execucao. Acoes sensiveis incluem:

  • Excluir arquivos ou diretorios
  • Implantar codigo ou servicos
  • Enviar mensagens ou emails em seu nome
  • A IA descreve a acao e pede confirmacao antes de prosseguir.

    ---

    Modo de Tutoria Matematica

    O Neotask inclui um modo especializado de tutoria matematica que combina instrucao por voz com visualizacoes animadas.

    Como Funciona

  • Pergunte sobre um topico matematico, por exemplo, "Ensine-me sobre o circulo unitario."
  • A IA gera um plano de aula adaptado ao topico.
  • Visualizacoes animadas sao renderizadas usando Manim (o motor de animacao matematica).
  • A aula e entregue secao por secao, com explicacoes faladas sincronizadas com os visuais.
  • Templates de Visualizacao

    Os seguintes templates integrados estao disponiveis para aulas animadas instantaneas:

    | Template | Descricao | |----------|-----------| | Circulo Unitario | Demonstracao visual do circulo unitario com rotulos de angulo e coordenadas. | | Teorema de Pitagoras | Animacao de prova geometrica com quadrados rotulados nos lados do triangulo. | | Serie de Taylor | Expansao passo a passo mostrando convergencia de aproximacao polinomial. | | Formula Quadratica | Derivacao e interpretacao grafica das raizes. | | Ondas Seno / Cosseno | Graficos de ondas animadas com anotacoes de amplitude, periodo e fase. | | Derivadas | Animacao de linha tangente ilustrando taxa instantanea de variacao. | | Integrais | Animacao de area sob a curva com progressao de soma de Riemann. | | Graficar Funcoes | Plotar qualquer funcao com eixos rotulados, interceptos e caracteristicas-chave. |

    Ensino Progressivo

    As aulas sao divididas em secoes. Apos cada secao, a IA pausa e pergunta se voce esta pronto para continuar, quer revisar ou tem perguntas. Isso garante que voce aprenda no seu proprio ritmo.

    ---

    Idiomas Suportados

    O Neotask suporta interacao por voz em 21 idiomas:

    | Idioma | Codigo | |--------|--------| | Ingles | en | | Espanhol | es | | Frances | fr | | Alemao | de | | Italiano | it | | Portugues | pt | | Holandes | nl | | Russo | ru | | Chines (Mandarim) | zh | | Japones | ja | | Coreano | ko | | Arabe | ar | | Hindi | hi | | Turco | tr | | Polones | pl | | Sueco | sv | | Dinamarques | da | | Noruegues | no | | Finlandes | fi | | Tcheco | cs | | Romeno | ro |

    Voce pode mudar o idioma de voz a qualquer momento em Configuracoes > Idioma. Tanto o reconhecimento de fala quanto o texto-para-fala mudarao para o idioma selecionado.

    ---

    Prompts de Voz

    Os prompts de voz controlam como o assistente de IA se comporta e responde durante conversas por voz. Ambos sao editaveis em Configuracoes > Prompts de Voz.

    Prompt do Sistema

    O prompt do sistema define a personalidade e comportamento geral do assistente de voz. Ele define o tom, nivel de especialidade e estilo de interacao. Por exemplo, voce pode instruir o assistente a ser conciso e tecnico, ou amigavel e conversacional.

    Prompt de Resposta

    O prompt de resposta personaliza como o assistente formata e entrega suas respostas faladas. Use-o para controlar o comprimento da resposta, nivel de detalhe, se o assistente usa analogias e outras preferencias estilisticas.

    Ambos os prompts aceitam texto livre e entram em vigor imediatamente para todas as interacoes de voz subsequentes.

    View full documentation