Voice Control - Neotask Documentation | Neotask

Control por Voz

Neotask incluye un sistema de control por voz completo que le permite interactuar con sus agentes de IA enteramente a traves del habla. Puede activar agentes, emitir comandos, navegar la interfaz y recibir respuestas habladas, todo manos libres.

---

Descripcion General

Metodos de Activacion

Hay dos formas de activar la entrada de voz:

  • Palabra de activacion siempre escuchando. Diga una frase de activacion (por ejemplo, "Hey Neotask") y la aplicacion comienza a escuchar. Sin teclas que presionar.
  • Atajo de teclado. Presione una combinacion de teclas para iniciar la entrada de voz bajo demanda.
  • Puede elegir su metodo preferido en Ajustes > Modo de Activacion.

    Flujo de Interaccion por Voz

    Cada interaccion por voz sigue este ciclo:

  • Activar. Activacion via palabra de activacion o atajo de teclado.
  • Escuchar. Neotask escucha su entrada hablada.
  • Transcribir. El habla se convierte a texto en tiempo real.
  • Pensar. La IA procesa su solicitud y determina las acciones apropiadas.
  • Hablar. La respuesta se le dice usando texto a voz natural.
  • Escuchar. El sistema vuelve a escuchar su siguiente comando, manteniendo la conversacion fluida.
  • ---

    Activacion por Palabra de Activacion

    Palabra de Activacion Predeterminada

    La palabra de activacion predeterminada es:

    > "Hey Neotask"

    Simplemente diga esta frase, y Neotask comenzara a escuchar su comando.

    Palabras de Activacion Personalizadas

    Puede configurar una palabra de activacion personalizada en Ajustes > Palabra de Activacion. Elija cualquier frase corta y distintiva que sea facil de decir y poco probable que ocurra en conversacion normal.

    Rendimiento

    La deteccion de la palabra de activacion se ejecuta completamente en su maquina local; no se envia audio a la nube para el procesamiento de la palabra de activacion. El motor de deteccion esta optimizado para uso de CPU ultra bajo, por lo que puede permanecer activo en segundo plano sin impactar el rendimiento del sistema.

    Sensibilidad

    La sensibilidad de la palabra de activacion es configurable. Si encuentra que la palabra de activacion se activa demasiado facilmente (falsos positivos) o no lo suficiente (activaciones perdidas), ajuste el control deslizante de sensibilidad en Ajustes > Palabra de Activacion > Sensibilidad.

    ---

    Activacion por Atajo de Teclado

    Atajos Predeterminados

    | Plataforma | Atajo | |---|---| | macOS | Cmd + Shift + Space | | Windows / Linux | Ctrl + Shift + Space |

    Personalizacion

    El atajo de teclado es completamente personalizable. Vaya a Ajustes > Modo de Activacion > Atajo de Teclado para configurar su combinacion de teclas preferida.

    ---

    Funciones de Voz

    Voz a Texto

    Neotask usa Deepgram para transcripcion de voz a texto en tiempo real. Sus palabras habladas aparecen como texto en la conversacion mientras habla, con latencia minima.

    Texto a Voz

    Las respuestas se dicen en voz alta usando la tecnologia de texto a voz natural de ElevenLabs. La biblioteca de voces incluye mas de 100 voces que abarcan una amplia gama de estilos.

    Seleccion de Voz

    Elija su voz preferida en Ajustes > Voz. Puede filtrar voces por:

  • Genero: Masculino, femenino o neutro.
  • Acento: Americano, britanico, australiano y muchos mas.
  • Edad: Joven, mediana edad o maduro.
  • Un boton de vista previa de voz esta disponible junto a cada voz para que pueda escuchar una muestra antes de seleccionarla.

    Controles de Conversacion

  • Pausar. Pause la conversacion por voz en cualquier momento. La IA dejara de escuchar y hablar hasta que reanude.
  • Reanudar. Continue la conversacion desde donde la dejo.
  • Archivos Adjuntos

    Puede adjuntar archivos durante una sesion de voz. Por ejemplo, diga "Quiero compartir un archivo" y use el dialogo de adjuntos, o arrastre y suelte un archivo en la ventana de conversacion mientras el modo de voz esta activo. La IA puede entonces referenciar y trabajar con el archivo adjunto.

    ---

    Comandos de Voz

    Neotask comprende una amplia gama de comandos en lenguaje natural. A continuacion se presentan categorias comunes con ejemplos.

    Abrir Sitios Web

    | Comando de Ejemplo | |---| | "Abrir YouTube" | | "Ir a github.com" | | "Abrir la documentacion de Neotask" |

    Buscar en la Web

    | Comando de Ejemplo | |---| | "Buscar tutoriales de Python en Google" | | "Buscar el clima en San Francisco" | | "Buscar en Stack Overflow sobre React hooks" |

    Lanzar Aplicaciones

    | Comando de Ejemplo | |---| | "Abrir Safari" | | "Lanzar Finder" | | "Abrir Visual Studio Code" | | "Iniciar Terminal" |

    Control del Navegador

    | Comando de Ejemplo | |---| | "Desplazar hacia abajo" | | "Ir atras" | | "Actualizar la pagina" | | "Desplazar al inicio" |

    Operaciones del Agente

    | Comando de Ejemplo | |---| | "Crear un agente llamado Asistente de Investigacion" | | "Iniciar el agente" | | "Detener el agente" | | "Mostrar el estado del agente" |

    Cadenas de Multiples Comandos

    Puede combinar multiples instrucciones en un solo comando hablado:

    | Comando de Ejemplo | |---| | "Crear un agente llamado Analizador de Datos, habilitar voz e iniciarlo" | | "Abrir YouTube y buscar tutoriales de machine learning" | | "Detener el agente y mostrar el log de la sesion" |

    ---

    Ejecucion de Herramientas Durante la Voz

    Cuando su comando de voz activa una herramienta o accion, Neotask proporciona retroalimentacion hablada en tiempo real para que sepa que esta sucediendo:

  • "Estoy abriendo el editor de archivos..."
  • "Ejecutando el comando de shell ahora..."
  • "Obteniendo la pagina web..."
  • Acciones de Herramientas Soportadas

    Las herramientas que pueden activarse por voz incluyen:

  • Comandos shell. Ejecutar comandos de terminal en su maquina.
  • Operaciones de archivos. Crear, leer, editar y organizar archivos.
  • Solicitudes web. Obtener datos de URLs y APIs.
  • Flujo de Aprobacion

    Cuando el Modo Seguro esta habilitado (activado por defecto), las acciones sensibles requieren su aprobacion explicita hablada o por clic antes de la ejecucion. Las acciones sensibles incluyen:

  • Eliminar archivos o directorios
  • Desplegar codigo o servicios
  • Enviar mensajes o correos en su nombre
  • La IA describira la accion y pedira confirmacion antes de proceder.

    ---

    Modo de Tutoria Matematica

    Neotask incluye un modo especializado de tutoria matematica que combina instruccion por voz con visualizaciones animadas.

    Como Funciona

  • Pregunte sobre un tema matematico, por ejemplo, "Enseneme sobre el circulo unitario."
  • La IA genera un plan de leccion adaptado al tema.
  • Las visualizaciones animadas se renderizan usando Manim (el motor de animacion matematica).
  • La leccion se entrega seccion por seccion, con explicaciones habladas sincronizadas con las visualizaciones.
  • Plantillas de Visualizacion

    Las siguientes plantillas integradas estan disponibles para lecciones animadas instantaneas:

    | Plantilla | Descripcion | |---|---| | Circulo Unitario | Recorrido visual del circulo unitario con etiquetas de angulos y coordenadas. | | Teorema de Pitagoras | Animacion de prueba geometrica con cuadrados etiquetados en los lados del triangulo. | | Series de Taylor | Expansion paso a paso mostrando la convergencia de aproximacion polinomial. | | Formula Cuadratica | Derivacion e interpretacion grafica de las raices. | | Ondas Seno / Coseno | Graficos de ondas animadas con anotaciones de amplitud, periodo y fase. | | Derivadas | Animacion de linea tangente ilustrando la tasa de cambio instantaneo. | | Integrales | Animacion del area bajo la curva con progresion de sumas de Riemann. | | Graficar Funciones | Graficar cualquier funcion con ejes etiquetados, intersecciones y caracteristicas clave. |

    Ensenanza Progresiva

    Las lecciones se dividen en secciones. Despues de cada seccion, la IA pausa y pregunta si esta listo para continuar, desea revisar o tiene preguntas. Esto asegura que aprenda a su propio ritmo.

    ---

    Idiomas Soportados

    Neotask soporta interaccion por voz en 21 idiomas:

    | Idioma | Codigo | |---|---| | Ingles | en | | Espanol | es | | Frances | fr | | Aleman | de | | Italiano | it | | Portugues | pt | | Holandes | nl | | Ruso | ru | | Chino (Mandarin) | zh | | Japones | ja | | Coreano | ko | | Arabe | ar | | Hindi | hi | | Turco | tr | | Polaco | pl | | Sueco | sv | | Danes | da | | Noruego | no | | Finlandes | fi | | Checo | cs | | Rumano | ro |

    Puede cambiar el idioma de voz en cualquier momento en Ajustes > Idioma. Tanto el reconocimiento de voz como el texto a voz cambiaran al idioma seleccionado.

    ---

    Prompts de Voz

    Los prompts de voz controlan como se comporta y responde el asistente de IA durante las conversaciones por voz. Ambos son editables en Ajustes > Prompts de Voz.

    Prompt del Sistema

    El prompt del sistema define la personalidad y comportamiento general del asistente de voz. Establece el tono, nivel de experiencia y estilo de interaccion. Por ejemplo, puede instruir al asistente para que sea conciso y tecnico, o amigable y conversacional.

    Prompt de Respuesta

    El prompt de respuesta personaliza como el asistente formatea y entrega sus respuestas habladas. Uselo para controlar la longitud de la respuesta, el nivel de detalle, si el asistente usa analogias y otras preferencias estilisticas.

    Ambos prompts aceptan texto libre y surten efecto inmediatamente para todas las interacciones de voz subsiguientes.

    View full documentation