Voice Control - Neotask Documentation | Neotask

Sprachsteuerung

Neotask enthaelt ein voll ausgestattetes Sprachsteuerungssystem, mit dem Sie vollstaendig per Sprache mit Ihren KI-Agenten interagieren koennen. Sie koennen Agenten aktivieren, Befehle erteilen, die Oberflaeche navigieren und gesprochene Antworten erhalten -- alles freisprechen.

---

Ueberblick

Aktivierungsmethoden

Es gibt zwei Moeglichkeiten, die Spracheingabe zu aktivieren:

  • Immer hoererendes Aktivierungswort. Sprechen Sie eine Trigger-Phrase (z.B. "Hey Neotask") und die Anwendung beginnt zuzuhoeren. Keine Tasten erforderlich.
  • Tastenkombination. Druecken Sie eine Tastenkombination, um die Spracheingabe bei Bedarf zu starten.
  • Sie koennen Ihre bevorzugte Methode unter Einstellungen > Aktivierungsmodus waehlen.

    Sprachinteraktionsablauf

    Jede Sprachinteraktion folgt diesem Zyklus:

  • Aktivierung. Aktivierung per Aktivierungswort oder Tastenkombination.
  • Zuhoeren. Neotask hoert Ihre gesprochene Eingabe.
  • Transkribieren. Sprache wird in Echtzeit in Text umgewandelt.
  • Denken. Die KI verarbeitet Ihre Anfrage und bestimmt die geeigneten Aktionen.
  • Sprechen. Die Antwort wird Ihnen per natuerlicher Text-to-Speech vorgelesen.
  • Zuhoeren. Das System kehrt zum Zuhoeren fuer Ihren naechsten Befehl zurueck und haelt die Konversation am Laufen.
  • ---

    Aktivierungswort

    Standard-Aktivierungswort

    Das Standard-Aktivierungswort ist:

    > "Hey Neotask"

    Sagen Sie einfach diese Phrase, und Neotask beginnt, auf Ihren Befehl zu hoeren.

    Benutzerdefinierte Aktivierungswoerter

    Sie koennen ein benutzerdefiniertes Aktivierungswort unter Einstellungen > Aktivierungswort festlegen. Waehlen Sie eine kurze, deutliche Phrase, die leicht auszusprechen ist und in normaler Konversation eher unwahrscheinlich vorkommt.

    Leistung

    Die Aktivierungsworterkennung laeuft vollstaendig auf Ihrem lokalen Rechner; kein Audio wird fuer die Aktivierungswortverarbeitung in die Cloud gesendet. Die Erkennungs-Engine ist fuer ultra-niedrigen CPU-Verbrauch optimiert, sodass sie im Hintergrund aktiv bleiben kann, ohne die Systemleistung zu beeintraechtigen.

    Empfindlichkeit

    Die Empfindlichkeit des Aktivierungsworts ist konfigurierbar. Wenn Sie feststellen, dass das Aktivierungswort zu leicht ausloest (Fehlalarme) oder nicht oft genug (verpasste Aktivierungen), passen Sie den Empfindlichkeitsregler unter Einstellungen > Aktivierungswort > Empfindlichkeit an.

    ---

    Tastenkombination-Aktivierung

    Standard-Tastenkombinationen

    | Plattform | Tastenkombination | |---|---| | macOS | Cmd + Shift + Leertaste | | Windows / Linux | Ctrl + Shift + Leertaste |

    Anpassung

    Die Tastenkombination ist vollstaendig anpassbar. Gehen Sie zu Einstellungen > Aktivierungsmodus > Tastenkombination, um Ihre bevorzugte Tastenkombination festzulegen.

    ---

    Sprachfunktionen

    Speech-to-Text

    Neotask verwendet Deepgram fuer Echtzeit-Speech-to-Text-Transkription. Ihre gesprochenen Worte erscheinen als Text in der Konversation, waehrend Sie sprechen, mit minimaler Latenz.

    Text-to-Speech

    Antworten werden per ElevenLabs natuerlicher Text-to-Speech-Technologie vorgelesen. Die Stimmbibliothek umfasst 100+ Stimmen in einer breiten Palette von Stilen.

    Stimmauswahl

    Waehlen Sie Ihre bevorzugte Stimme unter Einstellungen > Stimme. Sie koennen Stimmen filtern nach:

  • Geschlecht: Maennlich, weiblich oder neutral.
  • Akzent: Amerikanisch, Britisch, Australisch und viele mehr.
  • Alter: Jung, mittleres Alter oder reif.
  • Eine Stimmvorschau-Schaltflaeche ist neben jeder Stimme verfuegbar, damit Sie eine Probe hoeren koennen, bevor Sie sie auswaehlen.

    Konversationssteuerung

  • Pause. Pausieren Sie die Sprachkonversation jederzeit. Die KI hoert auf zuzuhoeren und zu sprechen, bis Sie fortfahren.
  • Fortsetzen. Setzen Sie die Konversation dort fort, wo Sie aufgehoert haben.
  • Dateianhange

    Sie koennen waehrend einer Sprachsitzung Dateien anhaengen. Sagen Sie zum Beispiel "Ich moechte eine Datei teilen" und verwenden Sie den Anhaengedialog, oder ziehen Sie eine Datei per Drag-and-Drop in das Konversationsfenster, waehrend der Sprachmodus aktiv ist. Die KI kann dann auf die angehaengte Datei verweisen und damit arbeiten.

    ---

    Sprachbefehle

    Neotask versteht eine breite Palette natuerlichsprachlicher Befehle. Nachfolgend haeufige Kategorien mit Beispielen.

    Websites oeffnen

    | Beispielbefehl | |---| | "Oeffne YouTube" | | "Gehe zu github.com" | | "Oeffne die Neotask Dokumentation" |

    Im Web suchen

    | Beispielbefehl | |---| | "Suche nach Python-Tutorials auf Google" | | "Schau das Wetter in San Francisco nach" | | "Suche auf Stack Overflow nach React Hooks" |

    Anwendungen starten

    | Beispielbefehl | |---| | "Oeffne Safari" | | "Starte Finder" | | "Oeffne Visual Studio Code" | | "Starte Terminal" |

    Browser-Steuerung

    | Beispielbefehl | |---| | "Nach unten scrollen" | | "Zurueck gehen" | | "Seite aktualisieren" | | "Nach oben scrollen" |

    Agentenoperationen

    | Beispielbefehl | |---| | "Erstelle einen Agenten namens Forschungsassistent" | | "Starte den Agenten" | | "Stoppe den Agenten" | | "Zeig mir den Agentenstatus" |

    Multi-Befehl-Ketten

    Sie koennen mehrere Anweisungen in einem einzelnen gesprochenen Befehl kombinieren:

    | Beispielbefehl | |---| | "Erstelle einen Agenten namens Datenanalyse, aktiviere Sprache und starte ihn" | | "Oeffne YouTube und suche nach Machine-Learning-Tutorials" | | "Stoppe den Agenten und zeig mir das Sitzungsprotokoll" |

    ---

    Tool-Ausfuehrung waehrend Spracheingabe

    Wenn Ihr Sprachbefehl ein Tool oder eine Aktion ausloest, gibt Neotask Echtzeit-gesprochenes Feedback, damit Sie wissen, was passiert:

  • "Ich oeffne den Datei-Editor..."
  • "Fuehre den Shell-Befehl jetzt aus..."
  • "Rufe die Webseite ab..."
  • Unterstuetzte Tool-Aktionen

    Tools, die per Sprache ausgeloest werden koennen, umfassen:

  • Shell-Befehle. Terminal-Befehle auf Ihrem Rechner ausfuehren.
  • Dateioperationen. Dateien erstellen, lesen, bearbeiten und organisieren.
  • Webanfragen. Daten von URLs und APIs abrufen.
  • Genehmigungsworkflow

    Wenn Safe Mode aktiviert ist (standardmaessig ein), erfordern sensible Aktionen Ihre explizite gesprochene oder geklickte Genehmigung vor der Ausfuehrung. Sensible Aktionen umfassen:

  • Dateien oder Verzeichnisse loeschen
  • Code oder Dienste bereitstellen
  • Nachrichten oder E-Mails in Ihrem Namen senden
  • Die KI beschreibt die Aktion und bittet um Bestaetigung, bevor sie fortfaehrt.

    ---

    Mathematik-Tutoring-Modus

    Neotask enthaelt einen spezialisierten Mathematik-Tutoring-Modus, der Sprachunterricht mit animierten Visualisierungen kombiniert.

    Wie es funktioniert

  • Fragen Sie nach einem Mathematik-Thema, zum Beispiel: "Erklaere mir den Einheitskreis."
  • Die KI erstellt einen Lernplan, der auf das Thema zugeschnitten ist.
  • Animierte Visualisierungen werden mit Manim (der mathematischen Animations-Engine) gerendert.
  • Der Unterricht wird Abschnitt fuer Abschnitt geliefert, mit gesprochenen Erklaerungen, die mit den Visualisierungen synchronisiert sind.
  • Visualisierungsvorlagen

    Die folgenden integrierten Vorlagen sind fuer sofortige animierte Lektionen verfuegbar:

    | Vorlage | Beschreibung | |---|---| | Einheitskreis | Visueller Durchgang durch den Einheitskreis mit Winkel- und Koordinatenbeschriftungen. | | Satz des Pythagoras | Animation eines geometrischen Beweises mit beschrifteten Quadraten an den Dreiecksseiten. | | Taylor-Reihe | Schrittweise Entwicklung, die die Konvergenz der Polynomapproximation zeigt. | | Quadratische Formel | Herleitung und grafische Interpretation der Nullstellen. | | Sinus- / Kosinuswellen | Animierte Wellendiagramme mit Amplitude, Periode und Phasenanmerkungen. | | Ableitungen | Tangenten-Animation zur Veranschaulichung der momentanen Aenderungsrate. | | Integrale | Flaechenberechnung mit Riemann-Summen-Progression. | | Funktionsgraphen | Beliebige Funktion mit beschrifteten Achsen, Schnittpunkten und wichtigen Merkmalen zeichnen. |

    Progressives Lehren

    Lektionen sind in Abschnitte unterteilt. Nach jedem Abschnitt pausiert die KI und fragt, ob Sie bereit sind fortzufahren, wiederholen moechten oder Fragen haben. Dies stellt sicher, dass Sie in Ihrem eigenen Tempo lernen.

    ---

    Unterstuetzte Sprachen

    Neotask unterstuetzt Sprachinteraktion in 21 Sprachen:

    | Sprache | Code | |---|---| | Englisch | en | | Spanisch | es | | Franzoesisch | fr | | Deutsch | de | | Italienisch | it | | Portugiesisch | pt | | Niederlaendisch | nl | | Russisch | ru | | Chinesisch (Mandarin) | zh | | Japanisch | ja | | Koreanisch | ko | | Arabisch | ar | | Hindi | hi | | Tuerkisch | tr | | Polnisch | pl | | Schwedisch | sv | | Daenisch | da | | Norwegisch | no | | Finnisch | fi | | Tschechisch | cs | | Rumaenisch | ro |

    Sie koennen die Sprachsprache jederzeit unter Einstellungen > Sprache aendern. Sowohl Spracherkennung als auch Text-to-Speech wechseln zur ausgewaehlten Sprache.

    ---

    Sprachprompts

    Sprachprompts steuern, wie sich der KI-Assistent waehrend Sprachkonversationen verhaelt und antwortet. Beide sind unter Einstellungen > Sprachprompts bearbeitbar.

    System-Prompt

    Der System-Prompt definiert die allgemeine Persoenlichkeit und das Verhalten des Sprachassistenten. Er legt den Ton, das Expertenniveau und den Interaktionsstil fest. Sie koennen den Assistenten beispielsweise anweisen, praegnant und technisch oder freundlich und gespraerig zu sein.

    Antwort-Prompt

    Der Antwort-Prompt passt an, wie der Assistent seine gesprochenen Antworten formatiert und liefert. Verwenden Sie ihn, um die Antwortlaenge, den Detailgrad, ob der Assistent Analogien verwendet, und andere stilistische Praeferenzen zu steuern.

    Beide Prompts akzeptieren Freitext und werden sofort fuer alle nachfolgenden Sprachinteraktionen wirksam.

    View full documentation