Neotask 包含一个功能完整的语音控制系统,让您完全通过语音与 AI 代理交互。您可以激活代理、发出命令、导航界面以及接收语音响应,全程免提操作。
---
有两种方式激活语音输入:
您可以在设置 > 唤醒模式中选择首选方式。
每次语音交互遵循以下循环:
---
默认唤醒词是:
> "Hey Neotask"
只需说出这个短语,Neotask 就会开始监听您的命令。
您可以在设置 > 唤醒词中设置自定义唤醒词。选择任何简短、独特的短语,便于您说出且不太可能在正常对话中出现。
唤醒词检测完全在您的本地机器上运行;唤醒词处理不会将音频发送到云端。检测引擎针对超低 CPU 使用率进行了优化,因此可以在后台保持活跃而不影响系统性能。
唤醒词灵敏度可配置。如果您发现唤醒词触发太容易(误触发)或不够频繁(错过激活),请在设置 > 唤醒词 > 灵敏度中调整灵敏度滑块。
---
| 平台 | 快捷键 |
|---|---|
| macOS | Cmd + Shift + Space |
| Windows / Linux | Ctrl + Shift + Space |
键盘快捷键完全可自定义。前往设置 > 唤醒模式 > 键盘快捷键设置您首选的组合键。
---
Neotask 使用 Deepgram 进行实时语音转文本转录。您说出的话会以文本形式显示在对话中,延迟极低。
响应使用 ElevenLabs 自然文本转语音技术大声朗读。声音库包含 100 多种声音,涵盖多种风格。
在设置 > 声音中选择您首选的声音。您可以按以下条件筛选声音:
每个声音旁边有声音预览按钮,您可以在选择前试听样本。
您可以在语音会话期间附加文件。例如,说"我想分享一个文件"然后使用附件对话框,或在语音模式激活时将文件拖放到对话窗口中。AI 随后可以引用和处理附加的文件。
---
Neotask 理解广泛的自然语言命令。以下是按类别列出的常见示例。
| 示例命令 | |---| | "打开 YouTube" | | "前往 github.com" | | "打开 Neotask 文档" |
| 示例命令 | |---| | "在 Google 上搜索 Python 教程" | | "查看旧金山的天气" | | "在 Stack Overflow 上搜索 React hooks" |
| 示例命令 | |---| | "打开 Safari" | | "启动 Finder" | | "打开 Visual Studio Code" | | "启动终端" |
| 示例命令 | |---| | "向下滚动" | | "返回" | | "刷新页面" | | "滚动到顶部" |
| 示例命令 | |---| | "创建一个名为研究助手的代理" | | "启动代理" | | "停止代理" | | "显示代理状态" |
您可以在单条语音命令中组合多个指令:
| 示例命令 | |---| | "创建一个名为数据分析器的代理,启用语音,然后启动它" | | "打开 YouTube 并搜索机器学习教程" | | "停止代理并显示会话日志" |
---
当您的语音命令触发工具或操作时,Neotask 提供实时语音反馈让您知道正在发生什么:
可通过语音触发的工具包括:
当安全模式启用时(默认开启),敏感操作在执行前需要您明确的语音或点击批准。敏感操作包括:
AI 将描述操作并在继续前请求确认。
---
Neotask 包含一个专门的数学辅导模式,将语音教学与动画可视化相结合。
以下内置模板可用于即时动画课程:
| 模板 | 描述 | |---|---| | 单位圆 | 带有角度和坐标标签的单位圆视觉演示。 | | 勾股定理 | 带有三角形各边标记正方形的几何证明动画。 | | 泰勒级数 | 展示多项式近似收敛的逐步展开。 | | 二次公式 | 根的推导和图形解释。 | | 正弦/余弦波 | 带有振幅、周期和相位标注的动画波形图。 | | 导数 | 切线动画说明瞬时变化率。 | | 积分 | 带有黎曼和递进的曲线下面积动画。 | | 函数图形 | 绘制任何函数,带有标记的轴、截距和关键特征。 |
课程被分为多个部分。每个部分后,AI 暂停并询问您是否准备好继续、想要复习或有问题。这确保您按自己的节奏学习。
---
Neotask 支持 21 种语言的语音交互:
| 语言 | 代码 |
|---|---|
| 英语 | en |
| 西班牙语 | es |
| 法语 | fr |
| 德语 | de |
| 意大利语 | it |
| 葡萄牙语 | pt |
| 荷兰语 | nl |
| 俄语 | ru |
| 中文(普通话) | zh |
| 日语 | ja |
| 韩语 | ko |
| 阿拉伯语 | ar |
| 印地语 | hi |
| 土耳其语 | tr |
| 波兰语 | pl |
| 瑞典语 | sv |
| 丹麦语 | da |
| 挪威语 | no |
| 芬兰语 | fi |
| 捷克语 | cs |
| 罗马尼亚语 | ro |
您可以随时在设置 > 语言中更改语音语言。语音识别和文本转语音都将切换到所选语言。
---
语音提示控制 AI 助手在语音对话中的行为和响应方式。两者都可以在设置 > 语音提示中编辑。
系统提示定义语音助手的整体个性和行为。它设置语气、专业水平和交互风格。例如,您可以指示助手简洁且技术性,或友好且对话式。
响应提示自定义助手格式化和传达口头响应的方式。使用它来控制响应长度、详细程度、助手是否使用类比以及其他风格偏好。
两个提示都接受自由格式文本,并对所有后续语音交互立即生效。