Open Claw 通过多个系统支持语音交互:唤醒词检测、连续语音对话(对话模式)和文字转语音的语音响应。
Swabble 是一个原生 macOS 守护进程,使用 Apple 的 Speech.framework 提供始终在线的设备端语音唤醒词检测。
特性:
clawd(别名 claude)工作原理:
在 iOS 和 Android 伴侣应用上,语音唤醒由原生处理:
对话模式支持连续语音对话 -- 自然地说话并听到代理回应。
对话模式在四种状态之间转换:
| 状态 | 描述 | |-------|-------------| | Idle | 未主动监听 | | Listening | 正在采集和转录您的语音 | | Thinking | 代理正在处理您的请求 | | Speaking | 正在播放代理的语音回复 |
| 提供商 | 描述 | |----------|-------------| | ElevenLabs | 高质量语音合成,支持声音选择 | | OpenAI TTS | OpenAI 的文字转语音 API |
代理可以检测和执行多步语音命令:
> "Create a calendar event for tomorrow at 3 PM, then send an email to the team about it, and post a reminder in Slack"
这会自动解析为一系列命令,每个按顺序执行,结果流向下一步。
在语音对话期间,代理可以像在文字对话中一样执行工具 -- 浏览网页、运行代码、管理文件、控制设备等。结果被总结并以语音播放。
语音模式包含验证,确保代理的声明与实际工具结果一致。如果代理说"我已发送邮件"但邮件工具失败了,系统会捕获这一差异并报告实际结果。
Voice Call 插件添加 SIP 电话支持:
语音服务可能有使用配额: