Open Claw 透過多個系統支援語音互動:喚醒詞偵測、連續語音對話(通話模式),以及用於朗讀回應的文字轉語音。
Swabble 是一個原生 macOS daemon,使用 Apple 的 Speech.framework 提供始終開啟的裝置端語音喚醒詞偵測。
功能:
clawd(別名 claude)工作原理:
在 iOS 和 Android 伴侶應用程式上,語音喚醒由原生處理:
通話模式支援連續語音對話——自然說話並聆聽代理程式回應。
通話模式在四個狀態之間轉換:
| 狀態 | 說明 | |------|------| | Idle | 未主動監聽 | | Listening | 擷取並轉錄您的語音 | | Thinking | 代理程式正在處理您的請求 | | Speaking | 代理程式的回應正在朗讀 |
| 提供者 | 說明 | |--------|------| | ElevenLabs | 高品質語音合成,支援聲音選擇 | | OpenAI TTS | OpenAI 的文字轉語音 API |
代理程式可以偵測並執行多步驟語音命令:
> 「Create a calendar event for tomorrow at 3 PM, then send an email to the team about it, and post a reminder in Slack」
這自動解析為一系列命令,每個命令按順序執行,結果流向下一步。
在語音對話期間,代理程式可以像在文字對話中一樣執行工具——瀏覽網頁、執行程式碼、管理檔案、控制裝置等。結果被摘要並朗讀回來。
語音模式包括驗證,確保代理程式的聲明與實際工具結果相符。如果代理程式說「我已傳送電子郵件」但電子郵件工具失敗,系統會捕捉到不一致並報告實際結果。
語音通話外掛添加 SIP 電話支援:
語音服務可能有使用量配額: