Whisper API
AI 模型
透過 OpenAI Whisper API 進行快速雲端轉錄
- 大型檔案比本機轉錄更快
- 自訂提示詞提升準確率
- 語言提示優化非英語音訊
你可以做什麼
雲端轉錄 — 透過 OpenAI API 快速語音轉文字(對於大檔案通常比本地更快)
語言指定 — 設定預期的語言以提高非英語音訊的準確性
自訂提示詞 — 提供說話者姓名、技術術語或行話以提高準確性
格式選項 — JSON(帶時間戳記)或純文字輸出
自動檔案輸出 — 將轉錄文字儲存在原始音訊檔案旁邊試著這樣問
「透過 API 轉錄這個 interview.mp3」
「轉錄這段中文會議」
「帶上下文轉錄:說話者是討論量子運算的 Smith 博士和 Jones 教授」
「取得帶時間戳記的 JSON 轉錄」
「轉錄這個財報電話,附帶公司特定術語提示」專業技巧
需要 OPENAI_API_KEY 環境變數
自訂提示詞可大幅提高領域特定內容的準確性
語言提示在音訊品質差或有口音時很有幫助
API 通常比本地處理超過 10 分鐘的檔案更快
最大檔案大小為 25MB——對於更大檔案使用本地 Whisper
JSON 格式包含可用於時間編碼摘要的片段時間戳記