Whisper API

AI 模型

透過 OpenAI Whisper API 進行快速雲端轉錄

大型檔案比本機轉錄更快
自訂提示詞提升準確率
語言提示優化非英語音訊

你可以做什麼

雲端轉錄 — 透過 OpenAI API 快速語音轉文字（對於大檔案通常比本地更快）

語言指定 — 設定預期的語言以提高非英語音訊的準確性

自訂提示詞 — 提供說話者姓名、技術術語或行話以提高準確性

格式選項 — JSON（帶時間戳記）或純文字輸出

自動檔案輸出 — 將轉錄文字儲存在原始音訊檔案旁邊

試著這樣問

「透過 API 轉錄這個 interview.mp3」

「轉錄這段中文會議」

「帶上下文轉錄：說話者是討論量子運算的 Smith 博士和 Jones 教授」

「取得帶時間戳記的 JSON 轉錄」

「轉錄這個財報電話，附帶公司特定術語提示」

專業技巧

需要 OPENAI_API_KEY 環境變數

自訂提示詞可大幅提高領域特定內容的準確性

語言提示在音訊品質差或有口音時很有幫助

API 通常比本地處理超過 10 分鐘的檔案更快

最大檔案大小為 25MB——對於更大檔案使用本地 Whisper

JSON 格式包含可用於時間編碼摘要的片段時間戳記