Whisper API

AI 模型

透過 OpenAI Whisper API 進行快速雲端轉錄

你可以做什麼

  • 雲端轉錄 — 透過 OpenAI API 快速語音轉文字(對於大檔案通常比本地更快)
  • 語言指定 — 設定預期的語言以提高非英語音訊的準確性
  • 自訂提示詞 — 提供說話者姓名、技術術語或行話以提高準確性
  • 格式選項 — JSON(帶時間戳記)或純文字輸出
  • 自動檔案輸出 — 將轉錄文字儲存在原始音訊檔案旁邊
  • 試著這樣問

  • 「透過 API 轉錄這個 interview.mp3」
  • 「轉錄這段中文會議」
  • 「帶上下文轉錄:說話者是討論量子運算的 Smith 博士和 Jones 教授」
  • 「取得帶時間戳記的 JSON 轉錄」
  • 「轉錄這個財報電話,附帶公司特定術語提示」
  • 專業技巧

  • 需要 OPENAI_API_KEY 環境變數
  • 自訂提示詞可大幅提高領域特定內容的準確性
  • 語言提示在音訊品質差或有口音時很有幫助
  • API 通常比本地處理超過 10 分鐘的檔案更快
  • 最大檔案大小為 25MB——對於更大檔案使用本地 Whisper
  • JSON 格式包含可用於時間編碼摘要的片段時間戳記