Whisper API

AI 模型

通过 OpenAI Whisper API 进行快速云端转录

你可以做什么

  • 云端转录 — 通过 OpenAI API 快速语音转文字(对于大文件通常比本地更快)
  • 语言指定 — 设置期望的语言以提高非英语音频的准确性
  • 自定义提示词 — 提供说话人姓名、技术术语或行话以提高准确性
  • 格式选项 — JSON(带时间戳)或纯文本输出
  • 自动文件输出 — 将转录文本保存在原始音频文件旁边
  • 试着这样问

  • 「通过 API 转录这个 interview.mp3」
  • 「转录这段中文会议」
  • 「带上下文转录:说话人是讨论量子计算的 Smith 博士和 Jones 教授」
  • 「获取带时间戳的 JSON 转录」
  • 「转录这个财报电话,附带公司特定术语提示」
  • 专业技巧

  • 需要 OPENAI_API_KEY 环境变量
  • 自定义提示词可大幅提高领域特定内容的准确性
  • 语言提示在音频质量差或有口音时很有帮助
  • API 通常比本地处理超过 10 分钟的文件更快
  • 最大文件大小为 25MB——对于更大文件使用本地 Whisper
  • JSON 格式包含可用于时间编码摘要的片段时间戳