Whisper API
AI 模型
通过 OpenAI Whisper API 进行快速云端转录
- 大文件比本地转录更快
- 自定义提示词提升准确率
- 语言提示优化非英语音频
你可以做什么
云端转录 — 通过 OpenAI API 快速语音转文字(对于大文件通常比本地更快)
语言指定 — 设置期望的语言以提高非英语音频的准确性
自定义提示词 — 提供说话人姓名、技术术语或行话以提高准确性
格式选项 — JSON(带时间戳)或纯文本输出
自动文件输出 — 将转录文本保存在原始音频文件旁边试着这样问
「通过 API 转录这个 interview.mp3」
「转录这段中文会议」
「带上下文转录:说话人是讨论量子计算的 Smith 博士和 Jones 教授」
「获取带时间戳的 JSON 转录」
「转录这个财报电话,附带公司特定术语提示」专业技巧
需要 OPENAI_API_KEY 环境变量
自定义提示词可大幅提高领域特定内容的准确性
语言提示在音频质量差或有口音时很有帮助
API 通常比本地处理超过 10 分钟的文件更快
最大文件大小为 25MB——对于更大文件使用本地 Whisper
JSON 格式包含可用于时间编码摘要的片段时间戳