Whisper API

AI 模型

通过 OpenAI Whisper API 进行快速云端转录

大文件比本地转录更快
自定义提示词提升准确率
语言提示优化非英语音频

你可以做什么

云端转录 — 通过 OpenAI API 快速语音转文字（对于大文件通常比本地更快）

语言指定 — 设置期望的语言以提高非英语音频的准确性

自定义提示词 — 提供说话人姓名、技术术语或行话以提高准确性

格式选项 — JSON（带时间戳）或纯文本输出

自动文件输出 — 将转录文本保存在原始音频文件旁边

试着这样问

「通过 API 转录这个 interview.mp3」

「转录这段中文会议」

「带上下文转录：说话人是讨论量子计算的 Smith 博士和 Jones 教授」

「获取带时间戳的 JSON 转录」

「转录这个财报电话，附带公司特定术语提示」

专业技巧

需要 OPENAI_API_KEY 环境变量

自定义提示词可大幅提高领域特定内容的准确性

语言提示在音频质量差或有口音时很有帮助

API 通常比本地处理超过 10 分钟的文件更快

最大文件大小为 25MB——对于更大文件使用本地 Whisper

JSON 格式包含可用于时间编码摘要的片段时间戳