Whisper API
Модели ИИ
Быстрая облачная транскрипция через API OpenAI Whisper
- Быстрее локального для больших файлов
- Пользовательские промпты улучшают точность
- Подсказки языка для не-английского аудио
Что вы можете делать
Облачная транскрипция — Быстрое преобразование речи в текст через API OpenAI (часто быстрее локального для больших файлов)
Указание языка — Устанавливать ожидаемый язык для лучшей точности для не-английского аудио
Пользовательские промпты — Предоставлять имена докладчиков, технические термины или жаргон для улучшения точности
Форматы — JSON (с временными метками) или вывод в обычном тексте
Автоматический вывод файла — Сохраняет транскрипцию рядом с исходным аудиофайломПопробуйте спросить
«Транскрибируй этот interview.mp3 через API»
«Транскрибируй эту встречу на испанском»
«Транскрибируй с контекстом: докладчики — д-р Смит и проф. Джонс, обсуждающие квантовые вычисления»
«Получи JSON-транскрипцию с временными метками»
«Транскрибируй этот звонок по результатам квартала с подсказками по специфической терминологии»Профессиональные советы
Требует переменную окружения OPENAI_API_KEY
Пользовательские промпты значительно улучшают точность для предметного контента
Языковые подсказки помогают при плохом качестве аудио или акцентах
API обычно быстрее локальной обработки для файлов длиннее 10 минут
Максимальный размер файла 25МБ — используйте локальный Whisper для больших файлов
Формат JSON включает временные метки сегментов для резюме с временным кодом