Whisper API

Модели ИИ

Быстрая облачная транскрипция через API OpenAI Whisper

Что вы можете делать

  • Облачная транскрипция — Быстрое преобразование речи в текст через API OpenAI (часто быстрее локального для больших файлов)
  • Указание языка — Устанавливать ожидаемый язык для лучшей точности для не-английского аудио
  • Пользовательские промпты — Предоставлять имена докладчиков, технические термины или жаргон для улучшения точности
  • Форматы — JSON (с временными метками) или вывод в обычном тексте
  • Автоматический вывод файла — Сохраняет транскрипцию рядом с исходным аудиофайлом
  • Попробуйте спросить

  • «Транскрибируй этот interview.mp3 через API»
  • «Транскрибируй эту встречу на испанском»
  • «Транскрибируй с контекстом: докладчики — д-р Смит и проф. Джонс, обсуждающие квантовые вычисления»
  • «Получи JSON-транскрипцию с временными метками»
  • «Транскрибируй этот звонок по результатам квартала с подсказками по специфической терминологии»
  • Профессиональные советы

  • Требует переменную окружения OPENAI_API_KEY
  • Пользовательские промпты значительно улучшают точность для предметного контента
  • Языковые подсказки помогают при плохом качестве аудио или акцентах
  • API обычно быстрее локальной обработки для файлов длиннее 10 минут
  • Максимальный размер файла 25МБ — используйте локальный Whisper для больших файлов
  • Формат JSON включает временные метки сегментов для резюме с временным кодом