Whisper API

Modèles IA

Transcription cloud rapide via l'API OpenAI Whisper

Ce que vous pouvez faire

  • Transcription cloud — Conversion rapide de la parole en texte via l'API OpenAI (souvent plus rapide que local pour les gros fichiers)
  • Spécification de langue — Définir la langue attendue pour une meilleure précision sur l'audio non-anglais
  • Prompts personnalisés — Fournir des noms de locuteurs, des termes techniques ou du jargon pour une précision améliorée
  • Options de format — JSON (avec horodatages) ou sortie texte brut
  • Sortie de fichier automatique — Sauvegarde la transcription à côté du fichier audio original
  • Essayez de demander

  • "Transcrire cette interview.mp3 via l'API"
  • "Transcrire cette réunion en espagnol"
  • "Transcrire avec le contexte : les locuteurs sont le Dr. Martin et le Prof. Dubois discutant d'informatique quantique"
  • "Obtenir une transcription JSON avec des horodatages"
  • "Transcrire cet appel sur les résultats avec des indications de terminologie spécifique à l'entreprise"
  • Conseils Pro

  • Nécessite la variable d'environnement OPENAI_API_KEY
  • Les prompts personnalisés améliorent considérablement la précision pour le contenu spécifique au domaine
  • Les indications de langue aident quand la qualité audio est mauvaise ou accentuée
  • L'API est généralement plus rapide que le traitement local pour les fichiers de plus de 10 minutes
  • Taille de fichier maximale de 25 Mo — utilisez Whisper local pour les fichiers plus volumineux
  • Le format JSON inclut des horodatages de segment utiles pour les résumés codés dans le temps