Whisper API
Modèles IA
Transcription cloud rapide via l'API OpenAI Whisper
- Plus rapide que le local pour les grands fichiers
- Des prompts personnalisés améliorent la précision
- Indices de langue pour les audios non anglophones
Ce que vous pouvez faire
Transcription cloud — Conversion rapide de la parole en texte via l'API OpenAI (souvent plus rapide que local pour les gros fichiers)
Spécification de langue — Définir la langue attendue pour une meilleure précision sur l'audio non-anglais
Prompts personnalisés — Fournir des noms de locuteurs, des termes techniques ou du jargon pour une précision améliorée
Options de format — JSON (avec horodatages) ou sortie texte brut
Sortie de fichier automatique — Sauvegarde la transcription à côté du fichier audio originalEssayez de demander
"Transcrire cette interview.mp3 via l'API"
"Transcrire cette réunion en espagnol"
"Transcrire avec le contexte : les locuteurs sont le Dr. Martin et le Prof. Dubois discutant d'informatique quantique"
"Obtenir une transcription JSON avec des horodatages"
"Transcrire cet appel sur les résultats avec des indications de terminologie spécifique à l'entreprise"Conseils Pro
Nécessite la variable d'environnement OPENAI_API_KEY
Les prompts personnalisés améliorent considérablement la précision pour le contenu spécifique au domaine
Les indications de langue aident quand la qualité audio est mauvaise ou accentuée
L'API est généralement plus rapide que le traitement local pour les fichiers de plus de 10 minutes
Taille de fichier maximale de 25 Mo — utilisez Whisper local pour les fichiers plus volumineux
Le format JSON inclut des horodatages de segment utiles pour les résumés codés dans le temps