Whisper API

Modèles IA

Transcription cloud rapide via l'API OpenAI Whisper

Ce que vous pouvez faire

Transcription cloud — Conversion rapide de la parole en texte via l'API OpenAI (souvent plus rapide que local pour les gros fichiers)

Spécification de langue — Définir la langue attendue pour une meilleure précision sur l'audio non-anglais

Prompts personnalisés — Fournir des noms de locuteurs, des termes techniques ou du jargon pour une précision améliorée

Options de format — JSON (avec horodatages) ou sortie texte brut

Sortie de fichier automatique — Sauvegarde la transcription à côté du fichier audio original

"Transcrire cette interview.mp3 via l'API"

"Transcrire cette réunion en espagnol"

"Transcrire avec le contexte : les locuteurs sont le Dr. Martin et le Prof. Dubois discutant d'informatique quantique"

"Obtenir une transcription JSON avec des horodatages"

"Transcrire cet appel sur les résultats avec des indications de terminologie spécifique à l'entreprise"

Nécessite la variable d'environnement OPENAI_API_KEY

Les prompts personnalisés améliorent considérablement la précision pour le contenu spécifique au domaine

Les indications de langue aident quand la qualité audio est mauvaise ou accentuée

L'API est généralement plus rapide que le traitement local pour les fichiers de plus de 10 minutes

Taille de fichier maximale de 25 Mo — utilisez Whisper local pour les fichiers plus volumineux

Le format JSON inclut des horodatages de segment utiles pour les résumés codés dans le temps