Whisper API
KI-Modelle
Schnelle Cloud-Transkription über die OpenAI Whisper API
- Schneller als lokal für große Dateien
- Benutzerdefinierte Prompts verbessern die Genauigkeit
- Sprachhinweise für nicht-englisches Audio
Was Sie tun können
Cloud-Transkription — Schnelle Sprache-zu-Text-Umwandlung über die OpenAI-API (oft schneller als lokal bei großen Dateien)
Sprachspezifizierung — Erwartete Sprache für bessere Genauigkeit bei nicht-englischem Audio festlegen
Benutzerdefinierte Prompts — Sprechernamen, Fachbegriffe oder Jargon für verbesserte Genauigkeit bereitstellen
Formatoptionen — JSON (mit Zeitstempeln) oder Klartextausgabe
Automatische Dateiausgabe — Transkription neben der Originalaudiodatei speichernProbieren Sie es aus
"Dieses interview.mp3 über die API transkribieren"
"Dieses Meeting auf Spanisch transkribieren"
"Mit Kontext transkribieren: Sprecher sind Dr. Schmidt und Prof. Müller, die über Quantencomputing diskutieren"
"JSON-Transkription mit Zeitstempeln erstellen"
"Diesen Earnings Call mit unternehmensspezifischen Terminologiehinweisen transkribieren"Profi-Tipps
Erfordert die Umgebungsvariable OPENAI_API_KEY
Benutzerdefinierte Prompts verbessern die Genauigkeit für domänenspezifische Inhalte erheblich
Sprachhinweise helfen, wenn die Audioqualität schlecht oder akzentbehaftet ist
API ist typischerweise schneller als lokale Verarbeitung bei Dateien über 10 Minuten
Maximale Dateigröße beträgt 25 MB — für größere Dateien lokales Whisper verwenden
JSON-Format enthält Segment-Zeitstempel, die für zeitcodierte Zusammenfassungen nützlich sind