Whisper API

KI-Modelle

Schnelle Cloud-Transkription über die OpenAI Whisper API

Was Sie tun können

Cloud-Transkription — Schnelle Sprache-zu-Text-Umwandlung über die OpenAI-API (oft schneller als lokal bei großen Dateien)

Sprachspezifizierung — Erwartete Sprache für bessere Genauigkeit bei nicht-englischem Audio festlegen

Benutzerdefinierte Prompts — Sprechernamen, Fachbegriffe oder Jargon für verbesserte Genauigkeit bereitstellen

Formatoptionen — JSON (mit Zeitstempeln) oder Klartextausgabe

Automatische Dateiausgabe — Transkription neben der Originalaudiodatei speichern

"Dieses interview.mp3 über die API transkribieren"

"Dieses Meeting auf Spanisch transkribieren"

"Mit Kontext transkribieren: Sprecher sind Dr. Schmidt und Prof. Müller, die über Quantencomputing diskutieren"

"JSON-Transkription mit Zeitstempeln erstellen"

"Diesen Earnings Call mit unternehmensspezifischen Terminologiehinweisen transkribieren"

Erfordert die Umgebungsvariable OPENAI_API_KEY

Benutzerdefinierte Prompts verbessern die Genauigkeit für domänenspezifische Inhalte erheblich

Sprachhinweise helfen, wenn die Audioqualität schlecht oder akzentbehaftet ist

API ist typischerweise schneller als lokale Verarbeitung bei Dateien über 10 Minuten

Maximale Dateigröße beträgt 25 MB — für größere Dateien lokales Whisper verwenden

JSON-Format enthält Segment-Zeitstempel, die für zeitcodierte Zusammenfassungen nützlich sind