Whisper API

KI-Modelle

Schnelle Cloud-Transkription über die OpenAI Whisper API

Was Sie tun können

  • Cloud-Transkription — Schnelle Sprache-zu-Text-Umwandlung über die OpenAI-API (oft schneller als lokal bei großen Dateien)
  • Sprachspezifizierung — Erwartete Sprache für bessere Genauigkeit bei nicht-englischem Audio festlegen
  • Benutzerdefinierte Prompts — Sprechernamen, Fachbegriffe oder Jargon für verbesserte Genauigkeit bereitstellen
  • Formatoptionen — JSON (mit Zeitstempeln) oder Klartextausgabe
  • Automatische Dateiausgabe — Transkription neben der Originalaudiodatei speichern
  • Probieren Sie es aus

  • "Dieses interview.mp3 über die API transkribieren"
  • "Dieses Meeting auf Spanisch transkribieren"
  • "Mit Kontext transkribieren: Sprecher sind Dr. Schmidt und Prof. Müller, die über Quantencomputing diskutieren"
  • "JSON-Transkription mit Zeitstempeln erstellen"
  • "Diesen Earnings Call mit unternehmensspezifischen Terminologiehinweisen transkribieren"
  • Profi-Tipps

  • Erfordert die Umgebungsvariable OPENAI_API_KEY
  • Benutzerdefinierte Prompts verbessern die Genauigkeit für domänenspezifische Inhalte erheblich
  • Sprachhinweise helfen, wenn die Audioqualität schlecht oder akzentbehaftet ist
  • API ist typischerweise schneller als lokale Verarbeitung bei Dateien über 10 Minuten
  • Maximale Dateigröße beträgt 25 MB — für größere Dateien lokales Whisper verwenden
  • JSON-Format enthält Segment-Zeitstempel, die für zeitcodierte Zusammenfassungen nützlich sind