Whisper API

Modele AI

Szybka transkrypcja w chmurze przez OpenAI Whisper API

Co możesz zrobić

  • Transkrypcja w chmurze — Szybka zamiana mowy na tekst przez API OpenAI (często szybsza niż lokalna dla dużych plików)
  • Specyfikacja języka — Ustaw oczekiwany język dla lepszej dokładności na audio nie-angielskim
  • Niestandardowe podpowiedzi — Podawaj nazwy mówców, terminy techniczne lub żargon dla poprawionej dokładności
  • Opcje formatu — JSON (ze znacznikami czasu) lub wyjście zwykłego tekstu
  • Automatyczne wyjście pliku — Zapisuje transkrypcję obok oryginalnego pliku audio
  • Spróbuj zapytać

  • "Transkrybuj ten interview.mp3 przez API"
  • "Transkrybuj to spotkanie po hiszpańsku"
  • "Transkrybuj z kontekstem: mówcy to dr Smith i prof. Jones omawiający informatykę kwantową"
  • "Pobierz transkrypcję JSON ze znacznikami czasu"
  • "Transkrybuj tę rozmowę o wynikach z podpowiedziami terminologii specyficznej dla firmy"
  • Wskazówki Pro

  • Wymaga zmiennej środowiskowej OPENAI_API_KEY
  • Niestandardowe podpowiedzi dramatycznie poprawiają dokładność dla treści specyficznych dla domeny
  • Podpowiedzi językowe pomagają gdy jakość audio jest słaba lub wymowa regionalna
  • API jest zazwyczaj szybsze niż przetwarzanie lokalne dla plików powyżej 10 minut
  • Maksymalny rozmiar pliku to 25MB — używaj lokalnego Whisper dla większych plików
  • Format JSON zawiera znaczniki czasu segmentów przydatne do podsumowań z kodowaniem czasowym