Whisper API
Modele AI
Szybka transkrypcja w chmurze przez OpenAI Whisper API
- Szybsza niż lokalna dla dużych plików
- Niestandardowe prompty poprawiają dokładność
- Wskazówki językowe dla audio spoza angielskiego
Co możesz zrobić
Transkrypcja w chmurze — Szybka zamiana mowy na tekst przez API OpenAI (często szybsza niż lokalna dla dużych plików)
Specyfikacja języka — Ustaw oczekiwany język dla lepszej dokładności na audio nie-angielskim
Niestandardowe podpowiedzi — Podawaj nazwy mówców, terminy techniczne lub żargon dla poprawionej dokładności
Opcje formatu — JSON (ze znacznikami czasu) lub wyjście zwykłego tekstu
Automatyczne wyjście pliku — Zapisuje transkrypcję obok oryginalnego pliku audioSpróbuj zapytać
"Transkrybuj ten interview.mp3 przez API"
"Transkrybuj to spotkanie po hiszpańsku"
"Transkrybuj z kontekstem: mówcy to dr Smith i prof. Jones omawiający informatykę kwantową"
"Pobierz transkrypcję JSON ze znacznikami czasu"
"Transkrybuj tę rozmowę o wynikach z podpowiedziami terminologii specyficznej dla firmy"Wskazówki Pro
Wymaga zmiennej środowiskowej OPENAI_API_KEY
Niestandardowe podpowiedzi dramatycznie poprawiają dokładność dla treści specyficznych dla domeny
Podpowiedzi językowe pomagają gdy jakość audio jest słaba lub wymowa regionalna
API jest zazwyczaj szybsze niż przetwarzanie lokalne dla plików powyżej 10 minut
Maksymalny rozmiar pliku to 25MB — używaj lokalnego Whisper dla większych plików
Format JSON zawiera znaczniki czasu segmentów przydatne do podsumowań z kodowaniem czasowym