Whisper API

Modele AI

Szybka transkrypcja w chmurze przez OpenAI Whisper API

Co możesz zrobić

Transkrypcja w chmurze — Szybka zamiana mowy na tekst przez API OpenAI (często szybsza niż lokalna dla dużych plików)

Specyfikacja języka — Ustaw oczekiwany język dla lepszej dokładności na audio nie-angielskim

Niestandardowe podpowiedzi — Podawaj nazwy mówców, terminy techniczne lub żargon dla poprawionej dokładności

Opcje formatu — JSON (ze znacznikami czasu) lub wyjście zwykłego tekstu

Automatyczne wyjście pliku — Zapisuje transkrypcję obok oryginalnego pliku audio

"Transkrybuj ten interview.mp3 przez API"

"Transkrybuj to spotkanie po hiszpańsku"

"Transkrybuj z kontekstem: mówcy to dr Smith i prof. Jones omawiający informatykę kwantową"

"Pobierz transkrypcję JSON ze znacznikami czasu"

"Transkrybuj tę rozmowę o wynikach z podpowiedziami terminologii specyficznej dla firmy"

Wymaga zmiennej środowiskowej OPENAI_API_KEY

Niestandardowe podpowiedzi dramatycznie poprawiają dokładność dla treści specyficznych dla domeny

Podpowiedzi językowe pomagają gdy jakość audio jest słaba lub wymowa regionalna

API jest zazwyczaj szybsze niż przetwarzanie lokalne dla plików powyżej 10 minut

Maksymalny rozmiar pliku to 25MB — używaj lokalnego Whisper dla większych plików

Format JSON zawiera znaczniki czasu segmentów przydatne do podsumowań z kodowaniem czasowym