Tal-till-text
AI-modeller
Transkribera ljud lokalt utan API-kostnader
- Helt offline efter modellnedladdning
- SRT-, VTT-, JSON- och textutdata
- Översätt vilket språk som helst till engelska
Vad Du Kan Göra
Lokal transkription — Konvertera tal till text helt offline, ingen API-nyckel krävs
Flera modellstorlekar — tiny (snabbast) → base → small → medium → large (mest exakt)
Flerspråkigt — Stöder 99+ språk med automatisk språkdetektering
Anpassad timeout — Konfigurera tidsgränser för långa filer
SRT/VTT-output — Exportera undertexter för videorProva Att Fråga
"Transkribera den här MP3-filen lokalt"
"Konvertera det här mötesljudklippet till text"
"Transkribera på spanska med Whisper large-modellen"
"Generera SRT-undertexter från den här videons ljud"
"Använd Whisper tiny för snabb transkription av det här klippet"Proffstips
Kräver whisper.cpp eller openai-whisper installerat lokalt
Modellstorlekar: tiny (39M) är snabb men oprecis; large (1.5B) är exakt men långsam
Automatisk språkdetektering fungerar bra för de flesta språk
GPU-acceleration (CUDA/Metal) förbättrar hastigheten avsevärt
SRT-filer inkluderar tidsstämplar; VTT är ett webbkompatibelt undertextformat
Batch-bearbetning av flera filer stöds