Tal-till-text

AI-modeller

Transkribera ljud lokalt utan API-kostnader

Vad Du Kan Göra

Lokal transkription — Konvertera tal till text helt offline, ingen API-nyckel krävs

Flera modellstorlekar — tiny (snabbast) → base → small → medium → large (mest exakt)

Flerspråkigt — Stöder 99+ språk med automatisk språkdetektering

Anpassad timeout — Konfigurera tidsgränser för långa filer

SRT/VTT-output — Exportera undertexter för videor

"Transkribera den här MP3-filen lokalt"

"Konvertera det här mötesljudklippet till text"

"Transkribera på spanska med Whisper large-modellen"

"Generera SRT-undertexter från den här videons ljud"

"Använd Whisper tiny för snabb transkription av det här klippet"

Kräver whisper.cpp eller openai-whisper installerat lokalt

Modellstorlekar: tiny (39M) är snabb men oprecis; large (1.5B) är exakt men långsam

Automatisk språkdetektering fungerar bra för de flesta språk

GPU-acceleration (CUDA/Metal) förbättrar hastigheten avsevärt

SRT-filer inkluderar tidsstämplar; VTT är ett webbkompatibelt undertextformat

Batch-bearbetning av flera filer stöds