Tal-till-text

AI-modeller

Transkribera ljud lokalt utan API-kostnader

Vad Du Kan Göra

  • Lokal transkription — Konvertera tal till text helt offline, ingen API-nyckel krävs
  • Flera modellstorlekar — tiny (snabbast) → base → small → medium → large (mest exakt)
  • Flerspråkigt — Stöder 99+ språk med automatisk språkdetektering
  • Anpassad timeout — Konfigurera tidsgränser för långa filer
  • SRT/VTT-output — Exportera undertexter för videor
  • Prova Att Fråga

  • "Transkribera den här MP3-filen lokalt"
  • "Konvertera det här mötesljudklippet till text"
  • "Transkribera på spanska med Whisper large-modellen"
  • "Generera SRT-undertexter från den här videons ljud"
  • "Använd Whisper tiny för snabb transkription av det här klippet"
  • Proffstips

  • Kräver whisper.cpp eller openai-whisper installerat lokalt
  • Modellstorlekar: tiny (39M) är snabb men oprecis; large (1.5B) är exakt men långsam
  • Automatisk språkdetektering fungerar bra för de flesta språk
  • GPU-acceleration (CUDA/Metal) förbättrar hastigheten avsevärt
  • SRT-filer inkluderar tidsstämplar; VTT är ett webbkompatibelt undertextformat
  • Batch-bearbetning av flera filer stöds