Ucapan ke Teks
Model AI
Transkripsi audio secara lokal tanpa biaya API
- Sepenuhnya offline setelah unduhan model
- Output SRT, VTT, JSON, dan teks
- Terjemahkan bahasa apa pun ke Inggris
Yang Dapat Anda Lakukan
Transkripsi lokal — Konversi ucapan ke teks sepenuhnya offline, tidak perlu kunci API
Beberapa ukuran model — tiny (tercepat) → base → small → medium → large (paling akurat)
Format output — Teks biasa, subtitle SRT, keterangan VTT, atau JSON dengan cap waktu
Mode terjemahan — Terjemahkan audio bahasa apa pun langsung ke teks bahasa Inggris
Dukungan format luas — WAV, MP3, M4A, FLAC, OGG, dan lainnya
Caching model otomatis — Mengunduh model saat pertama kali digunakan, sepenuhnya offline setelah ituCoba Tanyakan
"Transkripsi podcast.mp3 ini menggunakan model medium"
"Konversi wawancara ini ke subtitle SRT"
"Transkripsi memo suara saya dan terjemahkan ke bahasa Inggris"
"Buat keterangan VTT untuk trek audio video ini"
"Gunakan model large untuk rekaman kuliah penting ini"
"Dapatkan output JSON dengan cap waktu tingkat kata"Tips Pro
tiny = cepat tetapi kasar, small = keseimbangan baik, medium = kualitas profesional, large = akurasi maksimum
Jalankan pertama kali mengunduh model (40MB–3GB tergantung ukuran), lalu sepenuhnya offline
Format SRT/VTT menyertakan cap waktu untuk sinkronisasi subtitle
Mode terjemahan menghasilkan bahasa Inggris terlepas dari bahasa input
Output JSON menyertakan data waktu tingkat segmen dan kata
Bekerja sepenuhnya offline setelah unduhan model awal — bagus untuk privasi