Ucapan ke Teks

Model AI

Transkripsi audio secara lokal tanpa biaya API

Yang Dapat Anda Lakukan

Transkripsi lokal — Konversi ucapan ke teks sepenuhnya offline, tidak perlu kunci API

Beberapa ukuran model — tiny (tercepat) → base → small → medium → large (paling akurat)

Format output — Teks biasa, subtitle SRT, keterangan VTT, atau JSON dengan cap waktu

Mode terjemahan — Terjemahkan audio bahasa apa pun langsung ke teks bahasa Inggris

Dukungan format luas — WAV, MP3, M4A, FLAC, OGG, dan lainnya

Caching model otomatis — Mengunduh model saat pertama kali digunakan, sepenuhnya offline setelah itu

"Transkripsi podcast.mp3 ini menggunakan model medium"

"Konversi wawancara ini ke subtitle SRT"

"Transkripsi memo suara saya dan terjemahkan ke bahasa Inggris"

"Buat keterangan VTT untuk trek audio video ini"

"Gunakan model large untuk rekaman kuliah penting ini"

"Dapatkan output JSON dengan cap waktu tingkat kata"

tiny = cepat tetapi kasar, small = keseimbangan baik, medium = kualitas profesional, large = akurasi maksimum

Jalankan pertama kali mengunduh model (40MB–3GB tergantung ukuran), lalu sepenuhnya offline

Format SRT/VTT menyertakan cap waktu untuk sinkronisasi subtitle

Mode terjemahan menghasilkan bahasa Inggris terlepas dari bahasa input

Output JSON menyertakan data waktu tingkat segmen dan kata

Bekerja sepenuhnya offline setelah unduhan model awal — bagus untuk privasi