Ucapan ke Teks

Model AI

Transkripsi audio secara lokal tanpa biaya API

Yang Dapat Anda Lakukan

  • Transkripsi lokal — Konversi ucapan ke teks sepenuhnya offline, tidak perlu kunci API
  • Beberapa ukuran model — tiny (tercepat) → base → small → medium → large (paling akurat)
  • Format output — Teks biasa, subtitle SRT, keterangan VTT, atau JSON dengan cap waktu
  • Mode terjemahan — Terjemahkan audio bahasa apa pun langsung ke teks bahasa Inggris
  • Dukungan format luas — WAV, MP3, M4A, FLAC, OGG, dan lainnya
  • Caching model otomatis — Mengunduh model saat pertama kali digunakan, sepenuhnya offline setelah itu
  • Coba Tanyakan

  • "Transkripsi podcast.mp3 ini menggunakan model medium"
  • "Konversi wawancara ini ke subtitle SRT"
  • "Transkripsi memo suara saya dan terjemahkan ke bahasa Inggris"
  • "Buat keterangan VTT untuk trek audio video ini"
  • "Gunakan model large untuk rekaman kuliah penting ini"
  • "Dapatkan output JSON dengan cap waktu tingkat kata"
  • Tips Pro

  • tiny = cepat tetapi kasar, small = keseimbangan baik, medium = kualitas profesional, large = akurasi maksimum
  • Jalankan pertama kali mengunduh model (40MB–3GB tergantung ukuran), lalu sepenuhnya offline
  • Format SRT/VTT menyertakan cap waktu untuk sinkronisasi subtitle
  • Mode terjemahan menghasilkan bahasa Inggris terlepas dari bahasa input
  • Output JSON menyertakan data waktu tingkat segmen dan kata
  • Bekerja sepenuhnya offline setelah unduhan model awal — bagus untuk privasi