การจดจำเพลง

มีเดีย

แสดงภาพเสียงด้วยสเปกโตรแกรมและเครื่องมือวิเคราะห์

สิ่งที่คุณทำได้

  • การแสดงผล 9 ประเภท — Spectrogram, mel, chroma, HPSS (การแยกฮาร์มอนิก-เพอร์คัสชั่น), self-similarity, loudness, tempogram, MFCC, spectral flux
  • เลย์เอาต์หลายแผง — รวมการแสดงผลหลายรายการในภาพกริดเดียว
  • ตัดตามเวลา — วิเคราะห์ส่วนเฉพาะด้วยการควบคุมเวลาเริ่มต้นและระยะเวลา
  • จานสี — Classic, magma, inferno, viridis หรือ grayscale
  • การควบคุมขั้นสูง — ขนาด FFT window/hop ช่วงความถี่ ขนาดเอาต์พุต
  • อินพุตที่ยืดหยุ่น — ประมวลผลไฟล์เสียงโดยตรงหรือส่งผ่าน stdin
  • รูปแบบเอาต์พุต — PNG หรือ JPG พร้อมความละเอียดที่กำหนดได้
  • ลองถาม

  • "สร้าง spectrogram ของเพลงนี้ด้วยจานสี viridis"
  • "แสดงการแยกฮาร์มอนิกและเพอร์คัสชั่นสำหรับ 30 วินาทีแรก"
  • "สร้างกริด 4 แผง: spectrogram, chroma, loudness และ tempogram"
  • "วิเคราะห์ self-similarity matrix เพื่อหาโครงสร้าง verse/chorus"
  • "แสดง spectral flux สำหรับแทร็กกลองในสี magma"
  • "ส่งออก mel spectrogram ขนาด 1920x1080"
  • เคล็ดลับ

  • การแสดงผล Chroma เผยให้เห็น chord progressions และโครงสร้างฮาร์มอนิก
  • HPSS แยกองค์ประกอบฮาร์มอนิกและเพอร์คัสชั่น — เหมาะสำหรับการวิเคราะห์ mix
  • Self-similarity matrix เน้นส่วนที่ซ้ำโดยอัตโนมัติ (verse, chorus)
  • การวิเคราะห์หลายแผงรวมมุมมอง spectral, rhythmic และ harmonic
  • การกรองความถี่ให้ซูมเข้าไปที่ bass, mids หรือ highs โดยเฉพาะ
  • ถอดรหัส WAV/MP3 โดยตรง รูปแบบอื่นใช้ ffmpeg หากมี