การจดจำเพลง
มีเดีย
แสดงภาพเสียงด้วยสเปกโตรแกรมและเครื่องมือวิเคราะห์
- ประเภทการแสดงภาพ 9 แบบ
- เลย์เอาต์กริดหลายแผงสำหรับเปรียบเทียบ
- การตัดตามเวลาและตัวเลือกจานสี
สิ่งที่คุณทำได้
การแสดงผล 9 ประเภท — Spectrogram, mel, chroma, HPSS (การแยกฮาร์มอนิก-เพอร์คัสชั่น), self-similarity, loudness, tempogram, MFCC, spectral flux
เลย์เอาต์หลายแผง — รวมการแสดงผลหลายรายการในภาพกริดเดียว
ตัดตามเวลา — วิเคราะห์ส่วนเฉพาะด้วยการควบคุมเวลาเริ่มต้นและระยะเวลา
จานสี — Classic, magma, inferno, viridis หรือ grayscale
การควบคุมขั้นสูง — ขนาด FFT window/hop ช่วงความถี่ ขนาดเอาต์พุต
อินพุตที่ยืดหยุ่น — ประมวลผลไฟล์เสียงโดยตรงหรือส่งผ่าน stdin
รูปแบบเอาต์พุต — PNG หรือ JPG พร้อมความละเอียดที่กำหนดได้ลองถาม
"สร้าง spectrogram ของเพลงนี้ด้วยจานสี viridis"
"แสดงการแยกฮาร์มอนิกและเพอร์คัสชั่นสำหรับ 30 วินาทีแรก"
"สร้างกริด 4 แผง: spectrogram, chroma, loudness และ tempogram"
"วิเคราะห์ self-similarity matrix เพื่อหาโครงสร้าง verse/chorus"
"แสดง spectral flux สำหรับแทร็กกลองในสี magma"
"ส่งออก mel spectrogram ขนาด 1920x1080"เคล็ดลับ
การแสดงผล Chroma เผยให้เห็น chord progressions และโครงสร้างฮาร์มอนิก
HPSS แยกองค์ประกอบฮาร์มอนิกและเพอร์คัสชั่น — เหมาะสำหรับการวิเคราะห์ mix
Self-similarity matrix เน้นส่วนที่ซ้ำโดยอัตโนมัติ (verse, chorus)
การวิเคราะห์หลายแผงรวมมุมมอง spectral, rhythmic และ harmonic
การกรองความถี่ให้ซูมเข้าไปที่ bass, mids หรือ highs โดยเฉพาะ
ถอดรหัส WAV/MP3 โดยตรง รูปแบบอื่นใช้ ffmpeg หากมี