การจดจำเพลง

มีเดีย

แสดงภาพเสียงด้วยสเปกโตรแกรมและเครื่องมือวิเคราะห์

สิ่งที่คุณทำได้

การแสดงผล 9 ประเภท — Spectrogram, mel, chroma, HPSS (การแยกฮาร์มอนิก-เพอร์คัสชั่น), self-similarity, loudness, tempogram, MFCC, spectral flux

เลย์เอาต์หลายแผง — รวมการแสดงผลหลายรายการในภาพกริดเดียว

ตัดตามเวลา — วิเคราะห์ส่วนเฉพาะด้วยการควบคุมเวลาเริ่มต้นและระยะเวลา

จานสี — Classic, magma, inferno, viridis หรือ grayscale

การควบคุมขั้นสูง — ขนาด FFT window/hop ช่วงความถี่ ขนาดเอาต์พุต

อินพุตที่ยืดหยุ่น — ประมวลผลไฟล์เสียงโดยตรงหรือส่งผ่าน stdin

รูปแบบเอาต์พุต — PNG หรือ JPG พร้อมความละเอียดที่กำหนดได้

"สร้าง spectrogram ของเพลงนี้ด้วยจานสี viridis"

"แสดงการแยกฮาร์มอนิกและเพอร์คัสชั่นสำหรับ 30 วินาทีแรก"

"สร้างกริด 4 แผง: spectrogram, chroma, loudness และ tempogram"

"วิเคราะห์ self-similarity matrix เพื่อหาโครงสร้าง verse/chorus"

"แสดง spectral flux สำหรับแทร็กกลองในสี magma"

"ส่งออก mel spectrogram ขนาด 1920x1080"

การแสดงผล Chroma เผยให้เห็น chord progressions และโครงสร้างฮาร์มอนิก

HPSS แยกองค์ประกอบฮาร์มอนิกและเพอร์คัสชั่น — เหมาะสำหรับการวิเคราะห์ mix

Self-similarity matrix เน้นส่วนที่ซ้ำโดยอัตโนมัติ (verse, chorus)

การวิเคราะห์หลายแผงรวมมุมมอง spectral, rhythmic และ harmonic

การกรองความถี่ให้ซูมเข้าไปที่ bass, mids หรือ highs โดยเฉพาะ

ถอดรหัส WAV/MP3 โดยตรง รูปแบบอื่นใช้ ffmpeg หากมี