PHÂN LOẠI ÂM THANH NHẠC CỤ DỰA TRÊN ĐẶC TRƯNG PHỔ VÀ MẠNG NƠ-RON TÍCH CHẬP

  • Phạm Thị Thu Trang
  • Dương Tấn Nghĩa

Abstract

Trong những năm gần đây, bài toán phân loại âm thanh đã thu hút sự quan tâm đáng kể nhờ tiềm năng ứng dụng rộng rãi trong lĩnh vực kỹ thuật và việc trích xuất đặc trưng âm thanh đóng vai trò then chốt trong quá trình phân loại này. Bài báo này trình bày hệ thống phân loại âm thanh nhạc cụ sử dụng kết hợp các phương pháp trích chọn đặc trưng âm thanh phổ biến và các mô hình học sâu. Tín hiệu âm thanh được chuyển đổi thành các biểu diễn phổ thời-tần số như Short-Time Fourier Transform (STFT), Mel-spectrogram, hệ số MFCC và MFCC kèm hệ số delta. Các đặc trưng này được đưa vào ba mô hình CNN: SimpleCNN, MobileNetV2 và VGG16. Thí nghiệm trên dữ liệu Solo MUSIC cho thấy Melspectrogram và MFCC+delta cho kết quả chính xác và F1-score cao nhất. MobileNetV2 đáp ứng tốt yêu cầu tính toán nhẹ nhưng vẫn giữ được hiệu quả.

điểm /   đánh giá
Published
2025-10-10