Định danh tự động một số làn điệu dân ca Việt Nam
(Thông tin không được cung cấp trong văn bản)
Luận án tập trung vào việc định danh tự động các làn điệu dân ca Việt Nam, đặc biệt là Chèo và Quan họ, nhằm bảo tồn và phát huy giá trị của di sản văn hóa này trong bối cảnh số hóa âm nhạc bùng nổ. Nghiên cứu giải quyết thách thức trong việc quản lý cơ sở dữ liệu nhạc số khổng lồ và sự phức tạp của việc phân loại thể loại âm nhạc. Mục tiêu chính là phát triển và đề xuất các mô hình hiệu quả sử dụng xử lý tín hiệu, học máy và học sâu cho nhiệm vụ này, đồng thời đánh giá khả năng tổng quát hóa của mô hình trên các bộ dữ liệu âm nhạc quốc tế và Việt Nam khác.
Để đạt được mục tiêu, luận án đã xây dựng bộ dữ liệu DANCA bao gồm 1000 file (mỗi loại 500 file) từ 25 làn điệu Chèo và 25 làn điệu Quan họ phổ biến. Các phương pháp nghiên cứu bao gồm việc trích xuất các đặc trưng từ tín hiệu âm nhạc như MFCC, F0, Tempo, Intensity, Mel spectrogram, pitch, tonnetz, spectral contrast và chroma. Cả các thuật toán học máy truyền thống (SMO, GMM, MultiLayer Perceptron, MultiClass Classifier) và các mô hình học sâu (CNN, LSTM, CRNN, RAN, CSN, DenseNet) đều được thử nghiệm. Luận án cũng nghiên cứu các phương pháp tăng cường dữ liệu như chia đôi file, tạo tiếng vọng, cộng nhiễu trắng và thay đổi cao độ để cải thiện hiệu suất.
Kết quả cho thấy, các mô hình học sâu, đặc biệt là CNN, CRNN2, DenseNet121 và CSN, đạt độ chính xác cao vượt trội trong cả phân lớp và định danh các làn điệu dân ca Chèo và Quan họ (ví dụ, CRNN2 đạt 99,66% trong phân lớp Chèo/Quan họ, CNN đạt 99,50% cho định danh Quan họ). Các phương pháp tăng cường dữ liệu cũng chứng minh hiệu quả tích cực. Nghiên cứu cũng mở rộng đánh giá trên các bộ dữ liệu GTZAN, FMA_SMALL và Zalo AI Challenge 2018, cho thấy mô hình đề xuất đạt độ chính xác cao, vượt trội so với nhiều nghiên cứu khác. Luận án đóng góp cả về mặt lý thuyết và thực tiễn trong việc quản lý, bảo tồn và phát triển âm nhạc dân ca Việt Nam.