NGHIÊN CỨU CÁC PHƯƠNG PHÁP XÁC ĐỊNH TẦN SỐ CƠ BẢN ỨNG DỤNG CHO TỔNG HỢP THANH ĐIỆU TIẾNG VIỆT
Cơ sở toán học cho tin học
Luận án tập trung nghiên cứu các phương pháp xác định tần số cơ bản (F0) và cách điệu hóa thanh điệu, ứng dụng vào tổng hợp thanh điệu tiếng Việt, nhằm nâng cao chất lượng và độ tự nhiên của tiếng nói tổng hợp trong bối cảnh công nghệ số. Tiếng Việt với hệ thống thanh điệu phức tạp đặt ra nhiều thách thức trong tái tạo ngữ điệu chính xác.
Mục tiêu chính của luận án là xác định các điểm đánh dấu pitch (PM) và ước lượng F0, đồng thời nghiên cứu và phát triển các mô hình cách điệu thanh điệu phù hợp với đặc điểm tiếng Việt. Luận án đề xuất thuật toán EPM (Estimation of Pitch Markers) để xác định PM từ tín hiệu tổng tích lũy, thay vì tín hiệu gốc. Phương pháp này, với các luật lọc đỉnh R1-R6, cho thấy độ chính xác tương đương các thuật toán tiên tiến như AC-Praat, Yin, Crepe nhưng có tốc độ xử lý vượt trội đáng kể (14.8 phút so với 40.2, 188.7 và 52.1 phút tương ứng).
Bên cạnh đó, luận án giới thiệu thuật toán Syntone, sử dụng mô hình qTA và phương pháp PSOLA để tổng hợp thanh điệu cho âm tiết tiếng Việt, đạt mức độ chính xác và tự nhiên cao (MOS 3.8/5). Luận án cũng đề xuất các mô hình qTAV-Poly và qTAVs-Poly, dựa trên lý thuyết xấp xỉ hàm số liên tục bằng đa thức Weierstrass, để ước lượng tham số mô hình cách điệu hóa F0. So sánh với mô hình qTA(Xu)-Thai, qTAV-Poly cho thấy hiệu quả vượt trội trên chỉ số RMSE đối với tiếng Việt.
Để tối ưu hóa tham số và giảm thiểu sai số, luận án còn phát triển các mô hình qTAV-Cheb và qTAVs-Cheb, sử dụng đa thức Chebyshev. Kết quả thực nghiệm cho thấy qTAV-Cheb giảm đáng kể sai số ước lượng (MAPE thấp hơn) so với qTAV-Poly thông thường, mang lại độ chính xác cao hơn.
Các đóng góp mới bao gồm phương pháp xác định PM hiệu quả và các thuật toán, mô hình qTAV-Poly, qTA-Cheb để kết nối F0 trong từ ghép hai âm tiết, phục vụ tổng hợp lời nói tiếng Việt. Hướng nghiên cứu tiếp theo tập trung vào việc cải tiến các mô hình, mở rộng ứng dụng cho đoạn ngữ tiếng Việt và tích hợp các mô hình học máy mới.