Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
Đang tải tài liệu...
NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT
Cơ sở Toán học cho Tin học
Luận án "NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT" tập trung vào việc cải thiện chất lượng tổng hợp và nhận dạng tiếng Việt. Công trình này xuất phát từ thực tế tiếng nói tự nhiên của người Việt chứa đựng nhiều hiện tượng ngôn điệu phức tạp như trường độ, âm lượng và thanh điệu.
Chương một tổng quan về tổng hợp và nhận dạng tiếng nói, giới thiệu khái niệm, phạm vi ứng dụng, các phương pháp tiếp cận hiện đại cùng ưu nhược điểm của chúng. Luận án đề xuất sử dụng các đặc trưng ngôn điệu để nâng cao chất lượng tiếng Việt và trình bày các kiến thức cơ bản về xử lý tiếng nói, trích chọn đặc trưng và các mô hình học máy như HMM và CART.
Chương hai cung cấp cái nhìn tổng quát về các thuật toán khử nhiễu và chi tiết các mô hình học máy HMM và CART được sử dụng trong nghiên cứu.
Chương ba đi sâu vào dự báo trường độ, âm lượng và tổng hợp thanh điệu tiếng Việt. Chuyên đề này nhấn mạnh các đặc trưng tiếng nói phù hợp với đặc thù ngôn ngữ Việt Nam, như thanh điệu, trường độ và formant. Nghiên cứu bao gồm các phương pháp tổng hợp và nhận dạng, cách trích chọn đặc trưng, các mô hình ngôn điệu, phân tích đặc trưng tiếng Việt, và các quy luật ngôn điệu để nâng cao chất lượng.
Chương bốn tập trung vào việc kết hợp tham số cấu âm, formant và thanh điệu để nâng cao chất lượng nhận dạng tiếng Việt. Các tác giả đề xuất mô hình sử dụng ngôn điệu để cải thiện độ chính xác nhận dạng, chứng minh rằng việc kết hợp thông tin âm học với ngữ điệu và mô hình ngôn ngữ có thể giảm lỗi nhận dạng 11%. Luận án cũng phân tích ảnh hưởng của ngôn điệu đến các hệ số MFCC, kết hợp tần số cơ bản (F0) vào đặc trưng MFCC để tăng khả năng phân biệt và giảm nhiễu. Cuối cùng, nghiên cứu trình bày kết quả về việc kết hợp đặc trưng thanh điệu và cấu âm để tăng độ chính xác nhận dạng tiếng nói rời rạc và liên tục, đồng thời mô tả thiết kế hệ thống nhận dạng khẩu lệnh tiếng Việt nhúng trên chip vi hệ thống, sử dụng VTLN-MFCC và xử lý HMM tối ưu để đạt hiệu năng cao và chất lượng nhận dạng tương đương với hệ thống trên PC.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên