Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
Đại học Bách khoa Hà Nội
Phạm Ngọc Hưng
Luận án Nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng Việt theo phương thức phát âm
Chuyên ngành: Công nghệ thông tin
Luận án
2017
1Đăng nhập để xem toàn bộ nội dung
Đăng nhập ngayMục lục
1. Lời nói đầu .......................... 3
2. Chương 1: Giới thiệu ............ 7
3. Chương 2: Nội dung nghiên cứu .. 28
4. Kết luận ................................ 70
Nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng Việt theo phương thức phát âm
Hệ thống thông tin Mã số: 62480104
Luận án tập trung vào nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng Việt. Một thành tựu nổi bật là việc xây dựng bộ ngữ liệu tiếng Việt VDSPEC, bộ ngữ liệu đầu tiên dành cho nghiên cứu nhận dạng phương ngữ tiếng Việt và tiếng Việt nói, bao gồm đại diện cho ba phương ngữ chính: giọng Hà Nội (Bắc), giọng Huế (Trung) và giọng Thành phố Hồ Chí Minh (Nam).
Nghiên cứu đã phân tích và chỉ ra các khác biệt về phương thức phát âm giữa ba phương ngữ, đặc biệt là theo phương diện xử lý tín hiệu, bao gồm sự khác biệt trong phát âm thanh điệu và mức độ mũi hóa.
Để nhận dạng các phương ngữ này, luận án đã nghiên cứu mô hình GMM, tối ưu hóa bộ tham số gồm số thành phần Gauss, đặc trưng MFCC, tần số cơ bản F0, các biến thể của F0, formant và dải thông. Việc kết hợp formant và dải thông với biến thể của F0 đã tăng độ chính xác nhận dạng lên 1,4% so với chỉ dùng MFCC và F0. Ngoài GMM, luận án cũng khảo sát các bộ phân lớp khác như SVM (SMO), MultilayerPerceptrol, IBk, JRip, PART, và xác định rằng MultilayerPerceptrol cho kết quả nhận dạng phương ngữ tiếng Việt tốt nhất với tập 384 tham số đặc trưng của tín hiệu tiếng nói.
Một kết luận quan trọng khác là vai trò tích cực của việc xác định phương ngữ trước khi nhận dạng nội dung tiếng nói bằng mô hình HMM. Khi áp dụng mô hình HMM trên ngữ liệu có thông tin phương ngữ, tỷ lệ lỗi từ tương đối đã giảm 27,9%, tương đương với việc tăng đáng kể độ chính xác nhận dạng. Đây là lần đầu tiên mô hình HMM được sử dụng để nhận dạng tự động tiếng Việt nói trên ngữ liệu có phương ngữ.
Tổng hợp các kết quả, luận án đề xuất một mô hình mới, mạnh mẽ cho nhận dạng tiếng Việt nói, trong đó việc nhận dạng phương ngữ cần được tiến hành trước tiên do sự đa dạng phương ngữ của ngôn ngữ này.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên