info@luanan.net.vn
Luận án PDF

Luận án Nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng Việt theo phương thức phát âm

Năm2017
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt

Mô tả tài liệu

Tên luận án:

Nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng Việt theo phương thức phát âm

Ngành:

Hệ thống thông tin Mã số: 62480104

Tóm tắt nội dung tài liệu:

Luận án tập trung vào nhận dạng tự động tiếng nói phát âm liên tục cho các phương ngữ chính của tiếng Việt. Một thành tựu nổi bật là việc xây dựng bộ ngữ liệu tiếng Việt VDSPEC, bộ ngữ liệu đầu tiên dành cho nghiên cứu nhận dạng phương ngữ tiếng Việt và tiếng Việt nói, bao gồm đại diện cho ba phương ngữ chính: giọng Hà Nội (Bắc), giọng Huế (Trung) và giọng Thành phố Hồ Chí Minh (Nam).

Nghiên cứu đã phân tích và chỉ ra các khác biệt về phương thức phát âm giữa ba phương ngữ, đặc biệt là theo phương diện xử lý tín hiệu, bao gồm sự khác biệt trong phát âm thanh điệu và mức độ mũi hóa.

Để nhận dạng các phương ngữ này, luận án đã nghiên cứu mô hình GMM, tối ưu hóa bộ tham số gồm số thành phần Gauss, đặc trưng MFCC, tần số cơ bản F0, các biến thể của F0, formant và dải thông. Việc kết hợp formant và dải thông với biến thể của F0 đã tăng độ chính xác nhận dạng lên 1,4% so với chỉ dùng MFCC và F0. Ngoài GMM, luận án cũng khảo sát các bộ phân lớp khác như SVM (SMO), MultilayerPerceptrol, IBk, JRip, PART, và xác định rằng MultilayerPerceptrol cho kết quả nhận dạng phương ngữ tiếng Việt tốt nhất với tập 384 tham số đặc trưng của tín hiệu tiếng nói.

Một kết luận quan trọng khác là vai trò tích cực của việc xác định phương ngữ trước khi nhận dạng nội dung tiếng nói bằng mô hình HMM. Khi áp dụng mô hình HMM trên ngữ liệu có thông tin phương ngữ, tỷ lệ lỗi từ tương đối đã giảm 27,9%, tương đương với việc tăng đáng kể độ chính xác nhận dạng. Đây là lần đầu tiên mô hình HMM được sử dụng để nhận dạng tự động tiếng Việt nói trên ngữ liệu có phương ngữ.

Tổng hợp các kết quả, luận án đề xuất một mô hình mới, mạnh mẽ cho nhận dạng tiếng Việt nói, trong đó việc nhận dạng phương ngữ cần được tiến hành trước tiên do sự đa dạng phương ngữ của ngôn ngữ này.

Tài liệu liên quan