info@luanan.net.vn
Luận án PDF

Luận án Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt

Năm2017
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt

Ngành:

Khoa học máy tính

Tóm tắt nội dung tài liệu:

Luận án "Nghiên cứu ứng dụng kỹ thuật học bán giám sát vào lĩnh vực phân loại văn bản tiếng Việt" thuộc chuyên ngành Khoa học máy tính, do NCS Võ Duy Thanh thực hiện dưới sự hướng dẫn của PGS. TS Võ Trung Hùng và PGS. TS Đoàn Văn Ban tại Đại học Đà Nẵng.

Trước năm 2005, các nghiên cứu về kỹ thuật học bán giám sát còn hạn chế, chưa tổng quát và chỉ được áp dụng giới hạn trong một số lĩnh vực. Tuy nhiên, trong những năm gần đây, kỹ thuật này đã thu hút sự chú ý của nhiều nhà khoa học, tập trung vào học bán giám sát dựa trên máy hỗ trợ véc tơ, cây Bayes hoặc quá trình xử lý hồi quy Gauss, vốn là những phương pháp hiệu quả trong thực tế.

Việc ứng dụng kỹ thuật học bán giám sát vào các bài toán xử lý ngôn ngữ tự nhiên như phân loại văn bản, dịch thống kê hay hỏi đáp tự động là phù hợp. Song, ở Việt Nam, các nghiên cứu trong nước chủ yếu sử dụng kỹ thuật n-grams, trong khi học bán giám sát mới chỉ bước đầu được nghiên cứu trong tin sinh học (phân loại gien, protein) và chưa được phổ biến rộng rãi trong các lĩnh vực khác của xử lý ngôn ngữ tự nhiên.

Nhằm giải quyết khoảng trống này, luận án đã đề xuất một mô hình mới phục vụ phân loại văn bản tiếng Việt dựa trên học máy bán giám sát. Đồng thời, luận án cũng giới thiệu các giải pháp mới để thực hiện phân loại và đặc biệt là rút gọn số chiều véc-tơ khi phân loại. Những đề xuất này mang ý nghĩa quan trọng không chỉ cho lĩnh vực phân loại văn bản mà còn có tiềm năng mở rộng sang một số lĩnh vực khác trong xử lý ngôn ngữ tự nhiên.

Tài liệu liên quan