Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
Đang tải tài liệu...
NGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHO TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN
Hệ thống thông tin
Luận án “NGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHO TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN” tập trung giải quyết thách thức trong việc trích xuất tự động các thông tin có cấu trúc như thực thể, mối quan hệ, ý kiến/quan điểm hoặc sự kiện từ các nguồn dữ liệu văn bản không có cấu trúc hoặc bán cấu trúc. Mục tiêu cuối cùng là chuyển đổi thông tin văn bản sang định dạng dễ tiếp cận hơn để hỗ trợ xử lý và người dùng hiệu quả.
Nghiên cứu đề xuất các phương pháp học máy nhằm nâng cao hiệu quả trích xuất thông tin tự động từ văn bản, bao gồm hai nội dung chính. Thứ nhất, luận án nghiên cứu và đề xuất phương pháp trích xuất thông tin cho ngôn ngữ ít tài nguyên như tiếng Việt, đặc biệt trong bài toán khai phá quan điểm dựa trên khía cạnh. Phương pháp này khai thác nguồn dữ liệu đã được gán nhãn từ ngôn ngữ khác để trích xuất các loại khía cạnh và phân loại quan điểm cho các khía cạnh đã trích xuất, mang lại ý nghĩa thực tiễn cao trong việc phân tích ý kiến chi tiết.
Thứ hai, luận án đề xuất các phương pháp học sâu tiên tiến để giải quyết và nâng cao hiệu quả cho nhiệm vụ trích xuất thông tin trong lĩnh vực xử lý văn bản pháp quy tiếng Việt. Các nhiệm vụ cụ thể bao gồm trích xuất thực thể tham chiếu và phân loại quan hệ giữa các thực thể tham chiếu với văn bản pháp quy đang xem xét. Việc trích xuất thông tin từ văn bản pháp quy là bước nền tảng để xây dựng các công cụ tự động hóa, hỗ trợ tìm kiếm, tra cứu và phân tích.
Đặc biệt, luận án đóng góp bằng việc đề xuất một phương pháp trích xuất kết hợp đồng thời thực thể và quan hệ trong văn bản pháp quy tiếng Việt, sử dụng mô hình dựa trên học sâu với kiến trúc bộ mã hóa-giải mã dựa trên Transformer và cơ chế giải mã song song không tự hồi quy. Phương pháp này khắc phục hạn chế của cách tiếp cận tuần tự, giảm thiểu sự lan truyền lỗi và nhận diện mối quan hệ phức tạp giữa các thực thể. Ngoài ra, luận án cũng nghiên cứu và đề xuất các phương pháp kết hợp ưu điểm của học máy truyền thống và học sâu để cải thiện hiệu quả trích xuất thông tin.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên