NGHIÊN CỨU PHÁT TRIỂN CÁC PHƯƠNG PHÁP CẬP NHẬT BẢNG QUYẾT ĐỊNH PHỦ ĐỘNG VÀ XỬ LÝ MẤT CÂN BẰNG DỮ LIỆU DỰA TRÊN TẬP THÔ MỜ
Cơ sở toán học cho tin học, Mã số: 9.46.01.10
Luận án tập trung nghiên cứu và phát triển các phương pháp cập nhật bảng quyết định phủ động và xử lý mất cân bằng dữ liệu dựa trên tập thô mờ. Xuất phát từ thực tiễn dữ liệu trong hệ thống thông tin thường xuyên thay đổi, đòi hỏi các kỹ thuật khai thác cơ sở dữ liệu động mà không cần tính toán lại từ đầu. Luận án chỉ ra các hạn chế trong các phương pháp hiện có, bao gồm việc các phương pháp cập nhật quyết định ba nhánh chủ yếu áp dụng cho hệ thống đầy đủ, ít hiệu quả với hệ thống không hoàn chỉnh; các phương pháp cập nhật tập xấp xỉ còn hạn chế; và việc lựa chọn ngưỡng trong xử lý mất cân bằng dữ liệu bằng tập thô mờ vẫn mang tính thủ công.
Mục tiêu chính của nghiên cứu là đề xuất các phương pháp mới để cập nhật các quyết định ba nhánh trong hệ thông tin không đầy đủ và phương pháp cập nhật các tập xấp xỉ trong không gian xấp xỉ phủ động. Đồng thời, luận án cũng đề xuất một phương pháp sử dụng tập thô mờ nhằm cải thiện sự mất cân bằng của dữ liệu. Đối tượng nghiên cứu bao gồm các bảng quyết định đầy đủ và không đầy đủ với các kích thước khác nhau. Phạm vi nghiên cứu trọng tâm là bài toán cập nhật các tập xấp xỉ và các quyết định ba nhánh trong hệ thông tin không đầy đủ, cùng với ứng dụng tập thô để tối ưu ngưỡng, giảm thiểu sự mất cân bằng dữ liệu. Các kỹ thuật đề xuất được đánh giá thông qua thực nghiệm với các bộ số liệu từ kho dữ liệu UCI.
Luận án được tổ chức thành 04 chương. Chương 1 cung cấp tổng quan về lý thuyết tập thô truyền thống và các mở rộng của nó, bao gồm tập thô dung sai, tập thô mờ, quyết định ba nhánh và tập thô phủ, làm nền tảng lý thuyết cho các chương sau. Chương 2 trình bày chi tiết phương pháp đề xuất để cập nhật các quyết định ba nhánh trong hệ thông tin không đầy đủ động khi có sự biến động về đối tượng hoặc giá trị thuộc tính. Chương này khảo sát xu hướng thay đổi của xác suất có điều kiện và đưa ra công thức cập nhật các miền ba nhánh, được chứng minh bằng mô hình toán học và ví dụ minh họa. Chương 3 tập trung vào việc cập nhật tập xấp xỉ trong không gian xấp xỉ phủ động, khảo sát hàm thành viên thô dạng ba và đề xuất phương pháp cập nhật các tập xấp xỉ phân cấp dựa trên sự thay đổi của hàm này.