NGHIÊN CỨU CÁC PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ
Hệ thống thông tin (Mã số: 62.48.01.04)
Luận án tập trung nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định dựa trên tiếp cận tập thô mờ, đây là hai bài toán trọng yếu trong quá trình khám phá tri thức từ dữ liệu. Rút gọn thuộc tính giúp gia tăng tốc độ, cải thiện chất lượng và tính dễ hiểu của các kết quả khai phá bằng cách loại bỏ thuộc tính dư thừa nhưng vẫn bảo toàn thông tin phân lớp. Sinh luật quyết định được sử dụng để đánh giá chất lượng phân lớp của dữ liệu. Lý thuyết tập thô mờ, một sự kết hợp giữa lý thuyết tập thô và tập mờ, được áp dụng để xấp xỉ các tập mờ dựa trên quan hệ tương đương mờ, có tiềm năng bảo toàn độ chính xác phân lớp.
Luận án giải quyết hai bài toán chính: rút gọn thuộc tính trên bảng quyết định miền giá trị thực và rút gọn thuộc tính cùng sinh luật quyết định trên bảng quyết định mờ. Đối tượng nghiên cứu là các bảng quyết định có miền giá trị thực và bảng quyết định mờ.
Với bài toán rút gọn thuộc tính của bảng quyết định miền giá trị thực, luận án đã cải tiến phương pháp sử dụng miền dương mờ để tìm tập rút gọn không dư thừa và bảo toàn miền dương mờ. Đồng thời, luận án đề xuất các phương pháp rút gọn thuộc tính mới sử dụng khoảng cách Jaccard mờ và khoảng cách phân hoạch mờ. Các thử nghiệm trên các bộ dữ liệu từ kho dữ liệu UCI cho thấy các phương pháp dựa trên khoảng cách mờ có ưu thế hơn về thời gian thực hiện và độ chính xác phân lớp so với các phương pháp sử dụng miền dương mờ và entropy mờ.
Đối với bài toán rút gọn thuộc tính và sinh luật quyết định của bảng quyết định mờ, luận án đã cải tiến phương pháp rút gọn thuộc tính dựa trên miền dương mờ để tìm tập rút gọn không dư thừa và bảo toàn miền dương mờ. Luận án cũng đề xuất phương pháp sinh luật quyết định sử dụng khoảng cách Jaccard mờ trực tiếp giữa các biến ngôn ngữ của thuộc tính điều kiện và quyết định. Thực nghiệm cho thấy phương pháp đề xuất đạt độ chính xác phân lớp tương đương với các phương pháp đã công bố, đồng thời tạo ra tập luật đơn giản hơn.