Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ TÍNH TOÁN TẬP RÚT GỌN TRÊN KHÔNG GIAN XẤP XỈ MỜ
HỆ THỐNG THÔNG TIN
Luận án tiến sĩ này tập trung vào nghiên cứu và phát triển các phương pháp nâng cao hiệu quả tính toán tập rút gọn trên không gian xấp xỉ mờ, giải quyết những hạn chế của các phương pháp hiện có trong xử lý dữ liệu lớn và động. Chọn lọc thuộc tính là một bước tiền xử lý dữ liệu quan trọng, giúp giảm độ phức tạp tính toán, cải thiện khả năng diễn giải mô hình và nâng cao khả năng dự đoán.
Xuất phát từ thực tế mô hình tập thô truyền thống phù hợp với dữ liệu rời rạc, đòi hỏi rời rạc hóa dữ liệu liên tục gây tốn kém và mất thông tin, luận án kế thừa và phát triển các mô hình mở rộng như Tập Thô Mờ (FRS) và Tập Thô Mờ Độ Chính Xác Thay Đổi (VPFRS) trên không gian xấp xỉ mờ. Tuy nhiên, các phương pháp này vẫn còn hạn chế về thời gian tính toán và hiệu quả khi xử lý dữ liệu nhiễu hoặc dữ liệu thay đổi theo thời gian.
Mục tiêu chính của luận án là cải thiện thời gian tính toán tập rút gọn trên cả hai loại bảng quyết định: bảng quyết định số có chứa nhiễu và bảng quyết định động. Để đạt được mục tiêu này, luận án đã thực hiện hai hướng nghiên cứu chính.
Thứ nhất, luận án đề xuất một phương pháp rút gọn thuộc tính mới dựa trên việc mở rộng mô hình tập thô mờ độ chính xác thay đổi (VPOFRS) trên không gian xấp xỉ mờ. Phương pháp này tập trung vào việc tối ưu hóa các phép toán xấp xỉ và xây dựng độ đo độ quan trọng của thuộc tính dựa trên độ phụ thuộc VPOFRS, cho phép chọn lọc các thuộc tính quan trọng và loại bỏ nhiễu hiệu quả. Kết quả thực nghiệm cho thấy thuật toán VPOFRS_ARD có thời gian thực hiện nhanh hơn, tạo ra các tập rút gọn nhỏ hơn và độ chính xác phân lớp cao hơn đáng kể so với các phương pháp truyền thống như VPFRS và IFRS trên các bộ dữ liệu nhiễu, đặc biệt là UFDC.
Thứ hai, luận án đề xuất phương pháp tính toán gia tăng tập rút gọn sử dụng tiếp cận tính toán hạt thông tin trên không gian xấp xỉ mờ. Điểm nổi bật là việc mở rộng khái niệm hạt thông tin tri thức trên không gian xấp xỉ mờ, giúp đơn giản hóa công thức tính toán gia tăng và giảm đáng kể thời gian cập nhật tập rút gọn khi có sự thay đổi về tập đối tượng (thêm/bớt đối tượng). Các thuật toán FIG và FIGAMO được đề xuất đã chứng minh hiệu quả về thời gian tính toán, kích thước tập rút gọn và độ chính xác phân lớp trên các bộ dữ liệu lớn và động, vượt trội so với các phương pháp FD và FDMAO.
Luận án cũng chỉ ra tiềm năng ứng dụng rộng rãi của mô hình VPOFRS trong các bài toán phân tích dữ liệu khác và hướng phát triển tiếp theo là mở rộng nghiên cứu sang không gian lân cận để xử lý bảng quyết định hỗn hợp chứa cả thuộc tính số và phân loại, nhằm tăng cường tính ứng dụng thực tiễn.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên