info@luanan.net.vn
VIP Luận án DOC

Luận án Phương pháp gia tăng rút gọn thuộc tính trong bảng quyết định thay đổi theo tiếp cận tập thô mờ

Năm2021
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

PHƯƠNG PHÁP GIA TĂNG RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH THAY ĐỔI THEO TIẾP CẬN TẬP THÔ MỜ

Ngành:

Khoa học máy tính

Mã số: 9 48 01 01

Tóm tắt nội dung tài liệu:

Luận án này tập trung nghiên cứu phương pháp gia tăng rút gọn thuộc tính trong bối cảnh các bảng quyết định thay đổi và dữ liệu lớn. Bài toán rút gọn thuộc tính là một bước tiền xử lý dữ liệu thiết yếu, nhằm loại bỏ các thuộc tính dư thừa, không liên quan để nâng cao hiệu quả, tốc độ, chất lượng và tính dễ hiểu của các mô hình khai phá tri thức. Tuy nhiên, với sự phát triển của dữ liệu lớn (Big Data) và các bảng quyết định liên tục thay đổi, các phương pháp rút gọn thuộc tính truyền thống gặp phải thách thức lớn về không gian lưu trữ, tốc độ tính toán và yêu cầu tính toán lại toàn bộ khi có sự thay đổi.

Để giải quyết các thách thức này, luận án đề xuất hướng tiếp cận tính toán gia tăng tìm tập rút gọn, chỉ cập nhật phần dữ liệu bị thay đổi thay vì tính toán lại từ đầu. Đặc biệt, luận án sử dụng lý thuyết tập thô mờ kết hợp với tiếp cận filter-wrapper để cải thiện các hạn chế của phương pháp filter truyền thống, vốn chưa tối ưu về số lượng thuộc tính và độ chính xác phân lớp.

Các đóng góp chính của luận án bao gồm:

  • Đề xuất thuật toán filter-wrapper (FW_FDBAR) để tìm tập rút gọn của bảng quyết định dựa trên độ đo khoảng cách mờ. Kết quả thực nghiệm cho thấy FW_FDBAR đạt được số lượng thuộc tính rút gọn nhỏ hơn và độ chính xác phân lớp cao hơn so với một số thuật toán hiện có.
  • Phát triển hai thuật toán gia tăng filter-wrapper (IFW_FDAR_AdObj và IFW_FDAR_DelObj) để xử lý các bảng quyết định thay đổi khi bổ sung hoặc loại bỏ tập đối tượng. Các thuật toán này được chứng minh là giảm thiểu đáng kể thời gian thực hiện và cải thiện độ chính xác phân lớp.
  • Đề xuất hai thuật toán gia tăng filter-wrapper (IFW_FDAR_AA và IFW_FDAR_DA) cho trường hợp bổ sung hoặc loại bỏ tập thuộc tính, với IFW_FDAR_AA cho thấy hiệu quả về độ chính xác phân lớp cao hơn và số lượng thuộc tính rút gọn nhỏ hơn FRSA-IFS-HIS(AA).

Mục tiêu tổng thể của luận án là giảm thiểu số lượng thuộc tính, độ phức tạp của mô hình phân lớp và nâng cao độ chính xác của mô hình khai phá dữ liệu. Định hướng phát triển trong tương lai bao gồm triển khai các thuật toán này vào các bài toán thực tiễn, đặc biệt với dữ liệu thuộc tính lớn, và tiếp tục nghiên cứu các mô hình tập thô mờ mở rộng khác để tối ưu hóa thời gian thực hiện.

Mục lục chi tiết:

  • CHƯƠNG 1: TỔNG QUAN VỀ RÚT GỌN THUỘC TÍNH THEO TẬP THÔ MỜ

    • 1.1. Tổng quan về rút gọn thuộc tính
    • 1.2. Các hướng tiếp cận filter-wrapper trong rút gọn thuộc tính
    • 1.3. Tổng quan về tập thô mờ
      • 1.3.1. Quan hệ tương đương mờ
      • 1.3.2. Ma trận tương đương mờ
      • 1.3.3. Phân hoạch mờ
    • 1.4. Các nghiên cứu liên quan đến rút gọn thuộc tính theo tiếp cận tập thô mờ
      • 1.4.1. Rút gọn thuộc tính theo tiếp cận tập thô mờ
        • 1.4.1.1 Các nghiên cứu liên quan
        • 1.4.1.2 Các vấn đề còn tồn tại
      • 1.4.2. Phương pháp gia tăng rút gọn thuộc tính theo tiếp cận tập thô mờ
        • 1.4.2.1. Các nghiên cứu liên quan
        • 1.4.2.2 Các vấn đề còn tồn tại
  • CHƯƠNG 2: THUẬT TOÁN FIFTER-WRAPPER RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH SỬ DỤNG KHOẢNG CÁCH MỜ

    • 2.1. Mở đầu
    • 2.2. Xây dựng khoảng cách giữa hai tập mờ
      • 2.2.1. Độ đo khoảng cách mờ
      • 2.2.2. Độ đo khoảng cách mờ và các tính chất
    • 2.3. Thuật toán filter tìm tập rút gọn sử dụng khoảng cách mờ
    • 2.4. Thuật toán filter-wrapper tìm tập rút gọn sử dụng khoảng cách mờ
    • 2.5. Thực nghiệm và đánh giá kết quả các thuật toán
      • 2.5.1. Mục tiêu thực nghiệm
      • 2.5.2. Số liệu thực nghiệm
      • 2.5.3. Kết quả so sánh độ chính xác phân lớp và số lượng thuộc tính tập rút gọn
      • 2.5.4. Kết quả so sánh thời gian thực hiện
  • CHƯƠNG 3: THUẬT TOÁN GIA TĂNG FIFTER-WRAPPER TÌM TẬP RÚT GỌN KHI BỔ SUNG, LOẠI BỎ TẬP ĐỐI TƯỢNG

    • 3.1. Mở đầu
    • 3.2. Thuật toán gia tăng filter-wrapper tìm tập rút gọn bổ sung tập đối tượng
      • 3.2.1. Công thức gia tăng tính khoảng cách mờ khi bổ sung tập đối tượng
      • 3.2.2. Thuật toán gia tăng fifter-wrapper tìm tập rút gọn sau khi bổ sung tập đối tượng
      • 3.2.3. Thực nghiệm thuật toán
        • 3.2.3.1 Mục tiêu thực nghiệm
        • 3.2.3.2 Dữ liệu thực nghiệm
        • 3.2.3.3 Kết quả so sánh thời gian thực hiện của thuật toán gia tăng filter-wrapper IFW_FDAR_AdObj với thuật toán IV-FS-FRS-2, IARM, ASS-IAR, IFSA
        • 3.2.2.4 Kết quả so sánh độ chính xác phân lớp và số lượng thuộc tính của tập rút gọn của thuật toán gia tăng filter-wrapper IFW_FDAR_AdObj với thuật toán IV-FS-FRS-2, IARM, ASS-IAR, IFSA
    • 3.3. Thuật toán gia tăng fifter-wrapper tìm tập rút gọn khi loại bỏ tập đối tượng
      • 3.3.1. Cập nhật khoảng cách mờ khi loại bỏ tập đối tượng
      • 3.3.2. Thuật toán gia tăng filter-wrapper cập nhật tập rút gọn khi loại bỏ tập thuộc tính
      • 3.3.3. Thực nghiệm thuật toán
        • 3.3.3.1 Mục tiêu thử nghiệm
        • 3.3.3.2 Dữ liệu thử nghiệm
        • 3.3.3.3 Kết quả so sánh thời gian thực hiện của thuật toán IFW_FDAR_DelObj với thuật toán IFSD
        • 3.3.3.4 Kết quả so sánh độ chính xác phân lớp và số lượng thuộc tính tập rút gọn thu được bởi thuật toán IFW_FDAR_DelObj và thuật toán IFSD
  • CHƯƠNG 4: THUẬT TOÁN GIA TĂNG FIFTER-WRAPPER TÌM TẬP RÚT GỌN KHI BỔ SUNG, LOẠI BỎ TẬP THUỘC TÍNH

    • 4.1. Mở đầu
    • 4.2. Thuật toán gia tăng filter-wrapper tìm tập rút gọn khi bổ sung tập thuộc tính
      • 4.2.1. Công thức gia tăng cập nhật khoảng cách khi bổ sung tập thuộc tính
      • 4.2.2. Thuật toán gia tăng filter-wrapper tìm tập rút gọn khi bổ sung tập thuộc tính
      • 4.2.3. Thực nghiệm và đánh giá thuật toán
        • 4.2.3.1. Mục tiêu thực nghiệm
        • 4.2.3.2. Dữ liệu thực nghiệm
        • 4.2.3.3. Kết quả so sánh số lượng thuộc tính của tập rút gọn và độ chính xác phân lớp của hai thuật toán IFW_FDAR_AA và thuật toán FRSA-IFS-HIS(AA)
        • 4.2.3.3. Kết quả so sánh thời gian thực hiện của thuật toán gia tăng filter-wrapper IFW_FDAR_AA và thuật toán FRSA-IFS-HIS(AA)
    • 4.3. Thuật toán gia tăng filter-wrapper tìm tập rút gọn khi loại bỏ tập thuộc tính
      • 4.3.1. Công thức cập nhật khoảng cách khi loại bỏ tập thuộc tính
      • 4.3.2. Thuật toán gia tăng filter-wrapper cập nhật tập rút gọn khi loại bỏ tập thuộc tính
  • KẾT LUẬN

    • 1. Các kết quả đạt được của Luận án
    • 2. Định hướng phát triển

Tài liệu liên quan