info@luanan.net.vn
Luận án PDF

Luận án Nghiên cứu phát triển phương pháp khai phá luật kết hợp mở biểu thị bằng thông tin ngôn ngữ và ứng dụng

Năm2019
Lĩnh vựcKhoa học tự nhiên
Ngôn ngữTiếng Việt, Tiếng Anh
Xem trước tài liệu
Đang tải...

Đang tải tài liệu...

Mô tả tài liệu

Tên luận án:

NGHIÊN CỨU PHÁT TRIỂN PHƯƠNG PHÁP KHAI PHÁ LUẬT KẾT HỢP MỜ BIỂU THỊ BẰNG THÔNG TIN NGÔN NGỮ VÀ ỨNG DỤNG

Ngành:

Cơ sở toán học cho tin học

Tóm tắt nội dung tài liệu:

Luận án này tập trung nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ từ các cơ sở dữ liệu số, với mục tiêu giảm thời gian xử lý và nâng cao ý nghĩa của các luật được khai phá. Luận án sử dụng Đại số gia tử (ĐSGT) thay cho lý thuyết tập mờ truyền thống để giải quyết các nhược điểm trong việc xây dựng thuật toán tăng tốc độ xử lý và phân hoạch mờ miền xác định, đồng thời cung cấp một cách tiếp cận thống nhất và hiệu quả cho các biểu diễn dữ liệu khác nhau.

Mục đích nghiên cứu chính bao gồm việc biểu thị ngữ nghĩa các khái niệm mờ thông qua hàm thuộc, khai phá tri thức nói chung và luật mờ nói riêng, cùng với việc nghiên cứu các cách biểu diễn dữ liệu đa dạng (đơn thể hạt và đa thể hạt) để tạo ra các luật kết hợp mang nhiều ý nghĩa hơn.

Công trình đề xuất phương pháp nén cơ sở dữ liệu giao dịch mờ dựa trên ĐSGT, giúp gộp các giao dịch mờ gần nhau để giảm kích thước CSDL và rút ngắn thời gian khai phá luật kết hợp. Thuật toán khai phá luật kết hợp mờ được cải tiến từ thuật toán Apriori, áp dụng trên CSDL nén.

Để tối ưu hóa các tham số mờ, luận án đề xuất sử dụng lý thuyết ĐSGT kết hợp với giải thuật di truyền (GA) để tìm kiếm các hàm thuộc tối ưu. Phương pháp này tập trung vào tối ưu độ đo tính mờ và số lượng tham số, ít phức tạp hơn so với các phương pháp dựa trên lý thuyết tập mờ thông thường. Các hàm thuộc được xây dựng dựa trên biểu diễn đơn thể hạt và đa thể hạt của ĐSGT, đảm bảo độ phủ và độ chồng lấn hợp lý trên miền giá trị của thuộc tính, đồng thời phản ánh ngữ nghĩa ngôn ngữ tự nhiên.

Kết quả thực nghiệm trên sáu bộ dữ liệu thực tế (FAM95, pollution, stulong, basketball, quake, stock) từ kho dữ liệu UCI cho thấy phương pháp đề xuất có hiệu quả cao. Cụ thể, giải pháp nén CSDL mờ mang lại tốc độ xử lý nhanh hơn và các tập phổ biến tìm được tương tự như khi không nén. Đồng thời, phương pháp phân hoạch mờ dựa trên ĐSGT với biểu diễn đa thể hạt tạo ra các luật kết hợp vừa có tính khái quát cao, vừa chi tiết, với độ thú vị trung bình cao hơn hoặc tương đương so với các phương pháp khác. Việc tính toán với biểu diễn đa thể hạt không làm tăng đáng kể độ phức tạp hay thời gian xử lý.

Mục lục chi tiết:

  • MỞ ĐẦU

  • CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ

    • 1.1. Tập mờ và các phép toán trên tập mờ
      • 1.1.1. Tập mờ (fuzzy set)
      • 1.1.2. Biến ngôn ngữ
      • 1.1.3. Phân hoạch mờ
    • 1.2. Các tập mờ ... Đại số gia tử
      • 1.2.1. Khái niệm Đại số gia tử
      • 1.2.2. Định lượng ngữ nghĩa của giá trị ngôn ngữ
    • 1.3. Bài toán khai phá luật kết hợp
      • 1.3.1. Một số khái niệm
      • 1.3.2. Bài toán luật kết hợp mờ
    • 1.4. Kết luận
  • CHƯƠNG 2. KHAI PHÁ LUẬT KẾT HỢP MỜ THEO HƯỚNG TIẾP CẬN SỬ DỤNG ĐẠI SỐ GIA TỬ

    • 2.1. Đặt vấn đề
    • 2.2. Khai phá luật kết hợp mờ theo hướng tiếp cận ĐSGT
      • 2.2.1. Mờ hóa cơ sở dữ liệu giao dịch
      • 2.2.2. Quan hệ khoảng cách giao dịch
      • 2.2.3. Xây dựng bảng định lượng
    • 2.3. Nén cơ sở dữ liệu giao dịch
    • 2.4. Thuật toán trích xuất luật kết hợp mờ
    • 2.5. Kết quả thử nghiệm
      • 2.5.1. Thử nghiệm với CSDL FAM95
      • 2.5.2. Thử nghiệm với CSDL STULONG
    • 2.6. Kết luận
  • CHƯƠNG 3. PHÂN HOẠCH MỜ CHO THUỘC TÍNH DỰA TRÊN BIỂU DIỄN THỂ HẠT CỦA ĐSGT

    • 3.1. Phân hoạch cho miền giá trị của thuộc tính
      • 3.1.1. Đặt vấn đề
      • 3.1.2. Rời rạc hóa thuộc tính định lượng
      • 3.1.3. Phân chia miền giá trị của thuộc tính theo cách tiếp cận lý thuyết tập mờ
    • 3.2. Phương pháp phân hoạch mờ bằng biểu diễn thể hạt với ĐSGT
      • 3.2.1. Phân hoạch giá trị miền thuộc tính sử dụng biểu diễn đơn thể hạt
      • 3.2.2. Phân hoạch giá trị miền thuộc tính sử dụng biểu diễn đa thể hạt
    • 3.3. Phương pháp tối ưu tham số mờ ĐSGT cho bài toán khai phá luật kết hợp
      • 3.3.1. Mã hóa tập các MF
      • 3.3.2. Đánh giá nhiễm sắc thể
    • 3.4. Thuật toán tìm kiếm phân hoạch mờ tối ưu và luật kết hợp
    • 3.5. Kết quả thực nghiệm
      • 3.5.1. Cơ sở dữ liệu sử dụng trong thử nghiệm
      • 3.5.2. Phân tích và đánh giá kết quả thực nghiệm với biểu diễn dữ liệu dạng đơn thể hạt
        • 3.5.2.1. Kết quả thử nghiệm với CSDL FAM95
        • 3.5.2.2. Kết quả thử nghiệm với một số CSDL khác
      • 3.5.3. Phân tích và đánh giá kết quả thực nghiệm với biểu diễn dữ liệu dạng đa thể hạt
    • 3.6. Kết luận
  • KẾT LUẬN VÀ KIẾN NGHỊ

Tài liệu liên quan