Luận án Khai phá tập mục phổ biến mờ dựa trên cấu trúc cây và kỹ thuật xử lý song song

Năm2023

Lĩnh vựcCông nghệ thông tin

Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

KHAI PHÁ TẬP MỤC PHỔ BIẾN MỜ DỰA TRÊN CẤU TRÚC CÂY VÀ KỸ THUẬT XỬ LÝ SONG SONG

Ngành:

Hệ thống thông tin (Mã số: 9 48 01 04) - Tóm tắt luận án Tiến sĩ ngành Máy tính

Tóm tắt nội dung tài liệu:

Trong bối cảnh công nghệ 4.0, sự phát triển mạnh mẽ của các hệ thống thông minh đã tạo ra lượng lớn dữ liệu hàng ngày, vượt quá khả năng xử lý của các phương pháp thống kê truyền thống. Khai phá dữ liệu, đặc biệt là khai phá luật kết hợp mờ, trở thành nhiệm vụ cấp thiết để trích xuất thông tin hữu ích từ dữ liệu định lượng. Tuy nhiên, lĩnh vực này đối mặt với các thách thức chính: vấn đề "ranh giới sắc nét" khi phân vùng dữ liệu mờ, yêu cầu bộ nhớ lớn của các thuật toán khai phá dựa trên cấu trúc cây, và nhu cầu xử lý song song để đối phó với dữ liệu quy mô lớn, không đồng nhất và biến động.

Luận án này tập trung giải quyết ba khoảng trống nghiên cứu trên. Mục tiêu là đề xuất các giải pháp khai phá tập mục phổ biến mờ trong cơ sở dữ liệu định lượng, khắc phục vấn đề "sắc nét" khi phân vùng dữ liệu mờ, giảm bộ nhớ lưu trữ và thời gian xử lý trong môi trường dữ liệu lớn. Các đóng góp chính của luận án bao gồm:

Đề xuất phương pháp xác định các tập mờ cho mỗi thuộc tính định lượng trong cơ sở dữ liệu thông qua kỹ thuật phân cụm EMC, chuyển đổi dữ liệu định lượng sang dữ liệu mờ.
Phát triển hai phương pháp khai phá tập mục phổ biến mờ là NFFP và NPSFF, dựa trên cấu trúc dữ liệu Node-list (sử dụng cây FPPC-tree và POSC-tree với PP_code hoặc POS-code). Các phương pháp này giúp hạn chế mức tiêu thụ bộ nhớ bằng cách tạo Nodelist và sau đó xóa cấu trúc cây để giải phóng không gian.
Đề xuất một phương pháp xử lý song song cho quá trình khai phá tập mục phổ biến mờ sử dụng lý thuyết tự động học di động (Cellular Learning Automata - CLA). Phương pháp này biểu diễn không gian dữ liệu như một mạng lưới các ô, cho phép dữ liệu giao dịch được đọc và xử lý đồng thời bởi các ô, từ đó rút ngắn đáng kể thời gian thực thi của thuật toán.

Thực nghiệm trên các tập dữ liệu Foodmart, Chess và ChainStore cho thấy thuật toán CLA-Fuzzy Mining đạt hiệu quả cao hơn về thời gian xử lý và bộ nhớ tạm thời so với các thuật toán NPSFF và iMFFP. Luận án góp phần phát triển lý thuyết và ứng dụng trong khai phá luật kết hợp mờ.

Mục lục chi tiết:

Phần Mở đầu: Trình bày sự cần thiết và động lực nghiên cứu của đề tài; mục tiêu, đối tượng, phạm vi nghiên cứu; phương pháp nghiên cứu; những đóng góp chính và cấu trúc của luận án.
Chương 1: Cơ sở lý thuyết
Chương 2: Các phương pháp khai phá tập mục phổ biến mờ dựa trên cấu trúc cây.
Chương 3: Khai phá tập mục phổ biến mờ sử dụng phương pháp xử lý song song.

Luận án Khai phá tập mục phổ biến mờ dựa trên cấu trúc cây và kỹ thuật xử lý song song

Mô tả tài liệu

Tên luận án:

Ngành:

Tóm tắt nội dung tài liệu:

Mục lục chi tiết:

Tài liệu liên quan

Hội viên Premium

Tài liệu tải nhiều

Lĩnh vực khác