PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG CƠ SỞ DỮ LIỆU ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN
Hệ thống thông tin (Mã số: 9 48 01 04)
Luận án "Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian" của Trương Đức Phương, được hoàn thành tại Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, tập trung giải quyết ba khoảng trống nghiên cứu quan trọng trong lĩnh vực khai phá dữ liệu.
Thứ nhất, luận án đề xuất và giải quyết bài toán phát hiện các luật kết hợp có tính đến khoảng cách thời gian xảy ra giữa các giao dịch trong các cơ sở dữ liệu định lượng có yếu tố thời gian. Các luật này được gọi là luật kết hợp mờ với khoảng cách thời gian mờ. Để giải quyết vấn đề này, thuật toán FTQ đã được đề xuất, sử dụng phương pháp mờ hóa các thuộc tính định lượng và khoảng cách thời gian, sau đó áp dụng ý tưởng từ thuật toán Apriori. Thực nghiệm đã chứng minh tính phù hợp với lý thuyết luật kết hợp (tính chất đóng xuống) và ý nghĩa ứng dụng thực tiễn của thuật toán.
Thứ hai, luận án giải quyết bài toán phát hiện các mẫu chuỗi (cổ điển) có tính đến khoảng cách thời gian giữa các giao dịch trong các cơ sở dữ liệu chuỗi định lượng có yếu tố thời gian. Các mẫu chuỗi này được gọi là mẫu chuỗi mờ với khoảng cách thời gian mờ. Thuật toán FSPFTIM được đề xuất, có tính đúng đắn và đầy đủ, với độ phức tạp tính toán được chỉ rõ. Kết quả thực nghiệm khẳng định sự phù hợp với lý thuyết (đặc biệt là tính chất đóng xuống của các mẫu phổ biến) và ý nghĩa ứng dụng.
Thứ ba, luận án đề xuất và giải quyết bài toán phát hiện các luật chuỗi chung có tính đến khoảng cách thời gian xảy ra giữa các giao dịch trong các cơ sở dữ liệu chuỗi định lượng có yếu tố thời gian. Các luật này được gọi là luật chuỗi chung mờ với khoảng cách thời gian mờ. Thuật toán IFERMiner đã được phát triển để giải quyết vấn đề này, cũng được chứng minh là đúng đắn và đầy đủ, với độ phức tạp tính toán là đa thức.
Những đóng góp chính của luận án bao gồm việc đề xuất các vấn đề và cung cấp các thuật toán FTQ, FSPFTIM, và IFERMiner để phát hiện luật kết hợp mờ, mẫu chuỗi mờ và luật chuỗi chung mờ trong các CSDL định lượng và chuỗi định lượng có yếu tố thời gian, qua đó lấp đầy các khoảng trống nghiên cứu đã xác định. Hướng nghiên cứu tương lai bao gồm phát triển các thuật toán hiệu quả hơn và nghiên cứu các mẫu chuỗi/luật chuỗi chung biểu diễn mối quan hệ giữa các giao dịch thực hiện bởi nhiều đối tượng khác nhau.