HỆ TƯ VẤN DỰA TRÊN TRƯỜNG HÀM Ý THỐNG KÊ
KHOA HỌC MÁY TÍNH
Luận án này tập trung vào việc nghiên cứu và phát triển các hệ tư vấn dựa trên trường hàm ý thống kê nhằm nâng cao chất lượng khuyến nghị và khắc phục hạn chế của các hệ tư vấn hiện có. Trong bối cảnh thông tin trực tuyến phát triển nhanh chóng, nhu cầu về các hệ tư vấn hiệu quả trở nên cấp thiết. Mở đầu, luận án nhấn mạnh sự cần thiết của việc nghiên cứu các thuật toán tư vấn mới hoặc cải tiến, đặc biệt là ứng dụng khoa học dữ liệu và học máy. Phân tích hàm ý thống kê (SIA), một phương pháp phân tích dữ liệu mới, được xác định là có tiềm năng nhưng ứng dụng còn khiêm tốn trong lĩnh vực tư vấn.
Mục tiêu chính của luận án là khảo sát hệ tư vấn, nghiên cứu các khái niệm cơ bản của hàm ý thống kê như biến thiên hàm ý và trường hàm ý, từ đó đề xuất khung khai thác luật hàm ý và ứng dụng xây dựng mô hình tư vấn. Đối tượng nghiên cứu bao gồm các độ đo biến thiên hàm ý, các mô hình tư vấn khai thác luật và phương pháp đánh giá mô hình.
Luận án đã đạt được các đóng góp quan trọng: Thứ nhất, đề xuất một bộ các độ đo biến thiên hàm ý thống kê làm cơ sở cho việc xây dựng khung khai thác luật hàm ý và mô hình tư vấn. Thứ hai, phát triển một khung khai thác luật kết hợp hàm ý mới. Thứ ba, đề xuất các mô hình tư vấn lọc cộng tác dựa trên biến thiên hàm ý. Ban đầu là mô hình lọc cộng tác cho dữ liệu nhị phân, sau đó được cải tiến thành mô hình tư vấn dựa trên trường hàm ý thống kê, áp dụng được cho cả dữ liệu nhị phân và phi nhị phân, nhằm cải thiện chất lượng khuyến nghị và tối ưu thời gian thực hiện. Thứ tư, giới thiệu phương pháp phân hoạch dữ liệu dựa trên mục được đánh giá trên từng giao dịch, giúp nâng cao chất lượng huấn luyện và đánh giá mô hình. Cuối cùng, luận án đã phát triển công cụ implicationfieldRS bằng ngôn ngữ R để hỗ trợ xây dựng, huấn luyện và đánh giá các mô hình đề xuất.
Các thực nghiệm trên tập dữ liệu MSWeb (nhị phân) và MovieLens 100k (định lượng) cho thấy mô hình tư vấn dựa trên trường hàm ý thống kê (ISFRS) và mô hình lọc cộng tác dựa trên biến thiên hàm ý (ISF) đạt hiệu quả vượt trội so với các mô hình lọc cộng tác truyền thống và các mô hình tiếp cận hàm ý thống kê khác về độ chính xác dự đoán (MAE, MSE, RMSE), độ chính xác phân lớp (Precision, Recall, F1, ROC) và khả năng xếp hạng (nDCG, Rankscore). Đặc biệt, mô hình đề xuất cũng thể hiện hiệu suất cao hơn về thời gian xây dựng và thực thi, đồng thời tạo ra bộ luật tinh gọn hơn đáng kể. Những kết quả này khẳng định tiềm năng và đóng góp đáng kể của luận án trong việc cải thiện chất lượng hệ thống khuyến nghị.