info@luanan.net.vn
Luận án DOCX

Luận án Hệ thống gợi ý dựa trên năng lượng

Năm2025
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

HỆ THỐNG GỢI Ý DỰA TRÊN NĂNG LƯỢNG

Ngành:

Chuyên ngành: Hệ Thống Thông Tin

Mã ngành: 9480104

Tóm tắt nội dung tài liệu:

Luận án "HỆ THỐNG GỢI Ý DỰA TRÊN NĂNG LƯỢNG" của NCS Trần Thị Cẩm Tú, chuyên ngành Hệ Thống Thông Tin, tập trung giải quyết các thách thức hiện hữu trong các hệ thống gợi ý như độ chính xác, khả năng mở rộng, cá nhân hóa, xử lý dữ liệu thưa thớt và đảm bảo tính đa dạng của gợi ý. Nghiên cứu đề xuất các giải pháp mới bằng cách tích hợp phương pháp thống kê năng lượng vào các mô hình lọc cộng tác.

Các đóng góp chính của luận án bao gồm:

  • Đề xuất phương pháp năng lượng để đo lường mức độ phù hợp giữa hai người dùng hoặc hai sản phẩm trong hệ thống, áp dụng các kỹ thuật như kiểm tra năng lượng, phân cụm theo năng lượng (E-clustering) và tương quan khoảng cách. Điều này giúp xác định các mối quan hệ (1:n) thay vì từng cặp, nâng cao độ chính xác và khả năng xử lý dữ liệu phức tạp.
  • Đề xuất một mô hình gợi ý mới dựa trên lọc cộng tác kết hợp kỹ thuật năng lượng và các chỉ số phân tích, hoạt động hiệu quả trên cả dữ liệu người dùng và sản phẩm. Mô hình này giải quyết các tình huống gợi ý đặc biệt bằng cách phân tích đặc điểm điều kiện và đặc điểm quyết định, được kiểm chứng qua thực nghiệm trên bộ dữ liệu Jester5k và MovieLens100k với kết quả vượt trội về độ chính xác.
  • Đề xuất mô hình gợi ý nhóm dựa trên năng lượng sử dụng phương pháp gom cụm/phân cụm (clustering) và thống kê phân cấp. Mô hình này dự đoán xếp hạng còn thiếu cho cá nhân và nhóm, sau đó đề xuất các mục phù hợp nhất, cho thấy độ chính xác cao khi thay đổi chỉ số "knn" và "given".
  • Đề xuất các độ đo thống kê về tương quan khoảng cách để cải thiện độ chính xác của mô hình gợi ý lọc cộng tác dựa trên người dùng và mục tin, với kết quả thực nghiệm cho thấy độ chính xác cao hơn so với các độ đo tương đồng có sẵn.
  • Tích hợp thành công gói "energy" vào gói "recommenderlab" bằng ngôn ngữ R, phát triển các bộ công cụ xử lý dữ liệu, tính độ tương thích và đánh giá mô hình.

Kết quả thực nghiệm trên các bộ dữ liệu chuẩn Jester5k và MovieLens100k khẳng định tính hiệu quả và khả năng ứng dụng cao của các mô hình đề xuất, với sai số thấp hơn và độ chính xác cao hơn đáng kể so với các mô hình truyền thống. Nghiên cứu này không chỉ cải thiện trải nghiệm người dùng, giảm thiểu sai số mà còn mở ra hướng nghiên cứu mới, ứng dụng khoảng cách năng lượng trong nhiều lĩnh vực khác nhau, góp phần phát triển công nghệ gợi ý và trí tuệ nhân tạo.

Mục lục chi tiết:

  • PHẦN MỞ ĐẦU
    • 1. Tính cấp thiết của luận án
  • CHƯƠNG 1. TỔNG QUAN
    • 1.1. Hệ thống gợi ý
      • 1.1.1. Định nghĩa về hệ thống gợi ý
      • 1.1.2. Các dạng dữ liệu của hệ thống gợi ý
      • 1.1.3. Mô hình của hệ thống gợi ý dựa trên đồ thị
    • 1.2. Các dạng hệ thống gợi ý phổ biến
      • 1.2.1. Hệ thống gợi ý và lợi ích của hệ thống gợi ý
      • 1.2.2. Các thành phần cơ bản trong hệ thống gợi ý
      • 1.2.3. Các mô hình hệ thống gợi ý
        • 1.2.3.1. Gợi ý dựa trên nội dung
        • 1.2.3.2. Gợi ý dựa trên số đông
        • 1.2.3.3. Gợi ý dựa trên tri thức chuyên gia
        • 1.2.3.4. Hệ thống gợi ý thuộc nhóm lai ghép/ hỗn hợp
        • 1.2.3.5. Gợi ý dựa trên ngữ cảnh
      • 1.2.4. Các bước thực hiện trong mô hình User Based Collaborative Filtering
      • 1.2.5. Thuật toán trong mô hình User Based Collaborative Filtering
    • 1.3. Đánh giá hệ thống gợi ý
      • 1.3.1. Các phương pháp xây dựng dữ liệu đánh giá
      • 1.3.2. Các phương pháp đánh giá đối với hệ thống gợi ý
        • 1.3.2.1. Dựa trên tính chính xác của gợi ý
        • 1.3.2.2. Dựa trên tính sai số của dự đoán xếp hạng
    • 1.4. Kết luận chương 1
  • CHƯƠNG 2. THỐNG KÊ KHOẢNG CÁCH NĂNG LƯỢNG (ENERGY DISTANCE STATISTICS)
    • 2.1. Suy diễn năng lượng
      • 2.1.1. Khoảng cách của các quan sát (Rigid motion invariance) và suy diễn năng lượng (scale invariance)
      • 2.1.2. Định nghĩa về hàm khoảng cách thống kê của dữ liệu (jackknife invariance)
    • 2.2. Thống kê khoảng cách năng lượng
      • 2.2.1. Định nghĩa
      • 2.2.2. Khoảng cách giữa các đối tượng thống kê
      • 2.2.3. Đặc điểm của khoảng cách năng lượng
      • 2.2.4. Khoảng cách năng lượng
    • 2.3. Thống kê khoảng cách năng lượng một mẫu
      • 2.3.1. Khoảng cách năng lượng phù hợp
      • 2.3.2. Kiểm tra năng lượng của quy tắc đa biến
    • 2.4. Thống kê khoảng cách năng lượng đa mẫu
      • 2.4.1. Khoảng cách năng lượng với các phân phối bằng nhau
      • 2.4.2. Phân cụm năng lượng (E-clustering) với phương pháp k-means và hierarchical
    • 2.5. Tương quan khoảng cách
      • 2.5.1. Định nghĩa
      • 2.5.2. Tương quan chênh lệch martingale (Martingale difference correlation)
      • 2.5.3. Thống kê phương sai khoảng cách không thiên vị (unbiased distance covariance statistic)
    • 2.6. Tương quan khoảng cách bán phần (Partial distance correlation)
    • 2.7. Kết luận chương 2
  • CHƯƠNG 3. MÔ HÌNH GỢI Ý VỚI NĂNG LƯỢNG
    • 3.1. Mô hình gợi ý dựa trên người dùng sử dụng năng lượng
      • 3.1.1. Mô hình dữ liệu
      • 3.1.2. Mô hình gợi ý dựa trên năng lượng
      • 3.1.3. Đánh giá mô hình gợi ý
      • 3.1.4. Giải thuật mô hình gợi ý với năng lượng
      • 3.1.5. Thực nghiệm
        • 3.1.5.1. Dữ liệu
        • 3.1.5.2. Công cụ thực hiện
        • 3.1.5.3. Kết quả thực nghiệm của mô hình
    • 3.2. Hệ thống gợi ý dựa trên mục tin
      • 3.2.1. Định nghĩa về hệ thống gợi ý theo hệ thống thông tin
        • 3.2.1.1. Collaborative Filtering Recommendation System
        • 3.2.1.2. CFRS Sử dụng khoảng cách năng lượng
      • 3.2.2. Mô hình gợi ý dựa trên mục tin
        • 3.2.2.1. Mô hình gợi ý dựa trên mục sử dụng khoảng cách năng lượng
        • 3.2.2.2. Ma trận không tương thích của các mục
        • 3.2.2.3. k-láng giềng gần nhất của mục
      • 3.2.3. Giải thuật mô hình gợi ý dựa trên mục với khoảng cách năng lượng
      • 3.2.4. Thực nghiệm
        • 3.2.4.1. Dữ liệu
        • 3.2.4.2. Công cụ thực hiện
        • 3.2.4.3. Đánh giá kết quả thực nghiệm của mô hình
    • 3.3. Kết luận chương 3
  • CHƯƠNG 4. HỆ THỐNG GỢI Ý NHÓM DỰA TRÊN NĂNG LƯỢNG
    • 4.1. Hệ thống gợi ý nhóm dựa trên người dùng
      • 4.1.1. Định nghĩa hệ thống gợi ý nhóm
      • 4.1.2. Phương pháp gom cụm K-means
      • 4.1.3. Gom cụm (clustering) dựa trên khoảng cách năng lượng
        • 4.1.3.1. Khoảng cách năng lượng
        • 4.1.3.2. Gom cụm (clustering) sử dụng khoảng cách năng lượng
        • 4.1.3.3. Đánh giá hệ thống gợi ý nhóm
      • 4.1.4. Mô hình hệ thống gợi ý nhóm dựa trên năng lượng
      • 4.1.5. Giải thuật
      • 4.1.6. Thực nghiệm
        • 4.1.6.1. Dữ liệu
        • 4.1.6.2. Công cụ
        • 4.1.6.3. Đánh giá kết quả hệ thống gợi ý nhóm dựa trên người dùng
    • 4.2. Hệ thống gợi ý nhóm dựa trên mục tin
      • 4.2.1. Gợi ý nhóm dựa trên mục tin
      • 4.2.2. Phương pháp gom cụm (Hierarchical Clustering)
      • 4.2.3. Khoảng cách năng lượng giữa các nhóm mục tin
      • 4.2.4. Phương pháp đánh giá hệ thống gợi ý nhóm mục tin
      • 4.2.5. Mô hình hệ thống gợi ý dựa trên nhóm mục tin
      • 4.2.6. Giải thuật hệ thống gợi ý dựa trên nhóm mục tin
      • 4.2.7. Kết quả đánh giá hệ thống gợi ý dựa trên nhóm mục tin
        • 4.2.7.1. Dữ liệu
        • 4.2.7.2. Công cụ
        • 4.2.7.3. Đánh giá kết quả hệ thống gợi ý nhóm dựa trên người mục
    • 4.3. Kết luận chương 4
  • CHƯƠNG 5. HỆ THỐNG GỢI Ý VỚI TƯƠNG QUAN KHOẢNG CÁCH
    • 5.1. Hệ thống gợi ý với tiếp cận tương quan khoảng cách dựa trên người dùng
      • 5.1.1. Lọc cộng tác dựa trên người dùng
        • 5.1.1.1. Giới thiệu
        • 5.1.1.2. Tính toán mức độ tương thích (compatibility computation)
        • 5.1.1.3. Dự đoán đánh giá (Rating Prediction)
      • 5.1.2. Tương quan khoảng cách
        • 5.1.2.1. Khoảng cách Euclidean
        • 5.1.2.2. Hiệp phương sai khoảng cách (Distance Covariance)
        • 5.1.2.3. Tương quan khoảng cách (Distance Correlation)
      • 5.1.3. Phương pháp phân hoạch dữ liệu và đánh giá mô hình đề xuất
        • 5.1.3.1. Phương pháp xây dựng dữ liệu đánh giá
        • 5.1.3.2. Phương pháp đánh giá mô hình đề xuất
      • 5.1.4. Mô hình và giải thuật
        • 5.1.4.1. Mô hình lọc cộng tác với tương quan khoảng cách
        • 5.1.4.2. Giải thuật lọc cộng tác với tương quan khoảng cách
      • 5.1.5. Đánh giá kết quả của mô hình
        • 5.1.5.1. Dữ liệu
        • 5.1.5.2. Công cụ
        • 5.1.5.3. Kịch bản 1: Gợi ý tương quan với xếp hạng được biết trước given = 5
        • 5.1.5.4. Kịch bản 2: Gợi ý tương quan với xếp hạng được biết trước given = 20
    • 5.2. Hệ thống gợi ý dựa trên mục tin với tiếp cận tương quan khoảng cách
      • 5.2.1. Lọc cộng tác dựa trên mục tin và tương quan khoảng cách
        • 5.2.1.1. Lọc cộng tác dựa trên mục tin (Item Based Collaborative filtering)
        • 5.2.1.2. Tương quan khoảng cách năng lượng (Energy Distance Correlation)
        • 5.2.1.3. Ví dụ về tương quan khoảng cách năng lượng
      • 5.2.2. Đánh giá mô hình
        • 5.2.2.1. Phương pháp phân hoạch dữ liệu
        • 5.2.2.2. Phương pháp đánh giá
      • 5.2.3. Mô hình và giải thuật
        • 5.2.3.1. Mô hình
        • 5.2.3.2. Giải thuật
      • 5.2.4. Kết quả đánh giá thực nghiệm
        • 5.2.4.1. Dữ liệu
        • 5.2.4.2. Công cụ
        • 5.2.4.3. Kịch bản 1 - Lọc cộng tác dựa trên mục tin với phương pháp phân hoạch là “split”
        • 5.2.4.4. Kịch bản 2 - Lọc cộng tác dựa trên mục tin với phương pháp phân hoạch là "boostrap"
    • 5.3. Kết luận chương 5
  • KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Tài liệu liên quan