MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI
Hệ thống thông tin (Mã số: 9 48 01 04), Ngành Máy tính
Luận án tập trung giải quyết hai bài toán trọng tâm trong lĩnh vực dự báo lan truyền thông tin trên mạng xã hội: nâng cao tốc độ tính toán và nâng cao độ chính xác dự báo. Trong bối cảnh mạng xã hội ngày càng phát triển với lượng thông tin khổng lồ và mối quan hệ phức tạp, việc dự báo lan truyền thông tin gặp nhiều thách thức về thời gian xử lý và độ chính xác. Nhiều cơ quan, doanh nghiệp có nhu cầu khai thác thông tin mạng xã hội cho các mục đích đa dạng, từ phân tích xu hướng thị trường đến đảm bảo an ninh thông tin.
Để nâng cao tốc độ dự báo, luận án đề xuất kết hợp hai kỹ thuật chính: rút gọn đồ thị và song song hóa quá trình tính toán Độ trung tâm trung gian (Betweenness Centrality - BC). Phương pháp rút gọn đồ thị dựa trên việc thay thế các đỉnh tương đương bậc 1, giúp loại bỏ những đỉnh không quan trọng và làm đơn giản hóa đồ thị. Quá trình tính BC được song song hóa bằng cách sử dụng giải thuật Brandes với mô hình lập trình luồng song song trên CPU và thư viện CilkPlus. Các thử nghiệm thực tế chứng minh phương pháp rút gọn đồ thị mang lại hiệu quả tăng tốc độ tính toán, và giải thuật Red-Bet (kết hợp rút gọn và song song hóa) cho hiệu năng tính toán tốt hơn đáng kể so với các công cụ TeexGraph và NetworKit, với hệ số tăng tốc từ 1,2 đến 2,55 lần tùy theo bộ dữ liệu.
Để nâng cao độ chính xác dự báo, luận án đề xuất một phương pháp tính xác suất chấp nhận thông tin của người dùng (xác suất lan truyền) dựa trên ba thông số: ảnh hưởng quan hệ người dùng, ảnh hưởng sở thích với nội dung và ảnh hưởng từ bên ngoài. Từ các xác suất đã tính, luận án xây dựng Cây lan truyền “có khả năng nhất” cho một nội dung cụ thể để ước tính kích thước lan truyền. Kết quả thực nghiệm cho thấy phương pháp đề xuất có sai số tương đối trung bình thấp hơn so với các mô hình hiện có (IC, UI, RM) trong việc ước tính kích thước lan truyền và tạo cây có khả năng nhất, đặc biệt khi có sự xuất hiện của ảnh hưởng bên ngoài.