Tên luận án:
NGHIÊN CỨU PHƯƠNG PHÁP XÁC ĐỊNH THỨ TỰ ƯU TIÊN CỦA THƯ ĐIỆN TỬ
Ngành:
Hệ thống thông tin
Tóm tắt nội dung tài liệu:
Luận án "Nghiên cứu phương pháp xác định thứ tự ưu tiên của thư điện tử" tập trung giải quyết vấn đề quá tải email bằng cách phát triển các phương pháp trong ba hướng chính: lọc thư rác, dự đoán hành động người dùng và xếp hạng thư điện tử. Luận án đã thu thập và xây dựng thành công một tập dữ liệu thư điện tử tiếng Việt có gán nhãn để phục vụ cho các nghiên cứu này.
Đóng góp nổi bật của luận án bao gồm:
- Thứ nhất, đề xuất một phương pháp tự động sinh tập luật mới cho hệ thống lọc thư rác SpamAssassin dựa trên mạng nơ-ron. Phương pháp này tích hợp đồng thời quá trình lựa chọn luật và xác định trọng số, khắc phục hạn chế của các phương pháp truyền thống vốn tách rời hai khâu này. Kết quả là tập luật được xây dựng có chất lượng cao hơn và hiệu quả dự đoán được cải thiện so với các phương pháp hiện có.
- Thứ hai, luận án đề xuất phương pháp dự đoán hành động người dùng trên nền tảng SpamAssassin, kết hợp các mô hình phân loại đa lớp. Phương pháp này có tính ứng dụng thực tế cao và tốc độ xử lý nhanh. Các cải tiến được đưa ra nhằm nâng cao hiệu quả dự đoán, bao gồm việc ứng dụng thêm luật ham và sử dụng phương pháp sinh tập luật SpamAssassin dựa trên mạng nơ-ron. Thí nghiệm cho thấy phương pháp này giúp giảm tỷ lệ gợi ý nhầm đối với hành động xóa thư và tăng độ chính xác chung của các gợi ý.
- Thứ ba, luận án giới thiệu một mô hình phân loại dựa trên học sâu để xếp hạng thư điện tử theo năm mức độ ưu tiên khác nhau. Mô hình này khai thác hiệu quả sự kết hợp giữa các đặc trưng nội dung (sử dụng word embedding) và đặc trưng mạng xã hội của người gửi. Các thử nghiệm đã chứng minh rằng phương pháp này đạt hiệu quả tốt hơn đáng kể so với các phương pháp học máy truyền thống dựa trên máy phân loại SVM và bộ đặc trưng TF-IDF.
Các phương pháp đề xuất có thể được áp dụng nhanh chóng trên các hệ thống máy chủ thư điện tử đang cài đặt bộ lọc thư rác SpamAssassin, mang lại lợi ích thiết thực trong việc quản lý và xử lý email hiệu quả hơn cho người dùng.