Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN TIN NHẮN RÁC TIẾNG VIỆT
Hệ thống thông tin (Mã số: 9.48.01.04)
Luận án "NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN TIN NHẮN RÁC TIẾNG VIỆT" của Vũ Minh Tuấn, được thực hiện tại Học viện Công nghệ Bưu chính Viễn thông vào năm 2024, tập trung giải quyết vấn đề tin nhắn rác SMS trong bối cảnh kỹ thuật số hóa. Đề tài xuất phát từ nhu cầu cải thiện chất lượng dịch vụ tin nhắn và bảo vệ người dùng khỏi thông tin không mong muốn, góp phần đảm bảo an ninh thông tin.
Mục tiêu chính của nghiên cứu là phát triển và cải tiến các kỹ thuật phát hiện tin nhắn rác, đặc biệt cho ngôn ngữ tiếng Việt. Luận án đặt ra ba mục tiêu cụ thể: xây dựng tập dữ liệu tin nhắn rác và tin nhắn thường bằng tiếng Việt, phân tích mức độ ảnh hưởng của độ dài tin nhắn đến hiệu quả của các mô hình phát hiện, và đề xuất phương pháp phù hợp với đặc thù đa biến thể của tiếng Việt. Đối tượng nghiên cứu là các phương pháp phát hiện tin nhắn rác tiếng Việt, với khách thể là các tin nhắn rác được phát tán đến người dùng dịch vụ di động.
Phương pháp nghiên cứu bao gồm thu thập và chuẩn bị dữ liệu, nghiên cứu lý thuyết, triển khai thực nghiệm và đánh giá kết quả dựa trên các tiêu chí như Accuracy, Precision, Recall và F1 Score. Luận án đã đạt được các kết quả quan trọng: xây dựng thành công bộ dữ liệu tin nhắn rác và tin nhắn thường tiếng Việt, phân tích chi tiết mức độ phụ thuộc của hiệu quả mô hình vào độ dài tin nhắn và đề xuất mô hình ổn định, đồng thời đề xuất hai hướng tiếp cận để giải quyết bài toán phát hiện tin nhắn rác với đặc điểm đa biến thể của tiếng Việt. Các thí nghiệm đã được thực hiện với các mô hình học máy truyền thống và học sâu (CNN, LSTM kết hợp với các kỹ thuật vector hóa văn bản như Word2Vec, GloVe, FastText, PhoBERT, và BERT NER), cho thấy mô hình CNN với học sâu là hiệu quả nhất trong điều kiện nội dung giới hạn.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên