PHÂN LOẠI MÃ ĐỘC ANDROID SỬ DỤNG HỌC SÂU
Kỹ thuật Máy tính
Luận án này tập trung giải quyết vấn đề phân loại mã độc trên hệ điều hành Android, một lĩnh vực có tầm quan trọng lớn do sự gia tăng nhanh chóng của mã độc và rủi ro đối với người dùng thiết bị di động. Bối cảnh nghiên cứu cho thấy Android thống trị thị trường di động, dẫn đến sự gia tăng mã độc và nhu cầu cấp thiết về các giải pháp phát hiện. Trong luận án, phương pháp phân tích tĩnh được ưu tiên để trích xuất đặc trưng.
Nghiên cứu khảo sát toàn diện các công trình liên quan từ năm 2019 đến năm 2022 về phát hiện và phân loại mã độc Android dựa trên học máy. Luận án đề xuất và triển khai một số phương pháp nhằm nâng cao hiệu quả phân loại. Cụ thể, trong giai đoạn trích xuất đặc trưng, luận án đề xuất các phương pháp tăng cường đặc trưng sử dụng ma trận đồng hiện (Co-matrix) và thuật toán Apriori để tạo ra các đặc trưng mới dựa trên mối quan hệ giữa các đặc trưng gốc, như quyền và lệnh gọi API. Đồng thời, một phương pháp lựa chọn đặc trưng mới dựa trên mức độ phổ biến và độ tương phản cũng được đề xuất để xác định các đặc trưng quan trọng.
Trong giai đoạn phân lớp, luận án áp dụng và đánh giá nhiều mô hình học máy truyền thống (SVM, RF, DT, KNN, NB) và các mô hình học sâu (DBN, CNN, LSTM, GAN, RNN). Đặc biệt, mô hình Deep and Wide CNN (WDCNN) được đề xuất và cải tiến, cho thấy nhiều ưu điểm trong việc nâng cao hiệu quả phân loại mã độc trên Android. Các phương pháp đề xuất được thực nghiệm trên các bộ dữ liệu điển hình như Drebin và AMD, chứng minh tính khả thi và hiệu quả. Ngoài ra, nghiên cứu cũng đề cập đến mô hình học tập liên kết, góp phần vào khả năng triển khai thực tế mặc dù không cải thiện đáng kể hiệu suất phân loại.
Những đóng góp chính của luận án bao gồm đề xuất phương pháp tăng cường đặc trưng bằng Apriori và Co-matrix, phương pháp lựa chọn đặc trưng mới, và mô hình WDCNN cải tiến với độ chính xác cao trong phân loại mã độc Android (đạt chỉ mục SCI Q3).