Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN LỖ HỒNG MÃ NGUỒN DỰA TRÊN ĐỒ THỊ ĐẶC TRƯNG MÃ
Kỹ thuật máy tính
Luận án này tập trung vào việc nghiên cứu và phát triển phương pháp phát hiện lỗ hổng mã nguồn hiệu quả, đặc biệt trong môi trường mã nguồn C/C++ và trên các bộ dữ liệu mất cân bằng. Công trình nhận định rằng việc đảm bảo chất lượng phần mềm đòi hỏi khả năng đánh giá và phát hiện lỗ hổng chính xác, vốn phụ thuộc vào hai bước chính: trích xuất và phân loại đặc trưng mã nguồn.
Để nâng cao độ chính xác, luận án đề xuất cải tiến cả hai quá trình này. Về trích xuất đặc trưng, phương pháp dựa trên đồ thị đặc trưng mã nguồn (CPG) được lựa chọn do khả năng biểu diễn mối quan hệ phức tạp và độ chính xác cao của mã nguồn. Về phân loại, luận án giải quyết vấn đề các phương pháp hiện tại chưa hiệu quả với bộ dữ liệu mất cân bằng.
Mục tiêu chính là phát triển một mô hình mới giúp nâng cao độ chính xác và khắc phục những khó khăn trong trích xuất, lựa chọn và phân loại mã nguồn. Phạm vi nghiên cứu bao gồm lý thuyết nền tảng, các phương pháp biểu diễn, phân tích và phát hiện lỗ hổng trong mã nguồn C/C++, dựa trên các nghiên cứu trong và ngoài nước. Luận án kết hợp nghiên cứu lý thuyết (về phát hiện lỗ hổng, học máy, học sâu, khảo sát giải pháp) và thực nghiệm (khảo sát, lựa chọn, thử nghiệm và so sánh các mô hình trên tập dữ liệu lỗ hổng).
Luận án đóng góp hai điểm chính. Thứ nhất, đề xuất phương pháp kết hợp RoBERTa và GCN để trích xuất các đặc trưng quan trọng từ CPG, cùng với kỹ thuật cân bằng dữ liệu BDC (dựa trên phân phối Bernoulli trong tầng Dropout của mạng CNN) nhằm nâng cao hiệu quả phân tích và phát hiện lỗ hổng. Thứ hai, giới thiệu hướng tiếp cận mới giữa mạng đồ thị học sâu GGNN trong trích xuất đặc trưng mã nguồn và phương pháp học tương phản, giúp cải thiện độ chính xác trong phát hiện lỗ hổng và mở ra tiềm năng ứng dụng cho các bài toán phân loại khác. Các kết quả thực nghiệm trên bộ dữ liệu Verum và FFmpeg+Qemu đã chứng minh hiệu quả của các mô hình đề xuất.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên