info@luanan.net.vn
Luận án PDF

Luận án Kỹ thuật học máy phối hợp và tiền xử lý dữ liệu trong việc nâng cao chất lượng phân lớp của các hệ thống phát hiện xâm nhập mạng

Năm2022
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh
Xem trước tài liệu
Đang tải...

Đang tải tài liệu...

Mô tả tài liệu

Tên luận án:

KỸ THUẬT HỌC MÁY PHỐI HỢP VÀ TIỀN XỬ LÝ DỮ LIỆU TRONG VIỆC NÂNG CAO CHẤT LƯỢNG PHÂN LỚP CỦA CÁC HỆ THỐNG PHÁT HIỆN XÂM NHẬP MẠNG

Ngành:

Khoa học máy tính (Mã số ngành: 9480101)

Tóm tắt nội dung tài liệu:

Luận án này tập trung nghiên cứu và đề xuất các giải pháp nhằm nâng cao chất lượng phân lớp của các Hệ thống phát hiện xâm nhập mạng (IDS), đặc biệt là cải thiện độ chính xác và giảm tỷ lệ cảnh báo sai trong bối cảnh tài nguyên tính toán hạn chế. Vấn đề tấn công mạng ngày càng gia tăng và phức tạp, trong khi các IDS truyền thống và cả các IDS dựa trên học máy hiện tại vẫn đối mặt với thách thức về tốc độ, thời gian tính toán, độ chính xác và khả năng phát hiện các cuộc tấn công mới, cũng như xử lý dữ liệu lớn và mất cân bằng.

Để giải quyết những thách thức này, luận án đã đạt được ba đóng góp chính. Thứ nhất, đề xuất hai kỹ thuật cải tiến về lựa chọn thuộc tính là mFFC (cải tiến từ FFC) và mBFE (cải tiến từ BFE). Các thuật toán này kết hợp xếp hạng thuộc tính và xem xét sự tương quan giữa các thuộc tính, giúp giảm độ phức tạp thời gian từ O(N!) xuống O(N*(N-1)/2), đồng thời loại bỏ các thuộc tính không liên quan hoặc dư thừa, từ đó giảm thời gian huấn luyện, kiểm tra và nâng cao độ chính xác phân lớp. Thứ hai, cải tiến các kỹ thuật tăng mẫu (oversampling) và giảm mẫu (undersampling) để xử lý hiệu quả vấn đề mất cân bằng dữ liệu trong các tập dữ liệu huấn luyện của IDS, qua đó cải thiện chất lượng phân lớp của hệ thống. Thứ ba, đề xuất phương pháp xây dựng mô hình phân lớp lai trên cơ sở sử dụng các kỹ thuật lấy mẫu lại tập dữ liệu và lựa chọn thuộc tính đã cải tiến, kết hợp với kỹ thuật phân lớp phối hợp (ensemble).

Các thực nghiệm trên tập dữ liệu UNSW-NB15 – một tập dữ liệu hiện đại và phức tạp với nhiều kiểu tấn công – đã chứng minh hiệu quả của các giải pháp đề xuất. Kết quả cho thấy các kỹ thuật lựa chọn thuộc tính và lấy mẫu lại cải tiến giúp cải thiện đáng kể chỉ số F-Measure, đặc biệt đối với các kiểu tấn công phức tạp như Shellcode, Analysis, Recce, Fuzzers và Generic. Mô hình phân lớp lai đề xuất cũng đạt được chất lượng phân lớp tốt hơn so với các bộ phân lớp đơn lẻ và nhiều nghiên cứu gần đây, cung cấp cơ sở quan trọng giúp các nhà quản trị mạng phát hiện sớm và ứng phó hiệu quả với các nguy cơ xâm nhập.

Mục lục chi tiết:

  • CHƯƠNG 1. GIỚI THIỆU
    • 1.1 Hệ thống phát hiện xâm nhập
      • 1.1.1 Giới thiệu về IDS.
      • 1.1.2 Phân loại IDS.
      • 1.1.3 IDS sử dụng kỹ thuật học máy
    • 1.2 Tính cấp thiết của đề tài luận án
    • 1.3 Mục tiêu nghiên cứu
    • 1.4 Đối tượng và phạm vi nghiên cứu
      • 1.4.1 Đối tượng nghiên cứu.
      • 1.4.2 Phạm vi nghiên cứu
    • 1.5 Phương pháp nghiên cứu
    • 1.6 Ý nghĩa khoa học và thực tiễn
      • 1.6.1 Ý nghĩa khoa học.
      • 1.6.2 Ý nghĩa thực tiễn
    • 1.7 Những điểm đóng góp mới
    • 1.8 Kết cấu của luận án.
  • CHƯƠNG 2. CÁC NGHIÊN CỨU LIÊN QUAN
    • 2.1 Lựa chọn thuộc tính
    • 2.2 Cân bằng dữ liệu giữa các lớp
    • 2.3 Kỹ thuật học máy phối hợp
      • 2.3.1 Phối hợp đồng nhất.
      • 2.3.2 Phối hợp không đồng nhất.
    • 2.4 Tập dữ liệu sử dụng cho các IDS.
    • 2.5 Chỉ số đánh giá hiệu năng các IDS
    • 2.6 Nhận xét.
  • CHƯƠNG 3. GIẢI PHÁP LỰA CHỌN THUỘC TÍNH
    • 3.1 Giải pháp lựa chọn thuộc tính đề xuất...
      • 3.1.1 Thuật toán loại bỏ thuộc tính ngược BFE
      • 3.1.2 Thuật toán chọn thuộc tính thuận FFC
      • 3.1.3 Thuật toán lựa chọn thuộc tính đề xuất
    • 3.2 Kết quả thực hiện.
  • CHƯƠNG 4. GIẢI PHÁP LẤY MẪU LẠI TẬP DỮ LIỆU.
    • 4.1 Giải pháp lấy mẫu lại tập dữ liệu đề xuất.
      • 4.1.1 Giải pháp tăng mẫu.
      • 4.1.2 Giải pháp giảm mẫu.
    • 4.2 Kết quả thực hiện.
      • 4.2.1 Tăng mẫu tập dữ liệu
      • 4.2.2 Giảm mẫu tập dữ liệu
    • 4.3 Một số nhận xét, kết luận về giải pháp lấy mẫu lại tập dữ liệu
  • CHƯƠNG 5. KỸ THUẬT PHỐI HỢP CHO MÔ HÌNH IDS
    • 5.1 Kỹ thuật phối hợp đề xuất
    • 5.2 Kết quả thực hiện.
    • 5.3 Mô hình phân lớp lai đề xuất.
  • CHƯƠNG 6. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN.

Tài liệu liên quan