info@luanan.net.vn
Luận án DOC

Luận án Nâng cao hiệu năng phân lớp dữ liệu trên cơ sở cải tiến thuật toán SVM

Năm2023
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

NÂNG CAO HIỆU NĂNG PHÂN LỚP DỮ LIỆU TRÊN CƠ SỞ CẢI TIẾN THUẬT TOÁN SVM

Ngành:

KHOA HỌC MÁY TÍNH

Tóm tắt nội dung tài liệu:

Luận án tập trung nghiên cứu và đề xuất các giải pháp nhằm nâng cao hiệu năng phân lớp dữ liệu, đặc biệt đối với dạng dữ liệu có cấu trúc phức tạp, trên cơ sở cải tiến thuật toán SVM. SVM là một kỹ thuật phân loại giám sát nổi tiếng, tuy nhiên, các biến thể hiện có chưa khai thác đầy đủ thông tin về số lượng điểm dữ liệu và cấu trúc của từng cụm trong mỗi lớp, điều này ảnh hưởng đến độ chính xác và thời gian phân lớp.

Luận án đã làm sáng tỏ tư tưởng toán học của SVM là tìm cách tách các lớp dữ liệu bằng một siêu phẳng có khoảng cách lớn nhất đến các tập dữ liệu, sử dụng quy tắc nhân tử Lagrange. Các phương pháp nghiên cứu bao gồm phương pháp toán học (nhân tử Lagrange, hệ KKT, bình phương tối thiểu) và các phương pháp xử lý dữ liệu có nhiều cụm (khai thác lớp-đối-cụm, khai thác cụm-đối-lớp), cùng với thực nghiệm khoa học.

Các đóng góp chính của luận án bao gồm việc đề xuất các thuật toán phân lớp nhị phân cho dữ liệu có cấu trúc phức tạp sử dụng chiến lược lớp-đối-cụm (WS-SVM và ILS-SVM) và chiến lược cụm-đối-lớp (WLS-SVM). Cụ thể, Chương 3 giới thiệu WS-SVM và ILS-SVM, trong đó WS-SVM khai thác thông tin cấu trúc theo cụm và giải bằng bài toán đối ngẫu, còn ILS-SVM sử dụng bình phương tối thiểu. Chương 4 trình bày WLS-SVM, một biến thể của S-TSVM sử dụng chiến lược cụm-đối-lớp và bình phương tối thiểu, bao gồm hai bước: phân cụm trong mỗi lớp bằng phương pháp liên kết của Ward và huấn luyện mô hình.

Kết quả cho thấy, phương pháp cụm-đối-lớp, đặc biệt là WLS-SVM, tỏ ra hiệu quả hơn trong mô phỏng xu hướng phân phối của các cụm và đạt độ chính xác cao hơn trong phân loại đối với các bài toán có dữ liệu lớn và mỗi lớp chứa nhiều cụm có xu hướng phân phối khác nhau. Luận án có ý nghĩa khoa học và thực tiễn, có thể giải quyết các bài toán phân lớp với dữ liệu phức tạp hoặc không cân bằng, và có thể được sử dụng làm tài liệu tham khảo cho cộng đồng nghiên cứu.

Mục lục chi tiết:

  • Chương 1: là kiến thức bổ trợ về bài toán Quy hoạch toàn phương QP và cơ sở toán học của thuật toán SVM.
  • Chương 2: là các cải tiến tiêu biểu của SVM được trình bày một cách ngắn gọn, các kết quả có cách tiếp cận sử dụng hai siêu phẳng để phân loại hai lớp dữ liệu.
  • Chương 3: là phương pháp lớp-đối-cụm với hai thuật toán mới: SVM có cấu trúc có trọng số (được gọi là WS-SVM) và Cải tiến của SVM dùng bình phương tối thiểu (được gọi là ILS-SVM).
  • Chương 4: là chiến lược cụm-đối-lớp với thuật toán mới: SVM dùng bình phương tối thiểu có trọng số (được gọi là WLS-SVM).

Tài liệu liên quan