Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
NÂNG CAO HIỆU NĂNG PHÂN LỚP DỮ LIỆU TRÊN CƠ SỞ CẢI TIẾN THUẬT TOÁN SVM
KHOA HỌC MÁY TÍNH
Luận án tập trung nghiên cứu và đề xuất các giải pháp nhằm nâng cao hiệu năng phân lớp dữ liệu, đặc biệt đối với dạng dữ liệu có cấu trúc phức tạp, trên cơ sở cải tiến thuật toán SVM. SVM là một kỹ thuật phân loại giám sát nổi tiếng, tuy nhiên, các biến thể hiện có chưa khai thác đầy đủ thông tin về số lượng điểm dữ liệu và cấu trúc của từng cụm trong mỗi lớp, điều này ảnh hưởng đến độ chính xác và thời gian phân lớp.
Luận án đã làm sáng tỏ tư tưởng toán học của SVM là tìm cách tách các lớp dữ liệu bằng một siêu phẳng có khoảng cách lớn nhất đến các tập dữ liệu, sử dụng quy tắc nhân tử Lagrange. Các phương pháp nghiên cứu bao gồm phương pháp toán học (nhân tử Lagrange, hệ KKT, bình phương tối thiểu) và các phương pháp xử lý dữ liệu có nhiều cụm (khai thác lớp-đối-cụm, khai thác cụm-đối-lớp), cùng với thực nghiệm khoa học.
Các đóng góp chính của luận án bao gồm việc đề xuất các thuật toán phân lớp nhị phân cho dữ liệu có cấu trúc phức tạp sử dụng chiến lược lớp-đối-cụm (WS-SVM và ILS-SVM) và chiến lược cụm-đối-lớp (WLS-SVM). Cụ thể, Chương 3 giới thiệu WS-SVM và ILS-SVM, trong đó WS-SVM khai thác thông tin cấu trúc theo cụm và giải bằng bài toán đối ngẫu, còn ILS-SVM sử dụng bình phương tối thiểu. Chương 4 trình bày WLS-SVM, một biến thể của S-TSVM sử dụng chiến lược cụm-đối-lớp và bình phương tối thiểu, bao gồm hai bước: phân cụm trong mỗi lớp bằng phương pháp liên kết của Ward và huấn luyện mô hình.
Kết quả cho thấy, phương pháp cụm-đối-lớp, đặc biệt là WLS-SVM, tỏ ra hiệu quả hơn trong mô phỏng xu hướng phân phối của các cụm và đạt độ chính xác cao hơn trong phân loại đối với các bài toán có dữ liệu lớn và mỗi lớp chứa nhiều cụm có xu hướng phân phối khác nhau. Luận án có ý nghĩa khoa học và thực tiễn, có thể giải quyết các bài toán phân lớp với dữ liệu phức tạp hoặc không cân bằng, và có thể được sử dụng làm tài liệu tham khảo cho cộng đồng nghiên cứu.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên