Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
Đang tải tài liệu...
NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU TRÊN DỮ LIỆU CÓ CẤU TRÚC
Hệ thống thông tin (Mã số: 09.48.01.04)
Luận án tập trung giải quyết các thách thức trong khai phá dữ liệu lớn, nhằm mục tiêu tăng giá trị và tốc độ xử lý dữ liệu, vốn thường gặp phải độ phức tạp tính toán hàm mũ và chi phí cao. Nghiên cứu sinh đã phát triển một số phương pháp khai phá dữ liệu trên dữ liệu có cấu trúc, bao gồm cả dạng bảng và dạng đồ thị.
Đối với dữ liệu dạng bảng, luận án đề xuất các phương pháp giảm dư thừa dữ liệu, rút gọn thuộc tính và rút gọn đối tượng. Cụ thể, nghiên cứu đã thành công trong việc tìm một rút gọn thuộc tính không heuristic trong thời gian đa thức và một rút gọn đối tượng trong thời gian đa thức, đồng thời bảo toàn khả năng tìm tất cả các rút gọn thuộc tính. Ngoài ra, một phương pháp cải tiến để sinh cây quyết định đã được phát triển, chứng minh có tốc độ thực hiện nhanh hơn đáng kể so với thuật toán ID3 truyền thống.
Đối với dữ liệu dạng đồ thị, luận án giải quyết bài toán khai phá đồ thị con thường xuyên đóng và phân loại đồ thị đa nhãn. Nghiên cứu sinh đã đề xuất thuật toán PSI-CFSM để khai phá đồ thị con thường xuyên đóng, giải quyết vấn đề đẳng cấu đồ thị con trong thời gian đa thức thông qua việc áp dụng nhãn chuẩn hóa và mô hình máy truy cập ngẫu nhiên. Đối với phân loại đa nhãn đồ thị, luận án xây dựng dàn giao khái niệm dựa trên tập đồ thị con thường xuyên đóng và đề xuất độ đo khoảng cách trên dàn giao này, kết hợp với lý thuyết Dempster-Shafer để phân loại. Các phương pháp này tăng độ chính xác phân loại và giảm thời gian tính toán, đặc biệt hiệu quả với các đồ thị không có biểu diễn véctơ. Các đề xuất trong luận án đều được chứng minh tính đúng đắn, đầy đủ và được kiểm nghiệm thực tế, cho thấy hiệu quả vượt trội so với các thuật toán hiện có như gSpan.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên