info@luanan.net.vn
VIP Luận án PDF

Luận án Nghiên cứu, phát triển một số phương pháp khai phá dữ liệu trên dữ liệu có cấu trúc

Năm2020
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh
Xem trước tài liệu
Đang tải...

Đang tải tài liệu...

Mô tả tài liệu

Tên luận án:

NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU TRÊN DỮ LIỆU CÓ CẤU TRÚC

Ngành:

Hệ thống thông tin (Mã số: 09.48.01.04)

Tóm tắt nội dung tài liệu:

Luận án tập trung giải quyết các thách thức trong khai phá dữ liệu lớn, nhằm mục tiêu tăng giá trị và tốc độ xử lý dữ liệu, vốn thường gặp phải độ phức tạp tính toán hàm mũ và chi phí cao. Nghiên cứu sinh đã phát triển một số phương pháp khai phá dữ liệu trên dữ liệu có cấu trúc, bao gồm cả dạng bảng và dạng đồ thị.

Đối với dữ liệu dạng bảng, luận án đề xuất các phương pháp giảm dư thừa dữ liệu, rút gọn thuộc tính và rút gọn đối tượng. Cụ thể, nghiên cứu đã thành công trong việc tìm một rút gọn thuộc tính không heuristic trong thời gian đa thức và một rút gọn đối tượng trong thời gian đa thức, đồng thời bảo toàn khả năng tìm tất cả các rút gọn thuộc tính. Ngoài ra, một phương pháp cải tiến để sinh cây quyết định đã được phát triển, chứng minh có tốc độ thực hiện nhanh hơn đáng kể so với thuật toán ID3 truyền thống.

Đối với dữ liệu dạng đồ thị, luận án giải quyết bài toán khai phá đồ thị con thường xuyên đóng và phân loại đồ thị đa nhãn. Nghiên cứu sinh đã đề xuất thuật toán PSI-CFSM để khai phá đồ thị con thường xuyên đóng, giải quyết vấn đề đẳng cấu đồ thị con trong thời gian đa thức thông qua việc áp dụng nhãn chuẩn hóa và mô hình máy truy cập ngẫu nhiên. Đối với phân loại đa nhãn đồ thị, luận án xây dựng dàn giao khái niệm dựa trên tập đồ thị con thường xuyên đóng và đề xuất độ đo khoảng cách trên dàn giao này, kết hợp với lý thuyết Dempster-Shafer để phân loại. Các phương pháp này tăng độ chính xác phân loại và giảm thời gian tính toán, đặc biệt hiệu quả với các đồ thị không có biểu diễn véctơ. Các đề xuất trong luận án đều được chứng minh tính đúng đắn, đầy đủ và được kiểm nghiệm thực tế, cho thấy hiệu quả vượt trội so với các thuật toán hiện có như gSpan.

Mục lục chi tiết:

  • 1 KIẾN THỨC CHUẨN BỊ

    • 1.1 Lý thuyết cơ sở dữ liệu quan hệ
    • 1.2 Lý thuyết tập thô
    • 1.3 Lý thuyết đồ thị
    • 1.4 Tập có thứ tự và dàn giao (lattices)
    • 1.5 Phân tích khái niệm chính thức (FCA)
    • 1.6 Biến đổi và đồng biến đổi Mobius
    • 1.7 Lý thuyết Dempster-Shafer
  • 2 KHAI PHÁ DỮ LIỆU DẠNG BẢNG

    • 2.1 Rút gọn thuộc tính không heuristic
    • 2.2 Rút gọn đối tượng bảng quyết định nhất quán
    • 2.3 Xây dựng cây quyết định từ bảng rút gọn
  • 3 KHAI PHÁ DỮ LIỆU ĐỒ THỊ

    • 3.1 Khai phá đồ thị con thường xuyên đóng
    • 3.2 Phân loại đa nhãn cho đồ thị

Tài liệu liên quan