info@luanan.net.vn
Luận án DOC

Luận án Áp dụng các phương pháp giải tích và tối ưu toán học vào phân lớp nhị phân và phân đoạn hình ảnh trong học máy

Năm2023
Lĩnh vựcKhoa học tự nhiên
Ngôn ngữTiếng Anh, Tiếng Việt

Mô tả tài liệu

Tên luận án:

ÁP DỤNG CÁC PHƯƠNG PHÁP GIẢI TÍCH VÀ TỐI ƯU TOÁN HỌC VÀO PHÂN LỚP NHỊ PHÂN VÀ PHÂN ĐOẠN HÌNH ẢNH TRONG HỌC MÁY

Ngành:

Toán học

Tóm tắt nội dung tài liệu:

Luận án này tập trung vào việc ứng dụng các phương pháp giải tích và tối ưu toán học để giải quyết các vấn đề cốt lõi trong phân lớp nhị phân và phân đoạn hình ảnh trong học máy. Mục tiêu chính là làm rõ các tính chất toán học của các hệ thống AI và cải thiện hiệu quả của chúng.

Đối với phân lớp nhị phân, nghiên cứu đi sâu vào các thước đo độ chính xác phổ biến như diện tích dưới đường cong ROC (AUC ROC), độ chính xác cân bằng tối đa (MBA) và độ chính xác có trọng số tối đa (MWA). Luận án đã thiết lập các bất đẳng thức liên hệ giữa các thước đo này, chứng minh chúng tương đương về mặt tô-pô và có thể thay thế cho nhau trong đánh giá hiệu quả máy học. Đồng thời, công trình cũng chứng minh tính tối ưu của máy xác suất thực và tính lồi của đường cong ROC của chúng, cung cấp cơ sở lý thuyết cho việc sử dụng các máy này trong thực tế.

Nghiên cứu cũng khám phá ảnh hưởng của các hàm mất mát đến bài toán phân loại nhị phân. Luận án chỉ ra rằng hàm mất mát bình phương và hàm cross-entropy nhị phân là các hàm mất mát tự nhiên nhất, và các máy làm tối thiểu hóa chúng chính là các máy xác suất thực. Hơn nữa, các hàm mất mát siêu lồi cũng dẫn đến các nghiệm cực tiểu là các máy tối ưu về độ chính xác thông qua biến đổi tham số của máy xác suất thực. Tính lồi của hàm mất mát được nhấn mạnh là một yếu tố quan trọng để tránh rơi vào các bẫy trong quá trình học máy.

Trong lĩnh vực phân đoạn hình ảnh, luận án đề xuất một phương pháp biểu quyết mới gọi là biểu quyết tô-pô, cùng với các biến thể như biểu quyết tô-pô địa phương và kết hợp. Phương pháp này được chứng minh là hợp lý và qua các thí nghiệm thực tế trên các bài toán phân đoạn khuôn mặt người, muối trong ảnh địa chấn và mạch máu trong ảnh võng mạc, đã cho thấy kết quả vượt trội so với phương pháp biểu quyết số học cổ điển. Luận án đã công bố 4 bài báo khoa học liên quan, trong đó có các bài trên tạp chí ISI và Scopus.

Mục lục chi tiết:

  • Chương 1: Kiến thức chuẩn bị.

    • Mô hình chung của quá trình học máy.
    • Dữ liệu cho máy học.
    • Các “đặc trưng” trong học máy.
    • Kiểm tra hiệu quả của máy.
    • Tối ưu dựa trên Gradient.
    • Phép tích chập và mạng thần kinh tích chập.
  • Chương 2: Độ chính xác của máy phân loại nhị phân.

    • Các bất đẳng thức liên hệ các thước đo độ chính xác: diện tích của miền nằm dưới đường ROC (AUC ROC), độ chính xác cân bằng cao nhất (MBA) và độ chính xác có trọng cao nhất (MWA). Các bất đẳng thức này cho thấy ba thước đo đó có thể dùng thay thế cho nhau để đánh giá độ chính xác của một máy phân loại nhị phân.
    • Tính tối ưu của máy xác suất thực, tính lồi của đường ROC của máy xác suất thực. Kết quả này giúp hiểu vì sao các đường ROC của các máy phân loại nhị phân mà chúng ta gặp trong các công bố trên thế giới nói chung có dáng điệu gần lồi.
    • Công thức về giới hạn tác dụng của phương pháp biểu quyết trong việc tăng cường độ chính xác của máy phân loại nhị phân, cho thấy dù số máy tham dự bỏ phiếu có tiến tới vô cùng thì độ chính xác qua việc bỏ phiếu cũng không kỳ vọng tăng đến 100%.
  • Chương 3: Ảnh hưởng của hàm mất mát đến các bài toán phân loại nhị phân.

    • Trong phân lớp nhị phân, hàm mất mát bình phương và hàm cross-entropy là hai hàm mất mát mà các máy làm tối thiểu hóa mất mát theo các hàm đó chính là các máy xác suất thực.
    • Các hàm mất mát siêu-lồi cũng dẫn đến các nghiệm cực tiểu là các máy tối ưu về độ chính xác. Các máy đó chính là các biến đổi tham số của các máy xác suất thực.
    • Tính chất lồi của hàm mất mát là tính chất quan trọng, nếu thiếu nó thì quá trình học máy có thể bị rơi vào các bẫy.
  • Chương 4: Tối ưu hóa phân đoạn hình ảnh bằng biểu quyết tô-pô.

    • Đưa ra một phương pháp biểu quyết mới, gọi là biểu quyết tô-pô. Phương pháp này bao gồm các dạng: biểu quyết tô-pô ở dạng đơn giản nhất, biểu quyết tô-pô địa phương, biểu quyết kết hợp cả tô-pô và số học.
    • Chứng minh tại sao phương pháp biểu quyết tô-pô lại hợp lý và cho kết quả tốt hơn phương pháp biểu quyết số học cổ điển trong nhiều trường hợp.
    • Xây dựng nhiều mô hình học máy cho ba vấn đề phân đoạn hình ảnh khác nhau (bài toán đóng khung mặt người trên ảnh, bài toán phân đoạn muối trong ảnh địa chấn và bài toán phân đoạn mạch máu trong ảnh võng mạc). Các thống kê kết quả cho thấy phương pháp biểu quyết tô-pô cho kết quả vượt trội hơn phương pháp biểu quyết số học cổ điển.

Tài liệu liên quan