Tên luận án:
MÁY HỌC TRONG PHÂN TÍCH DỮ LIỆU Y KHOA
Ngành:
Hệ thống thông tin (Mã ngành: 9480104)
Tóm tắt nội dung tài liệu:
Luận án này tập trung vào việc ứng dụng máy học để cải thiện chẩn đoán trong lĩnh vực y khoa, đặc biệt là trong dự đoán nhịp tim và phân loại ảnh X-quang ngực (CXR). Nghiên cứu giải quyết những hạn chế của chẩn đoán truyền thống và thách thức về dữ liệu y tế có nhãn. Luận án đề xuất các phương pháp mới nhằm phát triển mô hình dự đoán nhịp tim hiệu quả và nâng cao độ chính xác trong phân lớp ảnh CXR, bao gồm cả bài toán đa lớp và đa nhãn.
Cụ thể, luận án đã đóng góp các điểm chính sau:
- Phát triển mô hình dự đoán nhịp tim sử dụng dữ liệu từ thiết bị đeo thông minh Mi Band 4 và các thuật toán học sâu. Mô hình Bi-GRU đã đạt hiệu quả cao nhất với giá trị MAE thấp nhất là 3,37, cho thấy tiềm năng ứng dụng thực tế trong việc cảnh báo sớm các vấn đề tim mạch.
- Đề xuất phương pháp mới SSLnC kết hợp học tự giám sát với các thuật toán máy học để phân lớp ảnh CXR đa lớp. Phương pháp này giúp giảm sự phụ thuộc vào dữ liệu có nhãn, nâng cao hiệu quả phân lớp bệnh phổi từ 1,5% đến 4,6%.
- Giới thiệu thuật toán mới RF-BMT (Rừng ngẫu nhiên với cây có lề lớn nhất) và kết hợp nó với mô hình học tự giám sát để phân lớp ảnh CXR đa lớp. Thuật toán này đạt độ chính xác 86,2% chỉ với 3.467 ảnh có nhãn, vượt trội so với mô hình huấn luyện tầng phân lớp trên toàn bộ 69.297 ảnh (đạt 84,8%).
- Mở rộng nghiên cứu phân lớp ảnh CXR sang bài toán đa nhãn bằng cách sử dụng học tự giám sát và tinh chỉnh mô hình trên các kiến trúc như ResNet, SwinT, LSwinT. Kết quả cho thấy sự cải thiện đáng kể về chỉ số AUC từ 0,027 đến 0,054 so với mô hình cơ sở, đồng thời kiến trúc LSwinT giúp giảm thời gian huấn luyện mà vẫn duy trì hiệu quả phân lớp.
Những đóng góp này không chỉ cải thiện chất lượng chăm sóc sức khỏe mà còn tối ưu hóa quy trình chẩn đoán, nâng cao hiệu quả hệ thống y tế, đặc biệt trong bối cảnh dữ liệu y tế có nhãn khan hiếm.