info@luanan.net.vn
VIP Luận án PDF

Luận án Nâng cao hiệu quả mô hình học máy cho dữ liệu y sinh

Năm2023
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh
Xem trước tài liệu
Đang tải...

Đang tải tài liệu...

Mô tả tài liệu

Tên luận án:

NÂNG CAO HIỆU QUẢ MÔ HÌNH HỌC MÁY CHO DỮ LIỆU Y SINH

Ngành:

Khoa học máy tính

Mã số ngành: 9480101

Tóm tắt nội dung tài liệu:

Tính toán y sinh là một lĩnh vực nghiên cứu liên ngành giữa y học và khoa học máy tính, ứng dụng các phương pháp phân tích dữ liệu, học máy, thống kê và lý thuyết thông tin để giải quyết các vấn đề y sinh như phát hiện, chẩn đoán bệnh, thiết kế thuốc và nghiên cứu sinh học phân tử. Tuy nhiên, việc xây dựng mô hình học máy hiệu quả cho dữ liệu y sinh gặp nhiều thách thức do đặc điểm dữ liệu phức tạp: dữ liệu sinh học phân tử thường có cấu trúc chuỗi dài, cơ chế sinh học phức tạp và khối lượng lớn, trong khi dữ liệu lâm sàng thường bị phân mảnh, trùng lặp, thiếu và mất cân bằng lớp.

Luận án này tập trung đề xuất các phương pháp tiếp cận mới nhằm nâng cao hiệu quả mô hình học máy cho dữ liệu y sinh. Mục tiêu chính là giải quyết các thách thức trong việc xử lý hai loại dữ liệu: dữ liệu sinh học phân tử và dữ liệu khám bệnh cận lâm sàng, ứng dụng vào các bài toán dự đoán nguồn gốc loài sinh vật, hỗ trợ điều chế vắc xin/thuốc và chuẩn đoán bệnh.

Cụ thể, luận án đã thực hiện ba nhiệm vụ chính. Thứ nhất, thiết kế mô hình học máy hiệu quả cho dữ liệu sinh học phân tử trong các nhiệm vụ xác định gene cho biểu hiện, ứng dụng trong phát triển thuốc, thông qua việc giảm chiều dữ liệu bằng chỉ số RSCU. Thứ hai, xây dựng mô hình học máy để định danh loài sinh vật bằng cách trích xuất thông tin gene sử dụng phương pháp K-mer, áp dụng cho 17 loài nấm mối và đạt độ chính xác cao (91% với AUROC 99%). Thứ ba, phát triển mô hình học máy hiệu quả cho chuẩn đoán bệnh dựa trên dữ liệu lâm sàng, giải quyết vấn đề dữ liệu lỗi và chọn lọc thuộc tính quan trọng bằng cách kết hợp các thuật toán Boosting (LightGBM và XGBoost) để dự đoán bệnh CoViD-19 và cúm, đạt độ chính xác lên đến 99,85%. Các giải pháp này đã góp phần cải thiện đáng kể độ chính xác và khả năng giải thích của các mô hình dự đoán trong lĩnh vực y sinh.

Mục lục chi tiết:

  • CHƯƠNG 1. TỔNG QUAN

    • 1.1 TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU

      • 1.1.1 Giới thiệu
      • 1.1.2 Bài toán nghiên cứu
      • 1.1.3 Thách thức của bài toán nghiên cứu
    • 1.2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI VÀ PHƯƠNG PHÁP NGHIÊN CỨU

      • 1.2.1 Mục tiêu
      • 1.2.2 Phạm vi nghiên cứu tập trung vào:
    • 1.3 NHIỆM VỤ CỦA LUẬN ÁN.

      • 1.3.1 Thiết kế mô hình học máy hiệu quả cho dữ liệu sinh học phân tử trong các nhiệm vụ ứng dụng trong phát triển thuốc bằng kỹ thuật tái tổ hợp
      • 1.3.2 Mô hình học máy hiệu quả cho dữ liệu sinh học phân tử trong các nhiệm vụ định danh loài sinh vật.
      • 1.3.3 Mô hình học máy hiệu quả trong các ứng dụng y sinh về chuẩn đoán bệnh dựa trên dữ liệu lâm sàng.
    • 1.4 CÁC ĐÓNG GÓP CỦA LUẬN ÁN.
    • 1.5 BỐ CỤC CỦA LUẬN ÁN.
  • CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ CÁC CÔNG TRÌNH LIÊN QUAN

    • 2.1 CÁC KHÁI NIỆM TRONG Y SINH
    • 2.2 CÁC NGHIÊN CỨU LIÊN QUAN CÓ SỬ DỤNG THUẬT TOÁN HỌC MÁY DÙNG TRONG CÁC BÀI TOÁN ĐỀ XUẤT.

      • 2.2.1 Các vấn đề về rút gọn chiều:
      • 2.2.2 Phương pháp học tập không giám sát
      • 2.2.3 Phương pháp học tập giám sát
      • 2.2.4 Phương pháp học máy học kết hợp
      • 2.2.5 Các thuật toán dùng trong luận án để giải quyết các vấn đề đã đặc ra trong dữ liệu y sinh..
    • 2.3 CÁC NGHIÊN CỨU LIÊN QUAN.
    • 2.4 DỮ LIỆU Y SINH ĐƯỢC SỬ DỤNG TRONG CÁC NHIỆM VỤ CỦA LUẬN ÁN
    • 2.5 ĐÁNH GIÁ MÔ HÌNH MÔ HÌNH HỌC MÁY.
  • CHƯƠNG 3. MÔ HÌNH HỌC MÁY TÌM GENE CHO HỆ THỐNG BIỂU HIỆN TRONG KỸ THUẬT DNA TÁI TỔ HỢP

    • 3.1 BÀI TOÁN TÌM GENE BIỂU HIỆN CAO (HEG- HIGHLY EXPRESSED GENE).

      • 3.1.1 Kết quả thực nghiệm.
    • 3.2 BÀI TOÁN TÌM HỆ THỐNG BIỂU HIỆN PHÙ HỢP VỚI GENE MỤC TIÊU [CT3]
  • CHƯƠNG 4. MÔ HÌNH ĐỊNH DANH LOÀI SINH VẬT.

    • 4.1 GIỚI THIỆU VỀ ĐỊNH DANH LOÀI
    • 4.2 XÂY DỰNG TẬP ĐỮ LIỆU CHO QUÁ TRÌNH HUẤN LUYỆN.
    • 4.3 THUẬT TOÁN ĐỀ XUẤT XÂY DỰNG MÔ HÌNH ĐỊNH DANH LOÀI DỰA TRÊN HỌC KẾT HỢP (ENSEMBLE LEARNING)
    • 4.4 MÔ HÌNH HỌC MÁY ĐỊNH DANH LOÀI NẤM MỐI.
    • 4.5 KẾT QUẢ THỰC NGHIỆM
    • 4.6 KẾT LUẬN:
  • CHƯƠNG 5. MÔ HÌNH HỌC MÁY CHO CHUẨN ĐOÁN BỆNH DỰA TRÊN DỮ LIỆU LÂM SÀNG.........

    • 5.1 MÔ HÌNH DỰ ĐOÁN BỆNH DỰA TRÊN DỮ LIỆU LÂM SÀN

      • 5.1.1 Giới thiệu bài toán dự đoán bệnh và mô hình đề xuất
      • 5.1.2 Kết quả thực nghiệm
    • 5.2 MÔ HÌNH PHÂN LOẠI BỆNH COVID-19 VÀ BỆNH CÚM MÙA.

      • 5.2.1 Giới thiệu bài toán và mô hình giải quyết.
      • 5.2.2 Hiệu năng của mô hình đề xuất.
    • 5.3 KẾT LUẬN.
  • CHƯƠNG 6. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

    • 6.1 KẾT LUẬN.
    • 6.2 HƯỚNG PHÁT TRIỂN

Tài liệu liên quan