info@luanan.net.vn
VIP Luận án DOCX

Luận án Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ

Năm2023
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ

Ngành:

Khoa học máy tính

Tóm tắt nội dung tài liệu:

Trong bối cảnh số lượng ảnh kỹ thuật số tăng trưởng liên tục và phần lớn không được sắp xếp hay gắn thẻ, việc tra cứu ảnh nhanh chóng và chính xác trong các cơ sở dữ liệu ảnh lớn trở thành một nhiệm vụ đầy thách thức. Luận án này tập trung vào giải quyết bài toán quản lý thư viện ảnh, phân loại ảnh, nhận dạng đối tượng và tra cứu hình ảnh dựa trên nội dung (CBIR).

Mục tiêu chung của luận án là đề xuất các phương pháp tra cứu ảnh nhằm nâng cao độ chính xác. Cụ thể, nghiên cứu cải tiến phương pháp tra cứu ảnh bằng phương pháp ODLDA (Image Retrieval using the optimal distance and linear discriminant analysis) thông qua việc tìm một phép đo khoảng cách tối ưu, giảm khoảng cách giữa các cặp ảnh tương tự cao và tối đa hóa khoảng cách giữa các cặp ảnh tương tự thấp. Đồng thời, luận án đề xuất phương pháp tra cứu ảnh dựa trên lý thuyết cắt đồ thị mà không yêu cầu tính toán ma trận Laplacian, các giá trị riêng và véc tơ riêng.

Đối tượng nghiên cứu bao gồm tra cứu ảnh dựa trên nội dung bằng cách kết hợp khoảng cách tối ưu và phân tích phân biệt tuyến tính, được thực nghiệm trên tập dữ liệu ảnh Corel (10.800 ảnh) và SIMPLIcity (1.000 ảnh với 10 chủ đề). Phương pháp nghiên cứu bao gồm cả nghiên cứu lý thuyết và thực nghiệm, bao quát các khía cạnh như trích rút đặc trưng, đo khoảng cách, phân cụm, giảm khoảng cách ngữ nghĩa và đánh giá hiệu năng.

Những đóng góp chính của luận án bao gồm: nâng cao độ chính xác tra cứu ảnh thông qua xây dựng cơ sở dữ liệu véc tơ đặc trưng với mạng học sâu CNN AlexNet; đề xuất phương pháp ODLDA khai thác phản hồi người dùng, sử dụng phân tích phân biệt tuyến tính để điều chỉnh hàm trọng số của hàm khoảng cách Mahalanobis; và đề xuất phương pháp tra cứu ảnh hiệu quả sử dụng phân hoạch đồ thị (An efficient image retrieval method using a graph clustering-MGC) khai thác đầy đủ thông tin độ tương tự của tập ảnh. Kết quả thực nghiệm trên các cơ sở dữ liệu Corel và SIMPLIcity đã chứng minh rằng ODLDA và MGC cung cấp độ chính xác cao hơn đáng kể so với các phương pháp hiện có như Euclid, RCA, OASIS cải tiến, CRF và ERF.

Mục lục chi tiết:

  • PHẦN MỞ ĐẦU

    • 1. Tính cấp thiết của luận án
    • 2. Mục tiêu của luận án
      • Mục tiêu chung của luận án:
      • Mục tiêu cụ thể của luận án:
    • 3. Đối tượng nghiên cứu
    • 4. Phương pháp nghiên cứu của luận án
    • 5. Bố cục của luận án
    • 6. Kết quả và tính mới của luận án
  • Chương 1. TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG

    • 1.1. Giới thiệu
    • 1.2. Mô tả nội dung ảnh
      • 1.2.1. Không gian mầu
      • 1.2.2. Mô men mầu
      • 1.2.3. Biểu đồ mầu
      • 1.2.4. Biểu đồ mầu tương quan
      • 1.2.5. Đặc trưng màu
      • 1.2.6. Đặc trưng kết cấu.
      • 1.2.7. Đặc trưng Tamura
      • 1.2.8. Độ thô
      • 1.2.9. Độ tương phản
      • 1.2.10. Mô hình tự hồi quy đồng thời
      • 1.2.11. Bộ lọc Gabor
      • 1.2.12. Biến đổi Wavelet
      • 1.2.13. Đặc trưng hình dạng
      • 1.2.14. Mô men bất biến
      • 1.2.15. Góc quay
      • 1.2.16. Mô tả Fourier
      • 1.2.17. Tính tuần hoàn, độ lệch tâm và hướng trục chính
      • 1.2.18. Thông tin không gian
    • 1.3. Các kỹ thuật tương tự và các lược đồ lập chỉ mục
      • 1.3.1. Khoảng cách Minkowski
      • 1.3.2. Khoảng cách toàn phương
      • 1.3.3. Khoảng cách Mahalanobis
      • 1.3.4. Lập chỉ mục
    • 1.4. Tương tác người dùng
      • 1.4.1. Kỹ thuật truy vấn bởi phác thảo
      • 1.4.2. Phản hồi liên quan
      • 1.4.3. Đánh giá hiệu năng
    • 1.5. Giảm khoảng cách ngữ nghĩa
      • 1.5.1. Khái niệm
      • 1.5.2. Một số nghiên cứu theo hướng tiếp cận học có giám sát.
      • 1.5.3. Một số nghiên cứu theo hướng tiếp cận học không giám sát
    • 1.6. Phân tích phân biệt tuyến tính
      • 1.6.1. Phân tích phân biệt tuyến tính cho bài toán với hai lớp
        • 1.6.1.1 Ý tưởng cơ bản.
        • 1.6.1.2. Xây dựng hàm mục tiêu
    • 1.7 Kết luận chương 1
  • Chương 2: NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH DỰA TRÊN NỘI DUNG BẰNG CÁCH KẾT HỢP KHOẢNG CÁCH TỐI ƯU VÀ PHÂN TÍCH PHÂN BIỆT TUYẾN TÍNH

    • 2.1. Giới thiệu
    • 2.2. Nghiên cứu liên quan
    • 2.3. Đề xuất phương pháp phân hạng lại ảnh
      • 2.3.1. Sơ đồ của phương pháp đề xuất
      • 2.3.2. Tra cứu ảnh sử dụng học sâu
    • 2.4. Độ đo khoảng cách cải tiến .
    • 2.5. Thuật toán tra cứu ảnh
    • 2.6. Kết quả thực nghiệm
      • 2.6.1. Môi trường thực nghiệm
      • 2.6.2. Đánh giá thực nghiệm
    • 2.7. Kết luận chương 2
  • Chương 3. CẢI THIỆN HIỆU QUẢ CỦA TRA CỨU ẢNH DỰA TRÊN NỘI DUNG SỬ DỤNG PHÂN HOẠCH ĐỒ THỊ

    • 3.1. Nâng cao hiệu quả tra cứu ảnh dựa vào nội dung sử dụng phân hoạch đồ thị
      • 3.1.1. Giới thiệu
      • 3.1.2. Nghiên cứu liên quan:
      • 3.1.3. Phương pháp đề xuất:
      • 3.1.4. Phân cụm cắt tối thiểu lặp (Iterative Min Cut Clustering)
    • 3.2. Thực nghiệm
      • 3.2.1. Môi trường thực nghiệm
      • 3.2.2. Thực hiện truy vấn và đánh giá
    • Kết luận chương 3
  • KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

  • Danh mục các công trình của tác giả

Tài liệu liên quan