info@luanan.net.vn
Luận án DOCX

Luận án Nâng cao độ chính xác của tra cứu ảnh theo nội dung dựa trên tiếp cận học đa tạp từ thông tin phản hồi của người dùng

Năm2023
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tên luận án:

NÂNG CAO ĐỘ CHÍNH XÁC CỦA TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN TIẾP CẬN HỌC ĐA TẠP TỪ THÔNG TIN PHẢN HỒI CỦA NGƯỜI DÙNG

Ngành:

Khoa học máy tính

Tóm tắt nội dung tài liệu:

Luận án này tập trung vào việc nâng cao độ chính xác của tra cứu ảnh dựa trên nội dung (CBIR), một lĩnh vực đã thu hút nhiều sự quan tâm nhưng còn đối mặt với thách thức lớn từ khoảng trống ngữ nghĩa giữa đặc trưng mức thấp và khái niệm ngữ nghĩa mức cao. Các phương pháp tra cứu ảnh hiện tại sử dụng phản hồi liên quan (RF) thường kém hiệu quả do chỉ khám phá cấu trúc Euclide toàn cục hoặc cục bộ, số lượng mẫu phản hồi nhỏ và mất cân bằng, cũng như chưa quan tâm đến nhiều khía cạnh khác nhau của đối tượng dữ liệu ảnh. Điều này dẫn đến độ chính xác kém của các phương pháp tra cứu ảnh sử dụng học máy.

Để giải quyết những hạn chế này, luận án đề xuất một phương pháp tra cứu ảnh hiệu quả dựa trên tiếp cận học đa tạp từ thông tin phản hồi của người dùng. Mục tiêu chung là giảm chiều từ thông tin phản hồi để tăng cường độ chính xác.

Các đóng góp chính của luận án bao gồm:

  • Đề xuất phương pháp tìm ma trận chiếu tối ưu theo tiếp cận học đa tạp, gọi là Chiếu phân biệt lớp ngữ nghĩa (SCDP). Phương pháp này xem xét cấu trúc cục bộ của các mẫu dương và âm trong hai lân cận khác nhau để học một phép chiếu mà dữ liệu có thể phân biệt tốt hơn trong không gian chiếu, từ đó cải thiện độ chính xác tra cứu ảnh.
  • Đề xuất phương pháp tự động bổ sung các mẫu dương vào tập huấn luyện để giải quyết vấn đề mất cân bằng dữ liệu. Phương pháp này cũng tận dụng các khía cạnh khác nhau của đối tượng để tạo ra một bộ phân lớp mạnh. Cụ thể, luận án đã phát triển phương pháp cân bằng tập mẫu phản hồi dựa trên đồ thị (BSFG) và kết hợp tra cứu ảnh đa khía cạnh (CIR) thông qua việc sử dụng SCDP và kỹ thuật kết hợp bộ phân lớp theo khía cạnh (CMAC).

Các kết quả thực nghiệm trên các tập dữ liệu ảnh Corel 10K8 và SIMPLIcity đã chứng minh rằng các phương pháp đề xuất cải thiện đáng kể độ chính xác tra cứu ảnh, thể hiện khả năng khám phá cấu trúc phi tuyến của dữ liệu và tận dụng hiệu quả các thông tin từ mẫu chưa có nhãn cũng như các khía cạnh đa dạng của đối tượng. Luận án cũng đưa ra định hướng nghiên cứu trong tương lai, bao gồm việc áp dụng mạng nơ ron tích chập và cơ chế băm sâu để nâng cao hiệu quả và tốc độ tra cứu, hướng tới ứng dụng thực tế.

Tài liệu liên quan