Luận án Nghiên cứu một số kỹ thuật phân hạng trong tra cứu ảnh dựa vào nội dung

Năm2017

Lĩnh vựcKhoa học tự nhiên

Ngôn ngữTiếng Việt, Tiếng Anh

Mô tả tài liệu

Tóm tắt nội dung tài liệu

Tài liệu này trình bày về tính cấp thiết của việc khai thác dữ liệu đa phương tiện một cách hiệu quả, đặc biệt trong bối cảnh sự phát triển mạnh mẽ của Internet và các nền tảng lưu trữ dữ liệu lớn như Flickr, YouTube, Facebook, Twitter. Mặc dù các hệ thống tìm kiếm thông tin văn bản và ảnh hiện có như Google, Bing, Yahoo đã có những bước tiến, chúng vẫn chưa đáp ứng đầy đủ nhu cầu người dùng, đặc biệt khi kích thước của kho ảnh trở nên khổng lồ, khiến phương pháp tra cứu bằng từ khóa không còn khả thi. Điều này thúc đẩy sự quan tâm đến các nghiên cứu về tra cứu dựa trên nội dung dữ liệu ảnh.

Tra cứu ảnh dựa vào nội dung (Content-based image retrieval - CBIR) đã được giới thiệu từ những năm 1980 và nghiên cứu rộng rãi, với nhiều phương pháp và hệ thống được phát triển để trích rút nội dung ảnh bằng cách sử dụng các đặc trưng mức thấp như màu sắc, hình dạng, và kết cấu. Tuy nhiên, một thách thức lớn trong CBIR là "khoảng trống ngữ nghĩa" – sự không tương đồng giữa thông tin ảnh được máy tính hiểu (thông qua các đặc trưng trực quan mức thấp) và cách con người diễn giải nội dung ảnh (thông qua các khái niệm ngữ nghĩa mức cao). Khoảng trống ngữ nghĩa được định nghĩa là sự không tương đồng giữa thông tin ảnh, được trích rút từ dữ liệu trực quan so với diễn giải về dữ liệu ảnh đó bởi người dùng trong tình huống cụ thể. Nhiều hệ thống CBIR nổi bật như QBIC, Photobook, MARS, PicHunter, VisualSEEK, Blobworld, MindReader, SIMPLI-city, FIRE đã được phát triển trong hơn ba thập kỷ qua nhằm thu hẹp khoảng trống này.

Luận án này tập trung vào các mục tiêu và giới hạn phạm vi nghiên cứu nhằm nâng cao hiệu quả tra cứu. Một hệ thống CBIR điển hình bao gồm việc trích rút và mô tả các nội dung trực quan của ảnh bằng vector đặc trưng, từ đó tạo nên một cơ sở dữ liệu đặc trưng. Khi người dùng truy vấn bằng ảnh mẫu hoặc vẽ phác thảo, hệ thống sẽ biến đổi chúng thành biểu diễn vector đặc trưng, sau đó tính toán độ tương tự hoặc khoảng cách giữa vector truy vấn với các ảnh trong cơ sở dữ liệu. Nghiên cứu chỉ ra rằng sự kết hợp đa đặc trưng chưa được xem xét đầy đủ trong nhiều nghiên cứu CBIR, dẫn đến hiệu quả so sánh độ tương tự chưa cao. Do đó, luận án nhấn mạnh sự cần thiết nghiên cứu đánh chỉ số và tra cứu sử dụng kết hợp đa đặc trưng để nâng cao hiệu quả và độ chính xác của kết quả tra cứu.

Luận án Nghiên cứu một số kỹ thuật phân hạng trong tra cứu ảnh dựa vào nội dung

Mô tả tài liệu

Tóm tắt nội dung tài liệu

Tài liệu liên quan

Hội viên Premium

Tài liệu tải nhiều

Lĩnh vực khác