info@luanan.net.vn
Luận án DOC

Luận án Nghiên cứu, phát triển một số kỹ thuật theo bám đối tượng dựa trên kiến trúc mạng Siamese

Năm2023
Lĩnh vựcKhoa học tự nhiên
Ngôn ngữTiếng Anh, Tiếng Việt

Mô tả tài liệu

Tên luận án:

NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ KỸ THUẬT THEO BÁM ĐỐI TƯỢNG DỰA TRÊN KIẾN TRÚC MẠNG SIAMESE

Ngành:

Cơ sở toán học cho tin học (Mã số: 9.46.01.10)

Tóm tắt nội dung tài liệu:

Luận án này tập trung nghiên cứu và phát triển các kỹ thuật theo bám đối tượng trong video, một nhiệm vụ trọng yếu trong thị giác máy tính với nhiều ứng dụng thực tiễn như trinh sát quân sự, chống máy bay không người lái (UAV), giám sát thông minh và xe tự lái. Mặc dù đã có những tiến bộ, bài toán này vẫn đối mặt với nhiều thách thức như đối tượng bị che lấp, thay đổi tỷ lệ, chuyển động nhanh và thay đổi ánh sáng.

Mục tiêu của luận án là nghiên cứu tổng quan bài toán theo bám đối tượng đơn, từ đó đề xuất một số kỹ thuật và mô hình học sâu dựa trên kiến trúc mạng Siamese. Các mô hình này được chứng minh bằng thực nghiệm, so sánh và đánh giá trên các bộ dữ liệu chuẩn. Phạm vi nghiên cứu bao gồm các bộ dữ liệu, chỉ số đánh giá, và các phương pháp học sâu bán giám sát theo bám đơn đối tượng.

Luận án đã nghiên cứu các cơ chế tập trung, mạng chuyển đổi và phát hiện đối tượng, khảo sát các bộ dữ liệu và chỉ số đánh giá, cũng như phân tích các mô hình học sâu hiện đại. Từ đó, đề xuất ba đóng góp chính: kỹ thuật cải tiến mạng Siamese sử dụng cơ chế tập trung và mạng thích ứng điểm không dùng khung neo; mô hình học sâu theo kiến trúc mạng Siamese sử dụng mạng chuyển đổi nhẹ để theo bám đối tượng thời gian thực; và mô hình học sâu theo kiến trúc mạng Siamese sử dụng mạng chuyển đổi tuyến tính và cơ chế tập trung nhằm tăng cường hiệu năng của trình theo bám đối tượng cơ sở.

Các mô hình đề xuất đạt hiệu năng cao và chạy với thời gian thực, có tiềm năng phát triển thành ứng dụng thực tế cho giám sát an ninh và chống UAV. Kết quả thử nghiệm trên bốn bộ dữ liệu dạng ngắn (VOT2018, VOT2019, UAV123, OTB100) và hai bộ dữ liệu dạng dài (LaSOT, GOT10K) cho thấy hiệu suất vượt trội so với các phương pháp mới công bố giai đoạn 2020-2022. Luận án đã công bố 06 công trình khoa học, trong đó có 03 công trình quốc tế thuộc danh mục Scopus. Hướng nghiên cứu tiếp theo bao gồm cải tiến các phương pháp đã đề xuất, chuyển đổi mã nguồn sang TensorRT để triển khai ứng dụng thực tế trên thiết bị nhúng và nghiên cứu các mô hình học sâu mới cho bài toán theo bám đa đối tượng.

Tài liệu liên quan