info@luanan.net.vn
Luận án PDF

Luận án Phát hiện một số sự kiện bất thường dựa trên hình ảnh sử dụng mô hình phân cấp

Năm2023
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh
Xem trước tài liệu
Đang tải...

Đang tải tài liệu...

Mô tả tài liệu

Tên luận án:

PHÁT HIỆN MỘT SỐ SỰ KIỆN BẤT THƯỜNG DỰA TRÊN HÌNH ẢNH SỬ DỤNG MÔ HÌNH PHÂN CẤP

Ngành:

Kỹ thuật Máy tính, Công nghệ thông tin

Tóm tắt nội dung tài liệu:

Luận án này tập trung vào giải quyết thách thức phát hiện các sự kiện bất thường trong hệ thống giám sát dựa trên camera, nhằm cải thiện hiệu năng và tốc độ xử lý. Các sự kiện bất thường, từ thiên tai như sạt lở đến các hoạt động của con người như cháy, có thể gây thiệt hại nghiêm trọng và đòi hỏi các hệ thống cảnh báo sớm hiệu quả. Các mô hình học sâu truyền thống thường gặp khó khăn với dữ liệu huấn luyện khan hiếm cho các sự kiện bất thường hiếm gặp và khả năng xử lý thời gian thực.

Để khắc phục những hạn chế này, nghiên cứu đề xuất một mô hình học sâu phân cấp mới. Mô hình này được thiết kế với nhiều cấp độ lọc, trong đó các bộ lọc "yếu" ở giai đoạn đầu nhanh chóng loại bỏ nhiễu, giảm tải dữ liệu cho các bộ lọc "mạnh" dựa trên học sâu ở các giai đoạn sau. Cách tiếp cận này giúp tăng đáng kể độ chính xác nhận dạng, đặc biệt đối với các đối tượng bất thường nhỏ hoặc khó phân biệt, đồng thời cải thiện tốc độ xử lý, đảm bảo khả năng hoạt động thời gian thực trên các thiết bị nhúng.

Luận án phân loại sự kiện bất thường thành hai nhóm chính: tĩnh (ví dụ: hố sụt, sạt lở đường) và động (ví dụ: lửa, hành vi bạo lực). Đối với sự kiện tĩnh, mô hình phân cấp sử dụng kiến trúc U-Net để phân đoạn đối tượng, kết hợp bộ lọc theo luật và MobileNet V3 để phân loại chính xác. Kết quả thực nghiệm trên bộ dữ liệu LandslidePTIT tự xây dựng cho thấy mô hình đạt điểm F1 cao vượt trội và tốc độ xử lý nhanh. Đối với sự kiện động, mô hình mở rộng cấu trúc phân cấp bằng cách tích hợp các đặc trưng không gian (sử dụng ResNet) và đặc trưng thời gian (sử dụng mạng Bi-LSTM) để bám vết và phân loại các đối tượng chuyển động. Các thử nghiệm trên bộ dữ liệu FirePTIT tự xây dựng cũng chứng minh hiệu quả vượt trội của mô hình đề xuất so với các phương pháp hiện có.

Mặc dù đạt được những kết quả khả quan, mô hình vẫn còn tiềm năng phát triển, bao gồm việc xây dựng khả năng huấn luyện đầu cuối (end-to-end) và tích hợp thông tin ngữ cảnh để nâng cao hiệu suất hơn nữa. Hướng nghiên cứu tương lai cũng đề xuất áp dụng các phương pháp học máy ít dữ liệu (few-shot learning) để giải quyết vấn đề khan hiếm dữ liệu.

Tài liệu liên quan