Đăng nhập để tải tài liệu không giới hạn
Tham gia 8.000+ người dùng Thư Viện Luận Án
Đang tải tài liệu...
PHÁT HIỆN MỘT SỐ SỰ KIỆN BẤT THƯỜNG DỰA TRÊN HÌNH ẢNH SỬ DỤNG MÔ HÌNH PHÂN CẤP
Kỹ thuật Máy tính, Công nghệ thông tin
Luận án này tập trung vào giải quyết thách thức phát hiện các sự kiện bất thường trong hệ thống giám sát dựa trên camera, nhằm cải thiện hiệu năng và tốc độ xử lý. Các sự kiện bất thường, từ thiên tai như sạt lở đến các hoạt động của con người như cháy, có thể gây thiệt hại nghiêm trọng và đòi hỏi các hệ thống cảnh báo sớm hiệu quả. Các mô hình học sâu truyền thống thường gặp khó khăn với dữ liệu huấn luyện khan hiếm cho các sự kiện bất thường hiếm gặp và khả năng xử lý thời gian thực.
Để khắc phục những hạn chế này, nghiên cứu đề xuất một mô hình học sâu phân cấp mới. Mô hình này được thiết kế với nhiều cấp độ lọc, trong đó các bộ lọc "yếu" ở giai đoạn đầu nhanh chóng loại bỏ nhiễu, giảm tải dữ liệu cho các bộ lọc "mạnh" dựa trên học sâu ở các giai đoạn sau. Cách tiếp cận này giúp tăng đáng kể độ chính xác nhận dạng, đặc biệt đối với các đối tượng bất thường nhỏ hoặc khó phân biệt, đồng thời cải thiện tốc độ xử lý, đảm bảo khả năng hoạt động thời gian thực trên các thiết bị nhúng.
Luận án phân loại sự kiện bất thường thành hai nhóm chính: tĩnh (ví dụ: hố sụt, sạt lở đường) và động (ví dụ: lửa, hành vi bạo lực). Đối với sự kiện tĩnh, mô hình phân cấp sử dụng kiến trúc U-Net để phân đoạn đối tượng, kết hợp bộ lọc theo luật và MobileNet V3 để phân loại chính xác. Kết quả thực nghiệm trên bộ dữ liệu LandslidePTIT tự xây dựng cho thấy mô hình đạt điểm F1 cao vượt trội và tốc độ xử lý nhanh. Đối với sự kiện động, mô hình mở rộng cấu trúc phân cấp bằng cách tích hợp các đặc trưng không gian (sử dụng ResNet) và đặc trưng thời gian (sử dụng mạng Bi-LSTM) để bám vết và phân loại các đối tượng chuyển động. Các thử nghiệm trên bộ dữ liệu FirePTIT tự xây dựng cũng chứng minh hiệu quả vượt trội của mô hình đề xuất so với các phương pháp hiện có.
Mặc dù đạt được những kết quả khả quan, mô hình vẫn còn tiềm năng phát triển, bao gồm việc xây dựng khả năng huấn luyện đầu cuối (end-to-end) và tích hợp thông tin ngữ cảnh để nâng cao hiệu suất hơn nữa. Hướng nghiên cứu tương lai cũng đề xuất áp dụng các phương pháp học máy ít dữ liệu (few-shot learning) để giải quyết vấn đề khan hiếm dữ liệu.
Tải không giới hạn tất cả tài liệu, không cần chờ. Chỉ từ 199.000đ/tháng.
Xem gói hội viên