Tên luận án:
NHẬN DẠNG CỬ CHỈ ĐỘNG CỦA BÀN TAY NGƯỜI SỬ DỤNG KẾT HỢP THÔNG TIN HÌNH ẢNH VÀ ĐỘ SÂU ỨNG DỤNG TRONG TƯƠNG TÁC NGƯỜI-THIẾT BỊ
Ngành:
Kỹ thuật Điều khiển và Tự động hóa
Tóm tắt nội dung tài liệu:
Luận án này đề xuất một phương pháp mới nhằm nhận dạng cử chỉ động của bàn tay, ứng dụng trong tương tác người-thiết bị tại môi trường trong nhà, đặc biệt là trong các hệ thống tự động hóa tòa nhà và không gian sống thông minh. Nhu cầu hiện tại đòi hỏi các hệ thống điều khiển tự nhiên, không phụ thuộc vào thiết bị phụ trợ hay giao diện tiếp xúc trực tiếp, đồng thời phải bền vững với sự thay đổi của các yếu tố bên ngoài và có khả năng đáp ứng thời gian thực.
Để giải quyết những thách thức này, luận án đã dung hòa hai hướng nghiên cứu chính: phát triển công nghệ phụ trợ và thuật toán nhận dạng. Luận án đề xuất một tập cử chỉ tay động có tính ngữ nghĩa, dễ nhớ và tự nhiên, thay thế các thiết bị phụ trợ, đồng thời nghiên cứu và thiết kế các giải thuật hiệu quả cho việc biểu diễn và nhận dạng cử chỉ.
Các đóng góp chính bao gồm:
- **Thiết kế và thu thập CSDL cử chỉ tay:** Xây dựng một tập CSDL cử chỉ tay động có tính chu kỳ, tương ứng với các lệnh điều khiển cơ bản cho thiết bị điện tử gia dụng, hỗ trợ hiệu quả nhận dạng cao và được chia sẻ cho cộng đồng nghiên cứu.
- **Giải pháp phân đoạn cử chỉ tay theo thời gian thực:** Đề xuất phương pháp phát hiện và trích chọn vùng bàn tay từ ảnh màu và ảnh độ sâu một cách hiệu quả, cùng với giải pháp phân đoạn cử chỉ từ chuỗi hình ảnh liên tiếp. Điều này nâng cao độ chính xác phát hiện và giảm thời gian tính toán ở pha tiền xử lý.
- **Phương pháp biểu diễn cử chỉ động mới:** Kết hợp các đặc trưng không gian (sử dụng ISOMAP để giảm chiều phi tuyến) và đặc trưng thời gian (KLT từ quỹ đạo chuyển động của bàn tay), cùng với giải pháp đồng bộ pha dựa trên nội suy để giải quyết sự biến động về tốc độ thực hiện và độ dài cử chỉ. Giải thuật học máy SVM được sử dụng để phân lớp.
- **Triển khai hệ thống điều khiển toàn diện:** Xây dựng và đánh giá một hệ thống điều khiển đèn và quạt trong môi trường phòng thông minh thực tế tại Viện MICA. Hệ thống đạt độ chính xác nhận dạng xấp xỉ 90.61% với chi phí thời gian thấp (khoảng 1 giây), cho phép tương tác tự nhiên, thân thiện và không yêu cầu giao diện người dùng.
Luận án khẳng định tính khả thi của giải pháp đề xuất trong các ứng dụng thực tế về thời gian đáp ứng và độ chính xác, đồng thời cung cấp các định hướng nghiên cứu tiếp theo để mở rộng tập cử chỉ và cải thiện hiệu quả hệ thống.
Mục lục chi tiết:
- Chương 1: Tổng quan về điều khiển sử dụng cử chỉ bàn tay và các nghiên cứu liên quan đến các vấn đề đặt ra trong luận án.
- Chương 2: Thiết kế và xây dựng cử chỉ bàn tay có tính chất chu kỳ.
- Chương 3: Đề xuất phương pháp phát hiện, phân đoạn cử chỉ bàn tay đáp ứng yêu cầu thời gian thực và độ chính xác. Phân đoạn chuỗi cử chỉ tay động từ chuỗi liên tiếp các hình trạng bàn tay.
- Chương 4: Đề xuất giải pháp biểu diễn các cử chỉ động của bàn tay kết hợp các đặc trưng không gian và thời gian, giải pháp đồng bộ pha trong không gian mới.
- Chương 5: Triển khai, đánh giá hệ thống điều khiển sử dụng cử chỉ tay. Thực hiện các đánh giá thử nghiệm trên hệ thống hoàn thiện.
- Kết luận và định hướng nghiên cứu tiếp theo của luận án.