NGHIÊN CỨU PHƯƠNG PHÁP TÌM KIẾM NGỮ NGHĨA SỬ DỤNG ONTOLOGY VÀ ỨNG DỤNG XÂY DỰNG HỆ THỐNG TRA CỨU, TÌM KIẾM VĂN BẢN MẪU BỆNH
Cơ sở toán học cho tin học
Luận án “Nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng Ontology và ứng dụng xây dựng hệ thống tra cứu, tìm kiếm văn bản mẫu bệnh” tập trung giải quyết những hạn chế của các hệ thống tìm kiếm văn bản hiện tại, vốn chủ yếu dựa trên từ khóa và đòi hỏi người dùng phải diễn đạt chính xác mối quan hệ ngữ nghĩa. Vấn đề này đặc biệt khó khăn khi người dùng thiếu kiến thức chuyên sâu về lĩnh vực cần tìm kiếm, ví dụ như tìm kiếm thông tin bệnh dựa trên các triệu chứng ban đầu chưa rõ ràng.
Nghiên cứu đề xuất các phương pháp tìm kiếm ngữ nghĩa tiên tiến bằng cách sử dụng Ontology. Cụ thể, luận án nghiên cứu các phương pháp xây dựng, trích rút thông tin từ văn bản để làm giàu ontology bệnh, khai phá các luật kết hợp trong ontology bệnh. Từ đó, ứng dụng xây dựng Hệ thống tìm kiếm ngữ nghĩa thông tin bệnh có khả năng hỗ trợ tương tác với người sử dụng thông qua các gợi ý dựa trên tập luật kết hợp giữa các triệu chứng và luật kết hợp ngữ nghĩa từ các mối quan hệ trên Ontology bệnh.
Các điểm mới của đề tài bao gồm việc đề xuất phương pháp trích rút bộ ba (triple) dựa trên mô hình cú pháp để xây dựng đặc trưng văn bản, phương pháp tìm kiếm đa diện dữ liệu văn bản và cá nhân hóa tìm kiếm đa diện sử dụng dữ liệu định hướng xử lý nhập nhằng của Wikipedia Disambiguation. Luận án cũng giới thiệu phương pháp khai phá luật kết hợp trong Ontology bệnh (ASO-Apriori) dựa trên hai độ đo mới là độ hỗ trợ mở rộng và độ tin cậy mở rộng, đồng thời xây dựng Ontology bệnh tiếng Việt. Cuối cùng, luận án đề xuất phương pháp và xây dựng Hệ thống tìm kiếm ngữ nghĩa thông tin bệnh có hỗ trợ tương tác.
Về ý nghĩa khoa học, luận án mở ra hướng nghiên cứu mới về tích hợp ontology và sử dụng luật kết hợp trong hệ thống tìm kiếm thông minh có tương tác. Hệ thống tìm kiếm ngữ nghĩa thông tin bệnh mang lại giá trị thực tiễn cao, giúp người dùng dễ dàng xác định các truy vấn phù hợp với ý định của họ. Các phương pháp đề xuất còn có tiềm năng ứng dụng rộng rãi trong các hệ thống phân loại, phân cụm, tóm tắt văn bản, hệ thống khuyến nghị và các hệ chuyên gia.