info@luanan.net.vn
Luận án PDF

Luận án Nghiên cứu ngữ nghĩa và hiện tượng nhập nhằng trong tiếng Việt, tiếp cận xư ly vân đê viết tắt tiếng Việt

Năm2020
Lĩnh vựcCông nghệ thông tin
Ngôn ngữTiếng Việt, Tiếng Anh
Xem trước tài liệu
Đang tải...

Đang tải tài liệu...

Mô tả tài liệu

Tên luận án:

NGHIÊN CỨU NGỮ NGHĨA VÀ HIỆN TƯỢNG NHẬP NHẰNG TRONG TIẾNG VIỆT, TIẾP CẬN XỬ LÝ VẤN ĐỀ VIẾT TẮT TIẾNG VIỆT

Ngành:

KHOA HỌC MÁY TÍNH

Tóm tắt nội dung tài liệu:

Luận án "Nghiên cứu ngữ nghĩa và hiện tượng nhập nhằng trong tiếng Việt, tiếp cận xử lý vấn đề viết tắt tiếng Việt" của Nguyễn Nho Túy tập trung giải quyết một vấn đề phổ biến trong ngôn ngữ đọc viết hàng ngày: hiện tượng chữ viết tắt (CVT) và sự nhập nhằng ngữ nghĩa mà nó gây ra. Mặc dù vấn đề CVT không mới, nhưng chưa có công trình nào nghiên cứu một cách hệ thống và đầy đủ về CVT tiếng Việt. Luận án nhấn mạnh rằng ngôn ngữ tự nhiên, đặc biệt là tiếng Việt, luôn biến đổi và phát triển, trong đó CVT đóng vai trò như một phương thức hình thành từ vựng mới, kéo theo những biến đổi ngữ nghĩa.

Mục tiêu chính của đề tài là nghiên cứu tiếng Việt dưới góc độ ngôn ngữ học, hiện tượng nhập nhằng tiếng Việt và CVT, từ đó hiểu rõ tri thức về CVT. Luận án đặt ra nhiệm vụ xây dựng nguồn tài nguyên CVT tiếng Việt, phát hiện và đề xuất các quy tắc tạo sinh nhằm khắc phục lỗi và đảm bảo tính nhất quán. Đồng thời, nghiên cứu cũng hướng đến việc xây dựng các ứng dụng khai thác CVT, hỗ trợ khử nhập nhằng và chuẩn hóa việc sử dụng CVT, góp phần vào sự phát triển của ngôn ngữ.

Đối tượng nghiên cứu bao gồm tri thức từ các chuyên gia ngôn ngữ, xử lý ngôn ngữ tự nhiên, tin học, cùng với việc khảo sát CVT trong văn bản, sách, báo, và trên web. Về mặt lý thuyết, luận án tập trung vào xử lý ngôn ngữ tự nhiên tiếng Việt, đặc biệt là xử lý văn bản, hiện tượng nhập nhằng và vấn đề ngữ nghĩa. Phạm vi ứng dụng chủ yếu là xây dựng kho ngữ liệu, các ứng dụng khai thác CVT và môi trường thử nghiệm trong lĩnh vực viễn thông và CNTT.

Luận án đã đạt được nhiều đóng góp quan trọng, bao gồm việc phát hiện và xây dựng kho ngữ liệu chữ viết tắt, tổng kết các quy tắc hình thành CVT, và phát triển hệ thống khai thác CVT (Abbreviations Management Exploit System - AMES). Đặc biệt, luận án đã góp phần xử lý hiện tượng nhập nhằng của CVT tiếng Việt và xây dựng các ứng dụng thực tiễn như từ điển CVT trên các thiết bị di động, máy tính và đề xuất chuẩn hóa việc sử dụng CVT ở cấp độ quốc gia.

Mục lục chi tiết:

  • MỞ ĐẦU
    • 1. Tính cấp thiết của đề tài
    • 2. Mục tiêu và nhiệm vụ đề tài
    • 3. Đối tượng và phạm vi nghiên cứu
    • 4. Phương pháp nghiên cứu
    • 5. Cấu trúc của luận án
    • 6. Đóng góp chính của luận án
  • CHƯƠNG 1: VẤN ĐỀ CHỮ VIẾT TẮT TIẾNG VIỆT
    • 1.1. NGÔN NGỮ VÀ XỬ LÝ NGÔN NGỮ TỰ NHIÊN
      • 1.1.1. Ngôn ngữ và xử lý ngôn ngữ
      • 1.1.3. Các loại hình ngôn ngữ
      • 1.1.4. Xử lý ngôn ngữ tự nhiên
      • 1.1.5. Vấn đề xử lý tiếng Việt
    • 1.2. NGỮ NGHĨA VÀ NHẬP NHẰNG NGỮ NGHĨA TIẾNG VIỆT
      • 1.2.1. Ngữ nghĩa và ngữ nghĩa học
      • 1.2.2. Phân tích nghĩa của từ
      • 1.2.3. Sự biến đổi của từ vựng và ngữ nghĩa
      • 1.2.4. Nhập nhằng ngữ nghĩa trong tiếng Việt
    • 1.3. CHỮ VIẾT TẮT TRONG CUỘC SỐNG
      • 1.3.1. Chữ viết tắt là gì
      • 1.3.2. Lịch sử hình thành chữ Quốc ngữ
      • 1.3.3. Tìm hiểu về lịch sử chữ viết tắt
      • 1.3.4. Sử dụng chữ viết tắt
      • 1.3.5. Chữ viết tắt trong tiếng Việt
    • 1.4. NGỮ NGHĨA CHỮ VIẾT TẮT
      • 1.4.1. Khái niệm ngữ nghĩa chữ viết tắt
      • 1.4.2. Biến đổi ngữ nghĩa chữ viết tắt
      • 1.4.3. Nhập nhằng chữ viết tắt
      • 1.4.4. Xử lý nhập nhằng chữ viết tắt
      • 1.4.5. Đề xuất nghiên cứu chữ viết tắt tiếng Việt
  • CHƯƠNG 2. XÂY DỰNG HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG VIỆT
    • 2.1. CÁC TÌNH HUỐNG HÌNH THÀNH CHỮ VIẾT TẮT
      • 2.1.1. Mô hình sự hình thành chữ viết tắt
      • 2.1.2. Đặc điểm hình thành chữ viết tắt tiếng Việt
      • 2.1.3. Quy tắc hình thành chữ viết tắt tiếng Việt
      • 2.1.4. Những yếu tố khác ảnh hưởng đến thành lập chữ viết tắt
    • 2.2. TÌM HIỂU HỆ SINH THÁI PHẦN MỀM
      • 2.2.1. Hệ sinh thái phần mềm là gì
      • 2.2.2. Mô hình hóa hệ sinh thái phần mềm (SECO)
      • 2.2.3. Đặc điểm một hệ sinh thái phần mềm
      • 2.2.4. Lợi ích ứng dụng hệ sinh thái phần mềm
    • 2.3. HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG VIỆT (AMES)
      • 2.3.1. Hệ thống khai thác phần mềm
      • 2.3.2. Đề xuất xây dựng hệ thống khai thác chữ viết tắt
      • 2.3.3. Mô hình hệ thống khai thác chữ viết tắt
    • 2.4. THỰC NGHIỆM XÂY DỰNG AMES
      • 2.4.1. Xây dựng nguồn tài nguyên chữ viết tắt tiếng Việt
      • 2.4.2. Xây dựng công cụ khai thác chữ viết tắt
      • 2.4.3. Xây dựng giải pháp xử lý nhập nhằng chữ viết tắt
  • CHƯƠNG 3. XÂY DỰNG NGUỒN TÀI NGUYÊN CHỮ VIẾT TẮT
    • 3.1. XÂY DỰNG CƠ SỞ DỮ LIỆU CHỮ VIẾT TẮT
      • 3.1.1. Mô hình quan hệ dữ liệu
      • 3.1.2. Triển khai cài đặt
    • 3.2. GIẢI PHÁP THU THẬP DỮ LIỆU CHỮ VIẾT TẮT
      • 3.2.1. Thu thập dữ liệu thủ công
      • 3.2.2. Thu thập dữ liệu tự động
      • 3.2.3. Đề xuất thuật toán SENVA tìm kiếm chữ viết tắt mới
      • 3.2.4. Thực nghiệm cài đặt thuật toán SENVA
    • 3.3. ỨNG DỤNG KHAI THÁC DỮ LIỆU CHỮ VIẾT TẮT
      • 3.3.1. Sử dụng chữ viết tắt trong CSDL chuyên ngành
      • 3.3.2. Ứng dụng chữ viết tắt trong xây dựng CSDL danh mục
      • 3.3.3. Đề xuất sử dụng CVT trong bộ mã danh mục quốc gia
    • 3.4. ĐÁNH GIÁ KẾT QUẢ
      • 3.4.1. Kết quả xây dựng kho ngữ liệu chữ viết tắt
      • 3.4.2. Đánh giá kết quả
  • CHƯƠNG 4. XÂY DỰNG CÔNG CỤ KHAI THÁC CHỮ VIẾT TẮT
    • 4.1. XÂY DỰNG THƯ VIỆN CHỮ VIẾT TẮT
      • 4.1.1. Lựa chọn công cụ lập trình
      • 4.1.2. Thiết kế chương trình
      • 4.1.3. Kết quả xây dựng thư viện chữ viết tắt
    • 4.2. CÔNG CỤ TƯ VẤN CHỮ VIẾT TẮT THƯƠNG HIỆU
      • 4.2.1. Tin nhắn thương hiệu là gì
      • 4.2.2. Các bước xây dựng công cụ tư vấn đặt tên Brandname
      • 4.2.3. Thuật toán CSBCOM đặt tên tin nhắn thương hiệu
      • 4.2.4. Cài đặt chương trình, kết quả thử nghiệm
    • 4.3. XÂY DỰNG TỪ ĐIỂN CHỮ VIẾT TẮT TRÊN MÁY DI ĐỘNG
      • 4.3.1. Thiết kế cơ sở dữ liệu và chức năng chương trình
      • 4.3.2. Đồng bộ dữ liệu với thư viện chữ viết tắt
      • 4.3.3. Đề xuất thuật toán SAOM-FTS xây dựng từ điển
      • 4.3.4. Cài đặt và kết quả thực nghiệm
    • 4.4. ĐÁNH GIÁ KẾT QUẢ
      • 4.4.1. Đánh giá kết quả thực nghiệm AMES
      • 4.4.2. Đánh giá AMES đặc tả theo mô hình UML
  • CHƯƠNG 5. XỬ LÝ NHẬP NHẰNG CHỮ VIẾT TẮT
    • 5.1. NHẬN DIỆN TÌNH HUỐNG SỬ DỤNG CHỮ VIẾT TẮT
      • 5.1.1. Ngữ cảnh sử dụng chữ viết tắt
      • 5.1.2. Vấn đề nhận diện chữ viết tắt trong văn bản
      • 5.1.3. Xây dựng mô hình nhận diện chữ viết tắt trong văn bản
      • 5.1.4. Giải pháp xử lý nhập nhằng chữ viết tắt
    • 5.2. XÂY DỰNG VỊ TỪ VÀ HÀM NHẬN DIỆN CHỮ VIẾT TẮT
      • 5.2.1. Xây dựng các miền dữ liệu
      • 5.2.2. Xây dựng vị từ và hàm
      • 5.2.3. Nhận diện hiện tượng nhập nhằng CVT trong văn bản
    • 5.3. XÂY DỰNG CƠ SỞ LUẬT NHẬN DIỆN CHỮ VIẾT TẮT
      • 5.3.1. Xây dựng cơ sở luật
      • 5.3.2. Xây dựng máy suy diễn nhận diện chữ viết tắt
      • 5.3.3. Thuật toán nhận diện và xử lý nhập nhằng chữ viết tắt
      • 5.3.4. Kết hợp cơ sở luật nhận diện CVT với xử lý nhập nhằng
    • 5.4. TẦN SỐ CHỮ VIẾT TẮT VÀ GIẢI PHÁP XỬ LÝ NHẬP NHẰNG
      • 5.4.1. Tần số chữ viết tắt
      • 5.4.2. Xây dựng khái niệm tần số, khái niệm tần suất chữ viết tắt
      • 5.4.3. Giải pháp đánh giá tần số, tấn suất chữ viết tắt
      • 5.4.4. Xây dựng thuật toán AFVAI và triển khai thực nghiệm
      • 5.4.5. Kết quả thực nghiệm và đánh giá
      • 5.4.6. Ứng dụng kết quả xử lý nhập nhằng chữ viết tắt
  • KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
  • DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ

Tài liệu liên quan