Mô hình tách từ, gán nhãn từ loại và hướng tiếp cận tích hợp cho tiếng Việt

Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông...

وصف كامل

محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Trần, Thị Oanh
مؤلفون آخرون: Hà, Quang Thụy
التنسيق: Theses and Dissertations
اللغة:Vietnamese
منشور في: 2016
الموضوعات:
الوصول للمادة أونلاين:http://repository.vnu.edu.vn/handle/VNU_123/15401
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
المؤسسة: Vietnam National University, Hanoi
اللغة: Vietnamese
الوصف
الملخص:Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông tin tri thức từ nhiều nguồn khác nhau nhằm tăng độ chính xác của bộ tách từ. Nghiên cứu và đề xuất mô hình gán nhãn từ loại tiếng Việt, xây dựng một mô hình gán nhãn từ loại hiệu quả như thiết kết corpus gán nhãn từ loại, thiết kế các tập đặc trưng khác nhau để tìm ra các đặc trưng hữu ích cho tiếng Việt. Trình bày quá trình lựa chọn, xây dựng mô hình và tiến hành thực nghiệm một mô hình tích hợp tách từ và gán nhãn từ loại tiếng Việt