Mô hình tách từ, gán nhãn từ loại và hướng tiếp cận tích hợp cho tiếng Việt

Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông...

Full description

Saved in:
Bibliographic Details
Main Author: Trần, Thị Oanh
Other Authors: Hà, Quang Thụy
Format: Theses and Dissertations
Language:Vietnamese
Published: 2016
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/15401
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: Vietnamese
Description
Summary:Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông tin tri thức từ nhiều nguồn khác nhau nhằm tăng độ chính xác của bộ tách từ. Nghiên cứu và đề xuất mô hình gán nhãn từ loại tiếng Việt, xây dựng một mô hình gán nhãn từ loại hiệu quả như thiết kết corpus gán nhãn từ loại, thiết kế các tập đặc trưng khác nhau để tìm ra các đặc trưng hữu ích cho tiếng Việt. Trình bày quá trình lựa chọn, xây dựng mô hình và tiến hành thực nghiệm một mô hình tích hợp tách từ và gán nhãn từ loại tiếng Việt