Mô hình tách từ, gán nhãn từ loại và hướng tiếp cận tích hợp cho tiếng Việt
Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông...
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Theses and Dissertations |
Language: | Vietnamese |
Published: |
2016
|
Subjects: | |
Online Access: | http://repository.vnu.edu.vn/handle/VNU_123/15401 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Vietnam National University, Hanoi |
Language: | Vietnamese |
Summary: | Giới thiệu hai bài toán cơ bản trong xử lý ngôn ngữ tự nhiên là bài toán tách tử và bài toán gán nhãn từ loại tiếng Việt, các hướng tiếp cận cho mỗi bài toán và tình hình nghiên cứu chung ở Việt Nam cũng như trên thế giới. Nghiên cứu và đề xuất mô hình cho bài toán tách từ tiếng Việt tận dụng thông tin tri thức từ nhiều nguồn khác nhau nhằm tăng độ chính xác của bộ tách từ. Nghiên cứu và đề xuất mô hình gán nhãn từ loại tiếng Việt, xây dựng một mô hình gán nhãn từ loại hiệu quả như thiết kết corpus gán nhãn từ loại, thiết kế các tập đặc trưng khác nhau để tìm ra các đặc trưng hữu ích cho tiếng Việt. Trình bày quá trình lựa chọn, xây dựng mô hình và tiến hành thực nghiệm một mô hình tích hợp tách từ và gán nhãn từ loại tiếng Việt |
---|