Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs
Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations |
Language: | other |
Published: |
Đại học Quốc gia Hà Nội
2016
|
Subjects: | |
Online Access: | http://repository.vnu.edu.vn/handle/VNU_123/7798 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Vietnam National University, Hanoi |
Language: | other |
Summary: | Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs - mô hình học máy được đánh giá là một trong những phương pháp tốt nhất cho bài toán gán nhãn dữ liệu dạng chuỗi. Tìm hiểu đặc điểm cấu trúc của cụm danh từ tiếng Việt, từ đó đề xuất phương pháp thích hợp xây dựng tập dữ liệu tiếng Việt. Trình bày các kết quả thực nghiệm khi áp dụng mô hình CRFs để phân tách cụm danh từ tiếng Việt với bộ dữ liệu do luận văn xây dựng. Đưa ra một số nhận xét, đánh giá tổng quát về vấn đề cần nghiên cứu. |
---|