Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs

Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs...

Full description

Saved in:
Bibliographic Details
Main Author: Nguyễn, Thị Hương Thảo
Format: Theses and Dissertations
Language:other
Published: Đại học Quốc gia Hà Nội 2016
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/7798
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: other
Description
Summary:Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs - mô hình học máy được đánh giá là một trong những phương pháp tốt nhất cho bài toán gán nhãn dữ liệu dạng chuỗi. Tìm hiểu đặc điểm cấu trúc của cụm danh từ tiếng Việt, từ đó đề xuất phương pháp thích hợp xây dựng tập dữ liệu tiếng Việt. Trình bày các kết quả thực nghiệm khi áp dụng mô hình CRFs để phân tách cụm danh từ tiếng Việt với bộ dữ liệu do luận văn xây dựng. Đưa ra một số nhận xét, đánh giá tổng quát về vấn đề cần nghiên cứu.