Phân loại thực thể có tên trên Wikipedia để phục vụ cho bài toán xây dựng hệ tri thức

Giới thiệu một phương pháp hiệu quả để giải quyết bài toán phân loại thực thể có tên trên phiên bản Wikipedia tiếng Việt dựa trên máy véc-tơ hỗ trợ (Support Vector Machine). Đặc biệt, luận văn cũng hoàn thành xây dựng một công cụ để thực thi bài toán này với độ chính xác cao trên 94%. Bên cạnh đó, l...

Full description

Saved in:
Bibliographic Details
Main Author: Lưu, Mạnh Hà
Other Authors: Phạm, Bảo Sơn
Format: Theses and Dissertations
Language:Vietnamese
Published: 2020
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/99734
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: Vietnamese
Description
Summary:Giới thiệu một phương pháp hiệu quả để giải quyết bài toán phân loại thực thể có tên trên phiên bản Wikipedia tiếng Việt dựa trên máy véc-tơ hỗ trợ (Support Vector Machine). Đặc biệt, luận văn cũng hoàn thành xây dựng một công cụ để thực thi bài toán này với độ chính xác cao trên 94%. Bên cạnh đó, luận văn cũng đóng góp cho cộng đồng nghiên cứu một tập dữ liệu lớn gồm 10,000 thực thể được gán nhãn thủ công và một công cụ để thực hiện tiền xử lý dữ liệu, có thể được tái sử dụng để phục vụ cho các bài toán có nội dung liên quan.