Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet

Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạc...

Full description

Saved in:
Bibliographic Details
Main Author: Đặng, Quang Huy
Format: Theses and Dissertations
Language:other
Published: Đại học quốc gia Hà Nội 2016
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/14671
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: other
id oai:112.137.131.14:VNU_123-14671
record_format dspace
spelling oai:112.137.131.14:VNU_123-146712016-10-10T20:07:11Z Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet Đặng, Quang Huy Internet Khai phá dữ liệu Phân cụm tài liệu Tiếng Việt Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạch Top-down, phân cụm dựa trên tính mới của tài liệu, phân hoạch Bottom-up, kết hợp giữa bottom-up và top-down. Qua việc so sánh các thuật toán phân cụm và phân cụm sử dụng tách từ tiếng Việt đưa ra kết quả thực nghiệm với phân cụm tiếng Việt 2016-10-10T08:33:50Z 2016-10-10T08:33:50Z 2007 Thesis 77 tr. http://repository.vnu.edu.vn/handle/VNU_123/14671 other application/pdf Đại học quốc gia Hà Nội
institution Vietnam National University, Hanoi
building VNU Library & Information Center
country Vietnam
collection VNU Digital Repository
language other
topic Internet
Khai phá dữ liệu
Phân cụm tài liệu
Tiếng Việt
spellingShingle Internet
Khai phá dữ liệu
Phân cụm tài liệu
Tiếng Việt
Đặng, Quang Huy
Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
description Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạch Top-down, phân cụm dựa trên tính mới của tài liệu, phân hoạch Bottom-up, kết hợp giữa bottom-up và top-down. Qua việc so sánh các thuật toán phân cụm và phân cụm sử dụng tách từ tiếng Việt đưa ra kết quả thực nghiệm với phân cụm tiếng Việt
format Theses and Dissertations
author Đặng, Quang Huy
author_facet Đặng, Quang Huy
author_sort Đặng, Quang Huy
title Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
title_short Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
title_full Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
title_fullStr Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
title_full_unstemmed Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
title_sort phương pháp thu thập, đánh giá và phân cụm thông tin tiếng việt trên internet
publisher Đại học quốc gia Hà Nội
publishDate 2016
url http://repository.vnu.edu.vn/handle/VNU_123/14671
_version_ 1680968511887769600