Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet
Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạc...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations |
Language: | other |
Published: |
Đại học quốc gia Hà Nội
2016
|
Subjects: | |
Online Access: | http://repository.vnu.edu.vn/handle/VNU_123/14671 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Vietnam National University, Hanoi |
Language: | other |
id |
oai:112.137.131.14:VNU_123-14671 |
---|---|
record_format |
dspace |
spelling |
oai:112.137.131.14:VNU_123-146712016-10-10T20:07:11Z Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet Đặng, Quang Huy Internet Khai phá dữ liệu Phân cụm tài liệu Tiếng Việt Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạch Top-down, phân cụm dựa trên tính mới của tài liệu, phân hoạch Bottom-up, kết hợp giữa bottom-up và top-down. Qua việc so sánh các thuật toán phân cụm và phân cụm sử dụng tách từ tiếng Việt đưa ra kết quả thực nghiệm với phân cụm tiếng Việt 2016-10-10T08:33:50Z 2016-10-10T08:33:50Z 2007 Thesis 77 tr. http://repository.vnu.edu.vn/handle/VNU_123/14671 other application/pdf Đại học quốc gia Hà Nội |
institution |
Vietnam National University, Hanoi |
building |
VNU Library & Information Center |
country |
Vietnam |
collection |
VNU Digital Repository |
language |
other |
topic |
Internet Khai phá dữ liệu Phân cụm tài liệu Tiếng Việt |
spellingShingle |
Internet Khai phá dữ liệu Phân cụm tài liệu Tiếng Việt Đặng, Quang Huy Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet |
description |
Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạch Top-down, phân cụm dựa trên tính mới của tài liệu, phân hoạch Bottom-up, kết hợp giữa bottom-up và top-down. Qua việc so sánh các thuật toán phân cụm và phân cụm sử dụng tách từ tiếng Việt đưa ra kết quả thực nghiệm với phân cụm tiếng Việt |
format |
Theses and Dissertations |
author |
Đặng, Quang Huy |
author_facet |
Đặng, Quang Huy |
author_sort |
Đặng, Quang Huy |
title |
Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet |
title_short |
Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet |
title_full |
Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet |
title_fullStr |
Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet |
title_full_unstemmed |
Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet |
title_sort |
phương pháp thu thập, đánh giá và phân cụm thông tin tiếng việt trên internet |
publisher |
Đại học quốc gia Hà Nội |
publishDate |
2016 |
url |
http://repository.vnu.edu.vn/handle/VNU_123/14671 |
_version_ |
1680968511887769600 |