Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
Les resultats du système implementé ont été analysé en fonction des metriques connues, telles que : le rappel, la précision et le F-Mesure. Nous avons constaté qu’avec la déduplication exacte ou approximative sur un champs(colonne) du dataset les resultats du système implementé et EBX sont les mêmes...
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Theses |
Language: | French |
Published: |
2020
|
Subjects: | |
Online Access: | http://repository.vnu.edu.vn/handle/VNU_123/69288 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Vietnam National University, Hanoi |
Language: | French |
id |
oai:112.137.131.14:VNU_123-69288 |
---|---|
record_format |
dspace |
spelling |
oai:112.137.131.14:VNU_123-692882020-02-21T09:20:30Z Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning Mirlin, ELIODOR Ednalson Guy Bonnet, Pierre Lapetina, David ĐHQGHN - Viện Quốc tế Pháp ngữ Công nghệ thộng tin ; Cơ sở dữ liệu ; Học máy ; Trí tuệ nhân tạo 006.3 Les resultats du système implementé ont été analysé en fonction des metriques connues, telles que : le rappel, la précision et le F-Mesure. Nous avons constaté qu’avec la déduplication exacte ou approximative sur un champs(colonne) du dataset les resultats du système implementé et EBX sont les mêmes. Cependant avec la correspondance approximative sur plusieurs champs le système implementé avec l’approche d’apprentissage actif a donné de meilleurs resultats par rapport à EBX. Ceci pour 2 raisons majeures: l’automatisation du seuil de déduplication, la contribution humaine lors du processus de detection des enregistrements dupliqués Systèmes Intelligents et Multimédia 2020-02-15T06:50:43Z 2020-02-15T06:50:43Z 2018 Theses Mirlin, E. E. G. (2018). Système de déduplication utilisant les techniques d’apprentissage automatique. Mémoire de master, Université Nationale du VietNam de HaNoi 848020102 http://repository.vnu.edu.vn/handle/VNU_123/69288 MIR fr 52 tr. application/pdf |
institution |
Vietnam National University, Hanoi |
building |
VNU Library & Information Center |
country |
Vietnam |
collection |
VNU Digital Repository |
language |
French |
topic |
Công nghệ thộng tin ; Cơ sở dữ liệu ; Học máy ; Trí tuệ nhân tạo 006.3 |
spellingShingle |
Công nghệ thộng tin ; Cơ sở dữ liệu ; Học máy ; Trí tuệ nhân tạo 006.3 Mirlin, ELIODOR Ednalson Guy Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
description |
Les resultats du système implementé ont été analysé en fonction des metriques connues, telles que : le rappel, la précision et le F-Mesure. Nous avons constaté qu’avec la déduplication exacte ou approximative sur un champs(colonne) du dataset les resultats du système implementé et EBX sont les mêmes. Cependant avec la correspondance approximative sur plusieurs champs le système implementé avec l’approche d’apprentissage actif a donné de meilleurs resultats par rapport à EBX. Ceci pour 2 raisons majeures: l’automatisation du seuil de déduplication, la contribution humaine lors du processus de detection des enregistrements dupliqués |
author2 |
Bonnet, Pierre |
author_facet |
Bonnet, Pierre Mirlin, ELIODOR Ednalson Guy |
format |
Theses |
author |
Mirlin, ELIODOR Ednalson Guy |
author_sort |
Mirlin, ELIODOR Ednalson Guy |
title |
Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
title_short |
Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
title_full |
Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
title_fullStr |
Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
title_full_unstemmed |
Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
title_sort |
système de déduplication utilisant les techniques d’apprentissage automatique = hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning |
publishDate |
2020 |
url |
http://repository.vnu.edu.vn/handle/VNU_123/69288 |
_version_ |
1680967506608521216 |