Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning

Les resultats du système implementé ont été analysé en fonction des metriques connues, telles que : le rappel, la précision et le F-Mesure. Nous avons constaté qu’avec la déduplication exacte ou approximative sur un champs(colonne) du dataset les resultats du système implementé et EBX sont les mêmes...

Full description

Saved in:
Bibliographic Details
Main Author: Mirlin, ELIODOR Ednalson Guy
Other Authors: Bonnet, Pierre
Format: Theses
Language:French
Published: 2020
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/69288
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: French
id oai:112.137.131.14:VNU_123-69288
record_format dspace
spelling oai:112.137.131.14:VNU_123-692882020-02-21T09:20:30Z Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning Mirlin, ELIODOR Ednalson Guy Bonnet, Pierre Lapetina, David ĐHQGHN - Viện Quốc tế Pháp ngữ Công nghệ thộng tin ; Cơ sở dữ liệu ; Học máy ; Trí tuệ nhân tạo 006.3 Les resultats du système implementé ont été analysé en fonction des metriques connues, telles que : le rappel, la précision et le F-Mesure. Nous avons constaté qu’avec la déduplication exacte ou approximative sur un champs(colonne) du dataset les resultats du système implementé et EBX sont les mêmes. Cependant avec la correspondance approximative sur plusieurs champs le système implementé avec l’approche d’apprentissage actif a donné de meilleurs resultats par rapport à EBX. Ceci pour 2 raisons majeures: l’automatisation du seuil de déduplication, la contribution humaine lors du processus de detection des enregistrements dupliqués Systèmes Intelligents et Multimédia 2020-02-15T06:50:43Z 2020-02-15T06:50:43Z 2018 Theses Mirlin, E. E. G. (2018). Système de déduplication utilisant les techniques d’apprentissage automatique. Mémoire de master, Université Nationale du VietNam de HaNoi 848020102 http://repository.vnu.edu.vn/handle/VNU_123/69288 MIR fr 52 tr. application/pdf
institution Vietnam National University, Hanoi
building VNU Library & Information Center
country Vietnam
collection VNU Digital Repository
language French
topic Công nghệ thộng tin ; Cơ sở dữ liệu ; Học máy ; Trí tuệ nhân tạo
006.3
spellingShingle Công nghệ thộng tin ; Cơ sở dữ liệu ; Học máy ; Trí tuệ nhân tạo
006.3
Mirlin, ELIODOR Ednalson Guy
Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
description Les resultats du système implementé ont été analysé en fonction des metriques connues, telles que : le rappel, la précision et le F-Mesure. Nous avons constaté qu’avec la déduplication exacte ou approximative sur un champs(colonne) du dataset les resultats du système implementé et EBX sont les mêmes. Cependant avec la correspondance approximative sur plusieurs champs le système implementé avec l’approche d’apprentissage actif a donné de meilleurs resultats par rapport à EBX. Ceci pour 2 raisons majeures: l’automatisation du seuil de déduplication, la contribution humaine lors du processus de detection des enregistrements dupliqués
author2 Bonnet, Pierre
author_facet Bonnet, Pierre
Mirlin, ELIODOR Ednalson Guy
format Theses
author Mirlin, ELIODOR Ednalson Guy
author_sort Mirlin, ELIODOR Ednalson Guy
title Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
title_short Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
title_full Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
title_fullStr Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
title_full_unstemmed Système de déduplication utilisant les techniques d’apprentissage automatique = Hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
title_sort système de déduplication utilisant les techniques d’apprentissage automatique = hệ thống phân tích dữ liệu trùng lặp sử dụng kĩ thuật machine learning
publishDate 2020
url http://repository.vnu.edu.vn/handle/VNU_123/69288
_version_ 1680967506608521216