Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données

La combinaison de méthodes avancées de visualisation et d’étiquetage des clusters joue un rôle important non seulement pour donner un avis global des résultats du clustering, mais aussi pour l’évaluation précise desdits résultats. Mais aujourd’hui encore, aucune solution précise sur la façon de c...

Full description

Saved in:
Bibliographic Details
Main Authors: LAMIREL, Jean-Charles, TA, Anh Phuong
Format: Theses and Dissertations
Language:French
Published: 2015
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/232
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: French
id oai:112.137.131.14:VNU_123-232
record_format dspace
spelling oai:112.137.131.14:VNU_123-2322017-04-05T14:15:16Z Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données LAMIREL, Jean-Charles TA, Anh Phuong analyse de données multi-vues fouille de données clustering numérique évaluation de qualité du clustering étiquetage des clusters visualisation hyperbolique visualisation hiérarchique La combinaison de méthodes avancées de visualisation et d’étiquetage des clusters joue un rôle important non seulement pour donner un avis global des résultats du clustering, mais aussi pour l’évaluation précise desdits résultats. Mais aujourd’hui encore, aucune solution précise sur la façon de combiner de telles méthodes n’a été proposée. Dans ce rapport, nous présentons une première tentative de combinaison de la visualisation hyperbolique ainsi que de nouvelles approches d’étiquetage afin de visualiser précisément les résultats d’analyses de données issues de méthodes de clustering toutes les fois que les clusters sont à l’origine représentés dans un espace fortement multidimensionnel. Le modèle de visualisation se fonde sur un algorithme hiérarchique qui est employé pour récapituler le contenu de clusters sous forme hiérarchique. Cet algorithme préserve la densité de données issue de l’espace de description des clusters originaux. Dans ce mémoire sont présentées différentes stratégies d’étiquetage qui peuvent être employées aussi bien pour décrire le contenu de base des clusters que pour propager précisément les étiquettes dans les différents niveaux de l’hyperbolique résultant. Ce travail s’attache ensuite à améliorer les défauts des méthodes de visualisation hyperbolique en embarquant le modèle de Spring à l’hyperbolique afin de mieux montrer les relations entre les clusters. Plusieurs expérimentations sont proposées sur différents types de données documentaires. 2015-07-23T08:38:59Z 2015-07-23T08:38:59Z 2007 Thesis http://repository.vnu.edu.vn/handle/VNU_123/232 fr application/pdf
institution Vietnam National University, Hanoi
building VNU Library & Information Center
country Vietnam
collection VNU Digital Repository
language French
topic analyse de données multi-vues
fouille de données
clustering numérique
évaluation de qualité du clustering
étiquetage des clusters
visualisation hyperbolique
visualisation hiérarchique
spellingShingle analyse de données multi-vues
fouille de données
clustering numérique
évaluation de qualité du clustering
étiquetage des clusters
visualisation hyperbolique
visualisation hiérarchique
LAMIREL, Jean-Charles
TA, Anh Phuong
Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
description La combinaison de méthodes avancées de visualisation et d’étiquetage des clusters joue un rôle important non seulement pour donner un avis global des résultats du clustering, mais aussi pour l’évaluation précise desdits résultats. Mais aujourd’hui encore, aucune solution précise sur la façon de combiner de telles méthodes n’a été proposée. Dans ce rapport, nous présentons une première tentative de combinaison de la visualisation hyperbolique ainsi que de nouvelles approches d’étiquetage afin de visualiser précisément les résultats d’analyses de données issues de méthodes de clustering toutes les fois que les clusters sont à l’origine représentés dans un espace fortement multidimensionnel. Le modèle de visualisation se fonde sur un algorithme hiérarchique qui est employé pour récapituler le contenu de clusters sous forme hiérarchique. Cet algorithme préserve la densité de données issue de l’espace de description des clusters originaux. Dans ce mémoire sont présentées différentes stratégies d’étiquetage qui peuvent être employées aussi bien pour décrire le contenu de base des clusters que pour propager précisément les étiquettes dans les différents niveaux de l’hyperbolique résultant. Ce travail s’attache ensuite à améliorer les défauts des méthodes de visualisation hyperbolique en embarquant le modèle de Spring à l’hyperbolique afin de mieux montrer les relations entre les clusters. Plusieurs expérimentations sont proposées sur différents types de données documentaires.
format Theses and Dissertations
author LAMIREL, Jean-Charles
TA, Anh Phuong
author_facet LAMIREL, Jean-Charles
TA, Anh Phuong
author_sort LAMIREL, Jean-Charles
title Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
title_short Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
title_full Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
title_fullStr Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
title_full_unstemmed Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
title_sort combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données
publishDate 2015
url http://repository.vnu.edu.vn/handle/VNU_123/232
_version_ 1680965213694722048