Combinaison de méthodes avancées de visualisation et de sélection d’information pour la fouille et l’analyse de données

La combinaison de méthodes avancées de visualisation et d’étiquetage des clusters joue un rôle important non seulement pour donner un avis global des résultats du clustering, mais aussi pour l’évaluation précise desdits résultats. Mais aujourd’hui encore, aucune solution précise sur la façon de c...

全面介紹

Saved in:
書目詳細資料
Main Authors: LAMIREL, Jean-Charles, TA, Anh Phuong
格式: Theses and Dissertations
語言:French
出版: 2015
主題:
在線閱讀:http://repository.vnu.edu.vn/handle/VNU_123/232
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!
機構: Vietnam National University, Hanoi
語言: French
實物特徵
總結:La combinaison de méthodes avancées de visualisation et d’étiquetage des clusters joue un rôle important non seulement pour donner un avis global des résultats du clustering, mais aussi pour l’évaluation précise desdits résultats. Mais aujourd’hui encore, aucune solution précise sur la façon de combiner de telles méthodes n’a été proposée. Dans ce rapport, nous présentons une première tentative de combinaison de la visualisation hyperbolique ainsi que de nouvelles approches d’étiquetage afin de visualiser précisément les résultats d’analyses de données issues de méthodes de clustering toutes les fois que les clusters sont à l’origine représentés dans un espace fortement multidimensionnel. Le modèle de visualisation se fonde sur un algorithme hiérarchique qui est employé pour récapituler le contenu de clusters sous forme hiérarchique. Cet algorithme préserve la densité de données issue de l’espace de description des clusters originaux. Dans ce mémoire sont présentées différentes stratégies d’étiquetage qui peuvent être employées aussi bien pour décrire le contenu de base des clusters que pour propager précisément les étiquettes dans les différents niveaux de l’hyperbolique résultant. Ce travail s’attache ensuite à améliorer les défauts des méthodes de visualisation hyperbolique en embarquant le modèle de Spring à l’hyperbolique afin de mieux montrer les relations entre les clusters. Plusieurs expérimentations sont proposées sur différents types de données documentaires.