DÉVELOPPEMENT D’UN SYSTÈME CONNAISSANCE POUR BIG DATA APPLICATION AUX DONNÉES DE PHÉNOTYPAGE CHEZ LE RIZ (O. SATIVA)

Depuis quelques ann ́ees, le d ́eluge de donn ́ees dans plusieurs domaines de la recherche scientifique soul`eve des d ́efis dans le traitement et l’exploitation des donn ́ees. La recherche dans le domaine bioinforma- tique n’est pas ́epargn ́ee par ce ph ́enom`ene. Ce m ́emoire pr ́esente des ap...

Full description

Saved in:
Bibliographic Details
Main Author: Le Ngoc Luyen
Format: Theses and Dissertations
Language:French
Published: 2016
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/9876
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: French
Description
Summary:Depuis quelques ann ́ees, le d ́eluge de donn ́ees dans plusieurs domaines de la recherche scientifique soul`eve des d ́efis dans le traitement et l’exploitation des donn ́ees. La recherche dans le domaine bioinforma- tique n’est pas ́epargn ́ee par ce ph ́enom`ene. Ce m ́emoire pr ́esente des approches pour r ́esoudre le probl`eme de donn ́ees volumineuses stock ́ees dans des entrepˆots NoSQL en y associant la capacit ́e de recherche s ́emantique sur les donn ́ees dans un contexte de recherche agronomique. Ces approches s ́emantiques permettent d’aider ` a enrichir les donn ́ees issues d’exp ́eriences grˆace aux moteurs d’inf ́erence g ́en ́erant de nouvelles connaissances. Nous pouvons r ́esumer ces deux approches d’une part avec la r ́e ́ecriture de requˆetes et d’autre part avec la mat ́erialisation de donn ́ees en triplets RDF. Un ́etat de l’art nous a permis d’identifier et d’ ́evaluer les diff ́erentes m ́ethodes se rapportant aux approches mentionn ́ees. En pratique, seule l’approche de mat ́erialisation de donn ́ees a ́et ́e choisie pour continuer `a travailler. Les donn ́ees triplets obtenues ́etant volumineuses, nous avons r ́ealis ́e un benchmark sur diff ́erents syst`emes de gestion de base de donn ́ees de triplets afin de pouvoir comparer les avantages et les inconv ́enients de chacun et de choisir le meilleur syst`eme pour notre ́etude de cas.