Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen

Chương 1. Giới thiệu khái quát về hệ gen người và các mạng phát sinh loài (phylogenetic networks). Sau đó là phần giới thiệu về bài toán xây dựng đồ thị ARG. Phần cuối của chương trình bày các cách tiếp cận giải bài toán xây dựng đồ thị ARG và ứng dụng của ARG trong nghiên cứu tương quan toàn hệ gen...

Full description

Saved in:
Bibliographic Details
Main Author: Nguyễn, Thị Phương Thảo
Other Authors: Lê, Sỹ Vinh
Format: Dissertations
Language:Vietnamese
Published: 2020
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/99441
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: Vietnamese
id oai:112.137.131.14:VNU_123-99441
record_format dspace
spelling oai:112.137.131.14:VNU_123-994412021-01-16T15:48:55Z Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen Nguyễn, Thị Phương Thảo Lê, Sỹ Vinh Lương, Chi Mai ĐHQGHN - Trường Đại học Công nghệ Dữ liệu Khoa học máy tính Hệ gen Thuật toán 005.74 Chương 1. Giới thiệu khái quát về hệ gen người và các mạng phát sinh loài (phylogenetic networks). Sau đó là phần giới thiệu về bài toán xây dựng đồ thị ARG. Phần cuối của chương trình bày các cách tiếp cận giải bài toán xây dựng đồ thị ARG và ứng dụng của ARG trong nghiên cứu tương quan toàn hệ gen. Chương 2. Đề xuất một thuật toán xây dựng đồ thị ARG cho dữ liệu lớn hàng nghìn trình tự độ dài hệ gen người. Để làm được điều đó, chúng tôi đưa ra các nhược điểm của các cách tiếp cận hiện có, đặc biệt là những hạn chế trong thuật toán Margarita xây dựng đồ thị ARG hợp lý được đề xuất bởi Minichiello và Durbin [52], từ đó đưa ra thuật toán đề xuất nhằm khắc phục các nhược điểm đó. Các kết quả thực nghiệm ở phần sau của chương đã chứng tỏ hiệu quả của thuật toán đề xuất. Phần cuối của chương giới thiệu kết quả ứng dụng thuật toán đề xuất vào bài toán tìm vùng gen liên quan đến bệnh sốt rét ở Châu Phi trên tập dữ liệu lớn gồm 5560 trình tự trên toàn nhiễm sắc thể 11. Các kết quả trong phần này đã khẳng định thêm hiệu quả, khả năng ứng dụng của thuật toán đề xuất trong các bài toán thực tế trên dữ liệu lớn. Chương 3 của luận án giới thiệu các phương pháp nhằm cực tiểu hóa số sự kiện tái tổ hợp trong quá trình xây dựng đồ thị ARG. Cụ thể, chúng tôi đề xuất hai phương pháp: (1) kết hợp một số đặc trưng của dữ liệu; (2) kết hợp kĩ thuật sử dụng trong các phương pháp xây dựng đồ thị ARG tối thiểu với chiến lược thực hiện sự kiện tái tổ hợp đề xuất trong chương 2 để tối ưu hóa số sự kiện tái tổ hợp. Các thực nghiệm trên các bộ dữ liệu khác nhau đã chứng tỏ hiệu quả của các phương pháp đề xuất. Khoa học Máy tính 2020-12-22T07:30:18Z 2020-12-22T07:30:18Z 2020 Dissertations 00050011003 Nguyễn, T. P. T. (2020). Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen. Luận án tiến sỹ, Đại học Quốc gia Hà Nội, Việt Nam 9480101.01 http://repository.vnu.edu.vn/handle/VNU_123/99441 NG-T vi 112 tr. application/pdf
institution Vietnam National University, Hanoi
building VNU Library & Information Center
continent Asia
country Vietnam
Vietnam
content_provider VNU Library and Information Center
collection VNU Digital Repository
language Vietnamese
topic Dữ liệu
Khoa học máy tính
Hệ gen
Thuật toán
005.74
spellingShingle Dữ liệu
Khoa học máy tính
Hệ gen
Thuật toán
005.74
Nguyễn, Thị Phương Thảo
Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
description Chương 1. Giới thiệu khái quát về hệ gen người và các mạng phát sinh loài (phylogenetic networks). Sau đó là phần giới thiệu về bài toán xây dựng đồ thị ARG. Phần cuối của chương trình bày các cách tiếp cận giải bài toán xây dựng đồ thị ARG và ứng dụng của ARG trong nghiên cứu tương quan toàn hệ gen. Chương 2. Đề xuất một thuật toán xây dựng đồ thị ARG cho dữ liệu lớn hàng nghìn trình tự độ dài hệ gen người. Để làm được điều đó, chúng tôi đưa ra các nhược điểm của các cách tiếp cận hiện có, đặc biệt là những hạn chế trong thuật toán Margarita xây dựng đồ thị ARG hợp lý được đề xuất bởi Minichiello và Durbin [52], từ đó đưa ra thuật toán đề xuất nhằm khắc phục các nhược điểm đó. Các kết quả thực nghiệm ở phần sau của chương đã chứng tỏ hiệu quả của thuật toán đề xuất. Phần cuối của chương giới thiệu kết quả ứng dụng thuật toán đề xuất vào bài toán tìm vùng gen liên quan đến bệnh sốt rét ở Châu Phi trên tập dữ liệu lớn gồm 5560 trình tự trên toàn nhiễm sắc thể 11. Các kết quả trong phần này đã khẳng định thêm hiệu quả, khả năng ứng dụng của thuật toán đề xuất trong các bài toán thực tế trên dữ liệu lớn. Chương 3 của luận án giới thiệu các phương pháp nhằm cực tiểu hóa số sự kiện tái tổ hợp trong quá trình xây dựng đồ thị ARG. Cụ thể, chúng tôi đề xuất hai phương pháp: (1) kết hợp một số đặc trưng của dữ liệu; (2) kết hợp kĩ thuật sử dụng trong các phương pháp xây dựng đồ thị ARG tối thiểu với chiến lược thực hiện sự kiện tái tổ hợp đề xuất trong chương 2 để tối ưu hóa số sự kiện tái tổ hợp. Các thực nghiệm trên các bộ dữ liệu khác nhau đã chứng tỏ hiệu quả của các phương pháp đề xuất.
author2 Lê, Sỹ Vinh
author_facet Lê, Sỹ Vinh
Nguyễn, Thị Phương Thảo
format Dissertations
author Nguyễn, Thị Phương Thảo
author_sort Nguyễn, Thị Phương Thảo
title Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
title_short Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
title_full Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
title_fullStr Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
title_full_unstemmed Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
title_sort xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
publishDate 2020
url http://repository.vnu.edu.vn/handle/VNU_123/99441
_version_ 1690729352839299072