Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen
Chương 1. Giới thiệu khái quát về hệ gen người và các mạng phát sinh loài (phylogenetic networks). Sau đó là phần giới thiệu về bài toán xây dựng đồ thị ARG. Phần cuối của chương trình bày các cách tiếp cận giải bài toán xây dựng đồ thị ARG và ứng dụng của ARG trong nghiên cứu tương quan toàn hệ gen...
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Dissertations |
Language: | Vietnamese |
Published: |
2020
|
Subjects: | |
Online Access: | http://repository.vnu.edu.vn/handle/VNU_123/99441 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Vietnam National University, Hanoi |
Language: | Vietnamese |
id |
oai:112.137.131.14:VNU_123-99441 |
---|---|
record_format |
dspace |
spelling |
oai:112.137.131.14:VNU_123-994412021-01-16T15:48:55Z Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen Nguyễn, Thị Phương Thảo Lê, Sỹ Vinh Lương, Chi Mai ĐHQGHN - Trường Đại học Công nghệ Dữ liệu Khoa học máy tính Hệ gen Thuật toán 005.74 Chương 1. Giới thiệu khái quát về hệ gen người và các mạng phát sinh loài (phylogenetic networks). Sau đó là phần giới thiệu về bài toán xây dựng đồ thị ARG. Phần cuối của chương trình bày các cách tiếp cận giải bài toán xây dựng đồ thị ARG và ứng dụng của ARG trong nghiên cứu tương quan toàn hệ gen. Chương 2. Đề xuất một thuật toán xây dựng đồ thị ARG cho dữ liệu lớn hàng nghìn trình tự độ dài hệ gen người. Để làm được điều đó, chúng tôi đưa ra các nhược điểm của các cách tiếp cận hiện có, đặc biệt là những hạn chế trong thuật toán Margarita xây dựng đồ thị ARG hợp lý được đề xuất bởi Minichiello và Durbin [52], từ đó đưa ra thuật toán đề xuất nhằm khắc phục các nhược điểm đó. Các kết quả thực nghiệm ở phần sau của chương đã chứng tỏ hiệu quả của thuật toán đề xuất. Phần cuối của chương giới thiệu kết quả ứng dụng thuật toán đề xuất vào bài toán tìm vùng gen liên quan đến bệnh sốt rét ở Châu Phi trên tập dữ liệu lớn gồm 5560 trình tự trên toàn nhiễm sắc thể 11. Các kết quả trong phần này đã khẳng định thêm hiệu quả, khả năng ứng dụng của thuật toán đề xuất trong các bài toán thực tế trên dữ liệu lớn. Chương 3 của luận án giới thiệu các phương pháp nhằm cực tiểu hóa số sự kiện tái tổ hợp trong quá trình xây dựng đồ thị ARG. Cụ thể, chúng tôi đề xuất hai phương pháp: (1) kết hợp một số đặc trưng của dữ liệu; (2) kết hợp kĩ thuật sử dụng trong các phương pháp xây dựng đồ thị ARG tối thiểu với chiến lược thực hiện sự kiện tái tổ hợp đề xuất trong chương 2 để tối ưu hóa số sự kiện tái tổ hợp. Các thực nghiệm trên các bộ dữ liệu khác nhau đã chứng tỏ hiệu quả của các phương pháp đề xuất. Khoa học Máy tính 2020-12-22T07:30:18Z 2020-12-22T07:30:18Z 2020 Dissertations 00050011003 Nguyễn, T. P. T. (2020). Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen. Luận án tiến sỹ, Đại học Quốc gia Hà Nội, Việt Nam 9480101.01 http://repository.vnu.edu.vn/handle/VNU_123/99441 NG-T vi 112 tr. application/pdf |
institution |
Vietnam National University, Hanoi |
building |
VNU Library & Information Center |
continent |
Asia |
country |
Vietnam Vietnam |
content_provider |
VNU Library and Information Center |
collection |
VNU Digital Repository |
language |
Vietnamese |
topic |
Dữ liệu Khoa học máy tính Hệ gen Thuật toán 005.74 |
spellingShingle |
Dữ liệu Khoa học máy tính Hệ gen Thuật toán 005.74 Nguyễn, Thị Phương Thảo Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
description |
Chương 1. Giới thiệu khái quát về hệ gen người và các mạng phát sinh loài (phylogenetic networks). Sau đó là phần giới thiệu về bài toán xây dựng đồ thị ARG. Phần cuối của chương trình bày các cách tiếp cận giải bài toán xây dựng đồ thị ARG và ứng dụng của ARG trong nghiên cứu tương quan toàn hệ gen. Chương 2. Đề xuất một thuật toán xây dựng đồ thị ARG cho dữ liệu lớn hàng nghìn trình tự độ dài hệ gen người. Để làm được điều đó, chúng tôi đưa ra các nhược điểm của các cách tiếp cận hiện có, đặc biệt là những hạn chế trong thuật toán Margarita xây dựng đồ thị ARG hợp lý được đề xuất bởi Minichiello và Durbin [52], từ đó đưa ra thuật toán đề xuất nhằm khắc phục các nhược điểm đó. Các kết quả thực nghiệm ở phần sau của chương đã chứng tỏ hiệu quả của thuật toán đề xuất. Phần cuối của chương giới thiệu kết quả ứng dụng thuật toán đề xuất vào bài toán tìm vùng gen liên quan đến bệnh sốt rét ở Châu Phi trên tập dữ liệu lớn gồm 5560 trình tự trên toàn nhiễm sắc thể 11. Các kết quả trong phần này đã khẳng định thêm hiệu quả, khả năng ứng dụng của thuật toán đề xuất trong các bài toán thực tế trên dữ liệu lớn. Chương 3 của luận án giới thiệu các phương pháp nhằm cực tiểu hóa số sự kiện tái tổ hợp trong quá trình xây dựng đồ thị ARG. Cụ thể, chúng tôi đề xuất hai phương pháp: (1) kết hợp một số đặc trưng của dữ liệu; (2) kết hợp kĩ thuật sử dụng trong các phương pháp xây dựng đồ thị ARG tối thiểu với chiến lược thực hiện sự kiện tái tổ hợp đề xuất trong chương 2 để tối ưu hóa số sự kiện tái tổ hợp. Các thực nghiệm trên các bộ dữ liệu khác nhau đã chứng tỏ hiệu quả của các phương pháp đề xuất. |
author2 |
Lê, Sỹ Vinh |
author_facet |
Lê, Sỹ Vinh Nguyễn, Thị Phương Thảo |
format |
Dissertations |
author |
Nguyễn, Thị Phương Thảo |
author_sort |
Nguyễn, Thị Phương Thảo |
title |
Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
title_short |
Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
title_full |
Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
title_fullStr |
Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
title_full_unstemmed |
Xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
title_sort |
xây dựng đồ thị tái tổ hợp di truyền cho dữ liệu hệ gen |
publishDate |
2020 |
url |
http://repository.vnu.edu.vn/handle/VNU_123/99441 |
_version_ |
1690729352839299072 |