Association between LINE-1 characteristics and gene expression in cancers using data mining techniques

Thesis (M.Sc.)--Chulalongkorn University, 2011

Saved in:
Bibliographic Details
Main Author: Naruemon Pratanwanich
Other Authors: Chatchawit Aporntewan
Format: Theses and Dissertations
Language:English
Published: Chulalongkorn University 2013
Subjects:
Online Access:http://cuir.car.chula.ac.th/handle/123456789/36493
http://doi.org/10.14457/CU.the.2011.93
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Chulalongkorn University
Language: English
id th-cuir.36493
record_format dspace
spelling th-cuir.364932019-09-03T03:22:53Z Association between LINE-1 characteristics and gene expression in cancers using data mining techniques ความสัมพันธ์ระหว่างลักษณะของ LINE-1 กับระดับการแสดงออกของยีนในมะเร็ง โดยใช้เทคนิคการทำเหมืองข้อมูล Naruemon Pratanwanich Chatchawit Aporntewan Apiwat Aporntewan Chulalongkorn University. Faculty of Engineering Cancer cells Gene expression Data mining เซลล์มะเร็ง การแสดงออกของยีน ดาต้าไมนิง Thesis (M.Sc.)--Chulalongkorn University, 2011 Global hypomethylation has been found on L1 in cancer cells. Moreover, having L1 is significantly associated with down regulation of hosting genes for some cancers. Nonetheless, not all genes that possess L1 are down regulated. To identify L1 characteristics that mediate gene expression in cancers, we performed chi-square test and logistic regression for each variable along with decision tree and classification association rules mining for multivariate data analysis. The results from statistical methods indicated the significant L1 characteristics, especially the number of L1, individually associated with gene expression using at significance level α = 0.05. For data mining, the size of the decision tree was too large to be useful. However, rules mining could generate interesting rules. Each cancer dataset has special characteristic rules. Firstly, the derived rules from bladder and liver cancer dataset support the hypothesis that L1 transcription may control down regulation. Both groups of rules suggest the mechanism to promote L1 transcription but different L1 characteristics, the number of L1 > 2 and conserved SRY Site1, respectively. Secondly, the rules derived from prostate cancer represent L1 retrotranspositional activities (conserved ORF1 and/or ORF2) which include L1 transcription, RNA stability and processing, translation, DNA restriction, reverse transcription and insertion. Finally, conserved TF-nkx-2.5 may control down regulation of head and neck cancer. Moreover, the derived rules from the dataset emulating lung cancer by 5-AZA shows that sense and antisense L1 can probably control the expression of genes by either directions of L1 transcription. ในเซลล์มะเร็งหลายชนิดพบว่าระดับดีเอ็นเอเมทิลเลชันที่กระจายทั่วไปบน L1 ลดลงเรียกว่าโกลบอลเมทิลเลชัน และมีการค้นพบว่ายีนของเซลล์มะเร็งบางยีนมีการแสดงออกที่น้อยลงอย่างมีนัยสำคัญ ดังนั้นเพื่อวิเคราะห์ลักษณะของ L1 ที่มีผลต่อการแสดงออกของยีน งานวิจัยนี้จึงวิเคราะห์ลักษณะของ L1 ทีละลักษณะโดยการทดสอบไคว์สแควร์และวิเคราะห์การถดถอยโลจิสติก พร้อมทั้งใช้เทคนิคการทำเหมืองข้อมูลโดยใช้ต้นไม้ตัดสินใจและกฎเชื่อมโยง เพื่อวิเคราะห์หลายตัวแปรร่วมกันของ L1 ที่มีผลต่อการแสดงออกของยีนในเซลล์มะเร็ง ผลการวิเคราะห์ข้อมูลลักษณะของ L1 ตัวแปรเดียวแสดงให้เห็นว่าบางลักษณะของ L1 โดยเฉพาะจำนวน L1 มีผลต่อการแสดงออกของยีนในทิศทางที่น้อยลงอย่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ α = 0.05 นอกจากนี้ผลจากต้นไม้ตัดสินใจที่มีขนาดใหญ่ทำให้ยากที่จะแปลความหมาย แต่อย่างไรก็ตามกฎเชื่อมโยงสามารถแยกวิเคราะห์ตามชนิดของมะเร็ง โดยกฎที่ได้จากชุดข้อมูลมะเร็งกระเพาะปัสสาวะและมะเร็งตับสนับสนุนสมมติฐานที่ว่า การทรานสคริปชันของ L1 อาจจะควบคุมระดับการแสดงออกของยีนที่ลดลงได้ ซึ่งกฎทั้งสองชุดข้อมูลเสนอปัจจัยในการทรานสคริปชันของ L1 แตกต่างกัน คือ จำนวน L1 มากกว่าสองตัว และลำดับของ SRY Site1 ที่ไม่เปลี่ยนแปลง ตามลำดับ ส่วนกฎที่ได้จากมะเร็งต่อมลูกหมากเสนอปัจจัยที่มีผลต่อการย้ายตำแหน่งของ L1 ซึ่งรวมถึงกระบวนการทรานสคริปชันของ L1 ความเสถียรและกระบวนการของอาร์เอ็นเอ ทรานสเลชัน การตัดต่อดีเอ็นเอ และรีเวอร์สทรานสคริปชันและกระบวนการแทรก ปัจจัยเหล่านั้นคือ ลำดับบน ORF1 และ/หรือ ORF2 ที่ไม่เปลี่ยนแปลง สำหรับมะเร็งศีรษะและลำคอ ปัจจัยที่สำคัญที่ทำให้ระดับการแสดงออกของยีนลดลงคือลำดับของ TF-nkx-2.5 ที่ไม่เปลี่ยนแปลง นอกจากนี้กฎที่ได้จากชุดข้อมูลจำลองมะเร็งปอดโดยใช้สารเคมี 5-AZA แสดงให้เห็นว่าทิศทางการทรานสคริปชันของ L1 ทั้งสองทิศทางสามารถควบคุมระดับการแสดงออกของยีนได้ 2013-10-31T15:37:10Z 2013-10-31T15:37:10Z 2011 Thesis http://cuir.car.chula.ac.th/handle/123456789/36493 10.14457/CU.the.2011.93 en http://doi.org/10.14457/CU.the.2011.93 Chulalongkorn University application/pdf Chulalongkorn University
institution Chulalongkorn University
building Chulalongkorn University Library
continent Asia
country Thailand
Thailand
content_provider Chulalongkorn University Library
collection Chulalongkorn University Intellectual Repository
language English
topic Cancer cells
Gene expression
Data mining
เซลล์มะเร็ง
การแสดงออกของยีน
ดาต้าไมนิง
spellingShingle Cancer cells
Gene expression
Data mining
เซลล์มะเร็ง
การแสดงออกของยีน
ดาต้าไมนิง
Naruemon Pratanwanich
Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
description Thesis (M.Sc.)--Chulalongkorn University, 2011
author2 Chatchawit Aporntewan
author_facet Chatchawit Aporntewan
Naruemon Pratanwanich
format Theses and Dissertations
author Naruemon Pratanwanich
author_sort Naruemon Pratanwanich
title Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
title_short Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
title_full Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
title_fullStr Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
title_full_unstemmed Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
title_sort association between line-1 characteristics and gene expression in cancers using data mining techniques
publisher Chulalongkorn University
publishDate 2013
url http://cuir.car.chula.ac.th/handle/123456789/36493
http://doi.org/10.14457/CU.the.2011.93
_version_ 1724629704020852736