Association between LINE-1 characteristics and gene expression in cancers using data mining techniques
Thesis (M.Sc.)--Chulalongkorn University, 2011
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Theses and Dissertations |
Language: | English |
Published: |
Chulalongkorn University
2013
|
Subjects: | |
Online Access: | http://cuir.car.chula.ac.th/handle/123456789/36493 http://doi.org/10.14457/CU.the.2011.93 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Chulalongkorn University |
Language: | English |
id |
th-cuir.36493 |
---|---|
record_format |
dspace |
spelling |
th-cuir.364932019-09-03T03:22:53Z Association between LINE-1 characteristics and gene expression in cancers using data mining techniques ความสัมพันธ์ระหว่างลักษณะของ LINE-1 กับระดับการแสดงออกของยีนในมะเร็ง โดยใช้เทคนิคการทำเหมืองข้อมูล Naruemon Pratanwanich Chatchawit Aporntewan Apiwat Aporntewan Chulalongkorn University. Faculty of Engineering Cancer cells Gene expression Data mining เซลล์มะเร็ง การแสดงออกของยีน ดาต้าไมนิง Thesis (M.Sc.)--Chulalongkorn University, 2011 Global hypomethylation has been found on L1 in cancer cells. Moreover, having L1 is significantly associated with down regulation of hosting genes for some cancers. Nonetheless, not all genes that possess L1 are down regulated. To identify L1 characteristics that mediate gene expression in cancers, we performed chi-square test and logistic regression for each variable along with decision tree and classification association rules mining for multivariate data analysis. The results from statistical methods indicated the significant L1 characteristics, especially the number of L1, individually associated with gene expression using at significance level α = 0.05. For data mining, the size of the decision tree was too large to be useful. However, rules mining could generate interesting rules. Each cancer dataset has special characteristic rules. Firstly, the derived rules from bladder and liver cancer dataset support the hypothesis that L1 transcription may control down regulation. Both groups of rules suggest the mechanism to promote L1 transcription but different L1 characteristics, the number of L1 > 2 and conserved SRY Site1, respectively. Secondly, the rules derived from prostate cancer represent L1 retrotranspositional activities (conserved ORF1 and/or ORF2) which include L1 transcription, RNA stability and processing, translation, DNA restriction, reverse transcription and insertion. Finally, conserved TF-nkx-2.5 may control down regulation of head and neck cancer. Moreover, the derived rules from the dataset emulating lung cancer by 5-AZA shows that sense and antisense L1 can probably control the expression of genes by either directions of L1 transcription. ในเซลล์มะเร็งหลายชนิดพบว่าระดับดีเอ็นเอเมทิลเลชันที่กระจายทั่วไปบน L1 ลดลงเรียกว่าโกลบอลเมทิลเลชัน และมีการค้นพบว่ายีนของเซลล์มะเร็งบางยีนมีการแสดงออกที่น้อยลงอย่างมีนัยสำคัญ ดังนั้นเพื่อวิเคราะห์ลักษณะของ L1 ที่มีผลต่อการแสดงออกของยีน งานวิจัยนี้จึงวิเคราะห์ลักษณะของ L1 ทีละลักษณะโดยการทดสอบไคว์สแควร์และวิเคราะห์การถดถอยโลจิสติก พร้อมทั้งใช้เทคนิคการทำเหมืองข้อมูลโดยใช้ต้นไม้ตัดสินใจและกฎเชื่อมโยง เพื่อวิเคราะห์หลายตัวแปรร่วมกันของ L1 ที่มีผลต่อการแสดงออกของยีนในเซลล์มะเร็ง ผลการวิเคราะห์ข้อมูลลักษณะของ L1 ตัวแปรเดียวแสดงให้เห็นว่าบางลักษณะของ L1 โดยเฉพาะจำนวน L1 มีผลต่อการแสดงออกของยีนในทิศทางที่น้อยลงอย่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ α = 0.05 นอกจากนี้ผลจากต้นไม้ตัดสินใจที่มีขนาดใหญ่ทำให้ยากที่จะแปลความหมาย แต่อย่างไรก็ตามกฎเชื่อมโยงสามารถแยกวิเคราะห์ตามชนิดของมะเร็ง โดยกฎที่ได้จากชุดข้อมูลมะเร็งกระเพาะปัสสาวะและมะเร็งตับสนับสนุนสมมติฐานที่ว่า การทรานสคริปชันของ L1 อาจจะควบคุมระดับการแสดงออกของยีนที่ลดลงได้ ซึ่งกฎทั้งสองชุดข้อมูลเสนอปัจจัยในการทรานสคริปชันของ L1 แตกต่างกัน คือ จำนวน L1 มากกว่าสองตัว และลำดับของ SRY Site1 ที่ไม่เปลี่ยนแปลง ตามลำดับ ส่วนกฎที่ได้จากมะเร็งต่อมลูกหมากเสนอปัจจัยที่มีผลต่อการย้ายตำแหน่งของ L1 ซึ่งรวมถึงกระบวนการทรานสคริปชันของ L1 ความเสถียรและกระบวนการของอาร์เอ็นเอ ทรานสเลชัน การตัดต่อดีเอ็นเอ และรีเวอร์สทรานสคริปชันและกระบวนการแทรก ปัจจัยเหล่านั้นคือ ลำดับบน ORF1 และ/หรือ ORF2 ที่ไม่เปลี่ยนแปลง สำหรับมะเร็งศีรษะและลำคอ ปัจจัยที่สำคัญที่ทำให้ระดับการแสดงออกของยีนลดลงคือลำดับของ TF-nkx-2.5 ที่ไม่เปลี่ยนแปลง นอกจากนี้กฎที่ได้จากชุดข้อมูลจำลองมะเร็งปอดโดยใช้สารเคมี 5-AZA แสดงให้เห็นว่าทิศทางการทรานสคริปชันของ L1 ทั้งสองทิศทางสามารถควบคุมระดับการแสดงออกของยีนได้ 2013-10-31T15:37:10Z 2013-10-31T15:37:10Z 2011 Thesis http://cuir.car.chula.ac.th/handle/123456789/36493 10.14457/CU.the.2011.93 en http://doi.org/10.14457/CU.the.2011.93 Chulalongkorn University application/pdf Chulalongkorn University |
institution |
Chulalongkorn University |
building |
Chulalongkorn University Library |
continent |
Asia |
country |
Thailand Thailand |
content_provider |
Chulalongkorn University Library |
collection |
Chulalongkorn University Intellectual Repository |
language |
English |
topic |
Cancer cells Gene expression Data mining เซลล์มะเร็ง การแสดงออกของยีน ดาต้าไมนิง |
spellingShingle |
Cancer cells Gene expression Data mining เซลล์มะเร็ง การแสดงออกของยีน ดาต้าไมนิง Naruemon Pratanwanich Association between LINE-1 characteristics and gene expression in cancers using data mining techniques |
description |
Thesis (M.Sc.)--Chulalongkorn University, 2011 |
author2 |
Chatchawit Aporntewan |
author_facet |
Chatchawit Aporntewan Naruemon Pratanwanich |
format |
Theses and Dissertations |
author |
Naruemon Pratanwanich |
author_sort |
Naruemon Pratanwanich |
title |
Association between LINE-1 characteristics and gene expression in cancers using data mining techniques |
title_short |
Association between LINE-1 characteristics and gene expression in cancers using data mining techniques |
title_full |
Association between LINE-1 characteristics and gene expression in cancers using data mining techniques |
title_fullStr |
Association between LINE-1 characteristics and gene expression in cancers using data mining techniques |
title_full_unstemmed |
Association between LINE-1 characteristics and gene expression in cancers using data mining techniques |
title_sort |
association between line-1 characteristics and gene expression in cancers using data mining techniques |
publisher |
Chulalongkorn University |
publishDate |
2013 |
url |
http://cuir.car.chula.ac.th/handle/123456789/36493 http://doi.org/10.14457/CU.the.2011.93 |
_version_ |
1724629704020852736 |