Personalized molecular interaction models for Alzheimer's disease based on multi-layer information in RNA-Seq data

Yükleniyor...
Küçük Resim

Tarih

Yazarlar

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Gebze Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Alzheimer hastalığı (AH), en yaygın nörodejeneratif hastalıktır ve kesin bir tedavisi bulunmamaktadır. Ağ analizleri, biyolojik verilerden fiziksel etkileşimlerin elde edilmesini sağlar. Transkriptomik verilerin organizmaya özgü bir protein-protein etkileşim (PPE) ağına haritalanması, alt ağların belirlenmesi için literatürde yaygın olarak kullanılan bir yaklaşımdır. Keşfedilen alt ağlar, anlamlı değişen genlerin arasından birbirleri ile protein düzeyinde fiziksel olarak etkileşenlerin seçilmesini sağlar. Gen ko-ekspresyon ağları ise, başlangıçta bir PPE ağına ihtiyaç duymadan, tamamen genler arasındaki ilişkiler temelinde oluşturulan ağlardır. Bu çalışmada, AH RNA-Seq verisinden farklı türlerde bilgi elde edilmiş ve alt-ağ ile ko-ekspression ağ analizleri sayesinde hastalığa özgü anlamlı moduller belirlenmiştir. İlk olarak, RNA-Seq veri analizinin en kritik ve ilk aşaması olan normalizasyon yöntemi seçimi için dört farklı yöntem değerlendirilmiştir. Bu karşılaştırmada, yaş, cinsiyet ve post-mortem sürenin etkisi eşdeğişken ayarlaması ile kaldırılarak da analizler gerçekleştirilmiştir. Sonuç olarak, eşdeğişken ayarlaması yapılmış TMM ve DESeq2 yöntemlerinin RNA-Seq verisi için en uygun normalizasyon yaklaşımları olduğu tespit edilmiştir. Çalışmanın ilerleyen aşamalarında ise eşdeğişken ayarlaması yapılmış DESeq2 normalizasyonu kullanılmıştır. lncRNA'ların ve hastalarda daha yüksek patojenik varyant yükü taşıyan genlerin, anlamlı değişen gen analizine ve devamındaki alt-ağ analizlerine dahil edilmesinin olumlu etkileri araştırılmış ve bu durum alt-ağların içeriğinin fonksiyonel terimler açısından incelenmesiyle kanıtlanmıştır. Dört farklı RNA-Seq veri setinde, kontrol ve hasta durumları arasında korelasyonu artan veya azalan lncRNA-lncRNA ve lncRNA-protein etkileşimleri analiz edilmiş ve AH'na özgü etkileşimler tanımlanmıştır. Ayrıca, fonksiyonları henüz bilinmeyen lncRNA moleküllerinin olası mekanizmalarla bağlantısı üzerine öneriler sunulmuştur. Son olarak, bu analizler, her hastaya özel bir şekilde tekrarlanmış ve AH alt tiplerinin karakterizasyonu gerçekleştirilmiştir. Çalışma sonucunda, AH RNA-Seq verisi için en uygun normalizasyon yöntemleri belirlenmiş, farklı türde bilgilerin (genomic variant, lncRNA düzeyleri) alt-ağlara entegre edilmesinin avantajları ortaya konmuş, AH için lncRNA etkileşimlerinin önemi korelasyon analizleri ile vurgulanmış ve hastaya özel analizlerle AH'na özgü alt tipler incelenmiştir. Bu analizler sayesinde, AH RNA-Seq verisinden maksimum düzeyde bilgi elde edilmiştir.

Alzheimer's disease (AD) is the most common neurodegenerative disease, and there is no curtain cure. Mapping transcriptomic data onto an organism-specific protein-protein interaction (PPI) network to identify subnetworks is a widely adopted approach in the literature. The discovered subnetworks capture a subset of differentially expressed genes (DEGs) that form physically interconnected modules at protein level. Gene co-expression networks, on the other hand, are networks constructed entirely based on the relationships between the expression levels of genes, without the need for a predefined network. In this thesis study, different types of information (mRNA levels, genomic variants and lncRNA levels) were extracted from the RNA-Seq datasets derived from post-mortem brain samples of AD patients, and disease-specific meaningful modules were identified through subnetwork and co-expression network analyses. First, to determine the optimal method for raw data normalization, a critical and initial step in RNA-Seq data analysis, four different approaches were evaluated. In this comparison, analyses were performed both with and without the inclusion of covariate adjustment to eliminate the effects of age, gender, and post-mortem interval for sample isolation. As a result, covariate-adjusted TMM and DESeq2 were identified as the most suitable RNA-Seq data normalization approaches. For the subsequent analyses, covariate-adjusted DESeq2 normalization was utilized. lncRNAs and genes with higher load of pathogenic variants in AD were combined with DEGs and mapped onto a human PPI network, and the resulting subnetworks were superior to the case where only DEGs were used, as demonstrated through the functional enrichment analysis of subnetwork content. Additionally, lncRNA-lncRNA and lncRNA-protein interactions with increased or decreased correlation in control and disease states were analyzed across four different RNA-Seq datasets, leading to the identification of AD-specific interactions. Moreover, hypotheses were proposed regarding the potential mechanisms associated with lncRNA molecules with yet unknown functions. Finally, personalized data analysis was conducted, and AD specific subtypes were characterized in detail. As a result of this thesis study, the most suitable normalization methods for AD RNA-Seq data were identified, the advantages of integrating different types of information into subnetworks (genomic variants and lncRNA levels) were demonstrated, the significance of lncRNA interactions in AD was emphasized through correlation analyses, and AD-specific subtypes were characterized through patient-specific analyses. These comprehensive analyses enabled the extraction of maximum information from AD RNA-Seq data.

Açıklama

Anahtar Kelimeler

Biyoistatistik, Biostatistics, Biyomühendislik

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Onay

İnceleme

Ekleyen

Referans Veren