İnsan mikrobiyota verisi üzerinde makine öğrenmesi ve derin öğrenme yöntemlerini kullanarak otizm spektrum bozukluğu tespiti

Yükleniyor...
Küçük Resim

Tarih

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Gebze Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Otizm Spektrum Bozukluğu (OSB), sosyal etkileşim, iletişim becerileri ve davranışlarda zorluklarla karakterize karmaşık bir nörogelişimsel durumdur. Günümüzde OSB için kesin bir tanı ve tedavi yöntemi bulunmamaktadır. Son yıllarda, bağırsak mikrobiyotası ile beyin arasındaki ilişkiye odaklanan araştırmalar, OSB'nin etiyolojisinde ve semptomlarında bağırsak mikrobiyotasının potansiyel rolünü öne çıkarmıştır. Bu çalışma, OSB ile bağırsak mikrobiyotası arasındaki ilişkileri derin öğrenme yöntemleri ve veri füzyon teknikleri kullanarak araştırmayı amaçlamaktadır. Amerikan Bağırsak Projesi'nden (AGP) elde edilen veriler kullanılarak, mikrobiyota kompozisyonu ve çevresel faktörler ile OSB arasındaki potansiyel bağlantılar incelenmiştir. Çalışmada, RFECV (Recursive Feature Elimination with Cross-Validation), Fisher Skoru ve Dikkat Mekanizması (Attention Mechanism) gibi öznitelik seçim yöntemleri kullanılarak en etkili mikrobiyota ve çevresel öznitelikler belirlenmiştir. Ardından, çeşitli makine öğrenmesi ve derin öğrenme modelleri (Rastgele Orman, XGBoost, CatBoost, Derin Sinir Ağları vb.) uygulanmış ve performansları karşılaştırılmıştır. Ayrıca, erken ve geç füzyon teknikleri kullanılarak mikrobiyota ve çevresel verilerin birleştirilmesinin model performansına etkisi değerlendirilmiştir. Sonuçlar, CatBoost modelinin hem mikrobiyota hem de çevresel veriler için en iyi performansı gösterdiğini ortaya koymuştur. Makine öğrenmesi modellerinin açıklanabilirliği tarafında SHapley Additive exPlanations (SHAP) analizi, OSB ile en güçlü ilişkiyi gösteren mikrobiyal türleri ve çevresel faktörleri belirlememizi sağlamıştır. Veri füzyon tekniklerinin uygulanması, tek veri kaynağı kullanımına kıyasla model performansında artış sağlamıştır. Çalışmanın literatüre özgün katkısı, mikrobiyota verileri ile demografik ve çevresel verilerin füzyon teknikleriyle birleştirilerek kapsamlı bir analiz yaklaşımı sunmasıdır. Farklı makine öğrenmesi ve derin öğrenme modellerinin detaylı karşılaştırmalı analizi, SHAP analizleri ile model kararlarının açıklanabilirliğinin sağlanması ve mikrobiyota versisine ek olarak çevresel özniteliklerin kullanılması, OSB'nin biyolojik temellerinin daha iyi anlaşılmasına katkıda bulunmuştur. Elde edilen bulgular, OSB'nin erken tanısı için potansiyel biyobelirteçlerin belirlenmesine yönelik yeni bir perspektif sunmakta ve OSB araştırmalarında çok boyutlu veri analizi yaklaşımlarının önemini vurgulamaktadır. Kullanılan yenilikçi yöntemler ve elde edilen sonuçlar, gelecekteki OSB araştırmalarında bağırsak mikrobiyotası ve çevresel faktörlerin birlikte değerlendirilmesi için metodolojik bir çerçeve oluşturmaktadır.

Autism Spectrum Disorder (ASD) is a complex neurodevelopmental condition characterized by difficulties in social interaction, communication skills, and behavior. Currently, there is no definitive diagnosis or treatment method for ASD. In recent years, research focusing on the relationship between gut microbiota and the brain has highlighted the potential role of gut microbiota in the etiology and symptoms of ASD. This study aims to investigate the relationships between ASD and gut microbiota using deep learning methods and data fusion techniques. Using data obtained from the American Gut Project (AGP), potential connections between microbiota composition, environmental factors, and ASD were examined. In the study, the most effective microbiota and environmental features were determined using feature selection methods such as RFECV (Recursive Feature Elimination with Cross-Validation), Fisher Score, and Attention Mechanism. Subsequently, various machine learning and deep learning models (Random Forest, XGBoost, CatBoost, Deep Neural Networks, etc.) were applied and their performances were compared. Additionally, the effect of combining microbiota and environmental data on model performance was evaluated using early and late fusion techniques. Results revealed that the CatBoost model showed the best performance for both microbiota and environmental data. SHapley Additive exPlanations (SHAP) analysis allowed us to identify the microbial species and environmental factors that showed the strongest association with ASD. The application of data fusion techniques resulted in improved model performance compared to using a single data source. The unique contribution of this study to the literature is its comprehensive analytical approach that combines microbiota data with demographic and environmental data using fusion techniques. Detailed comparative analysis of different machine learning and deep learning models, ensuring model decision explainability through SHAP analyses, and the use of environmental features in addition to microbiota data have contributed to a better understanding of the biological foundations of ASD. The findings present a new perspective for identifying potential biomarkers for early diagnosis of ASD and emphasize the importance of multidimensional data analysis approaches in ASD research. The innovative methods used and the results obtained provide a methodological framework for future ASD research in jointly evaluating gut microbiota and environmental factors.

Açıklama

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Onay

İnceleme

Ekleyen

Referans Veren