Ana içeriğe geç
← Blog'a Dön
Yapay Zeka

Graf Sinir Ağları ile Genomik Varyant Analizi

MSG
Muhammed Sina Gün
Genel Koordinatör · ARI Lab
·28 Mart 2026·8 dk okuma
GNNPythonPyTorchBiyoinformatikTEKNOFEST

Giriş

Graf Sinir Ağları (GNN), moleküler yapılar, sosyal ağlar ve genomik verileri gibi doğası gereği graf biçiminde olan verileri modellemek için son derece güçlü bir araçtır. Arel Yazılım Kulübü ARI Lab ekibi olarak, TEKNOFEST 2026 için geliştirdiğimiz VARIANT-GNN projesinde bu teknolojiyi genomik varyant analizine uyguladık.

Neden Graf?

DNA sekansları, amino asit bileşimleri ve protein-protein etkileşimleri gibi biyolojik veriler doğrusal değil, ilişkiseldir. Geleneksel CNN veya RNN mimarileri bu ilişkisel yapıyı tamamen yansıtamaz. GNN'ler ise düğümler (genler/proteinler) ve kenarlar (etkileşimler) aracılığıyla bu yapıyı doğrudan modelleyebilir.

Mimari Seçimler

PyTorch Geometric (PyG) framework'ünü tercih ettik çünkü:

  • Büyük graf veri setleri için optimize batch loading
  • GraphSAGE, GAT ve GCN implementasyonları hazır
  • CUDA desteğiyle GPU hızlandırması

Sonuçlar

Geliştirdiğimiz ensemble model, literatürdeki baseline modellere kıyasla %12 F1-score artışı sağladı. Tüm kaynak kodu ArelSoftwareClub GitHub organizasyonunda açık kaynak olarak yayınlanmıştır.