Giriş
Graf Sinir Ağları (GNN), moleküler yapılar, sosyal ağlar ve genomik verileri gibi doğası gereği graf biçiminde olan verileri modellemek için son derece güçlü bir araçtır. Arel Yazılım Kulübü ARI Lab ekibi olarak, TEKNOFEST 2026 için geliştirdiğimiz VARIANT-GNN projesinde bu teknolojiyi genomik varyant analizine uyguladık.
Neden Graf?
DNA sekansları, amino asit bileşimleri ve protein-protein etkileşimleri gibi biyolojik veriler doğrusal değil, ilişkiseldir. Geleneksel CNN veya RNN mimarileri bu ilişkisel yapıyı tamamen yansıtamaz. GNN'ler ise düğümler (genler/proteinler) ve kenarlar (etkileşimler) aracılığıyla bu yapıyı doğrudan modelleyebilir.
Mimari Seçimler
PyTorch Geometric (PyG) framework'ünü tercih ettik çünkü:
- Büyük graf veri setleri için optimize batch loading
- GraphSAGE, GAT ve GCN implementasyonları hazır
- CUDA desteğiyle GPU hızlandırması
Sonuçlar
Geliştirdiğimiz ensemble model, literatürdeki baseline modellere kıyasla %12 F1-score artışı sağladı. Tüm kaynak kodu ArelSoftwareClub GitHub organizasyonunda açık kaynak olarak yayınlanmıştır.