15 Ocak 2013 Salı

Biyoinformatiğe Nasıl Başladım 2

İlk yazımın fazlasıyla ilgi çekmesi nedeniyle aralarda bu alana nasıl başladığım ve ilerlediğime ilişkin hikayemi bir dizi yazı şeklinde paylaşmaya karar verdim.

Başlangıç kodonuna ilişkin problem JAVA dersi alırken karşıma çıkmıştı; öğrendiklerimi uygulayabilmek için güzel bir fırsattı ve ilgimi de çekmişti. Programlamayla ortaokulda sayı tahmin edebilen bir QBASIC oyunuyla tanışmıştım ve çok ilgilenmiştim (o zamanlar Age of Empires bile yoktu, en ufak bir şey dahi sizi şaşırtmaya yetiyordu). Daha sonra lisede bir bilgisayarı kullanabilmek fırsatı edindim; okulumuzdaki bilgisayar laboratuvarında birçok 286 ve bir de 486 vardı. Üniversite olanakları ve kazandırdığı ufukla benim için tam bir yeşerme dönemi oldu; okula kayıt olduğunuzda zorunlu olarak yapmanız gereken ilk şey laboratuvarlardaki bilgisayarları kullanabilmek ve buradan e-postanıza erişmekti. O zamanlar yapabildiğim en iyi şey bir web sayfası hazırlamaktı ancak hazır şablonlar olmadığı için HTML'de kodlama yapabilmek gerekiyordu; bu iyi bir motivasyon oldu. Bölümün (Moleküler Biyoloji ve Genetik) ilk dersleri çok ilgimi çekiyordu ancak bir yandan da programlamayla ilgilenmeye başladım. Yine o zamanlar iki dönem JAVA dersi almamız gerekiyordu; bu benim için büyük bir fırsattı ve kafamda genetikle programlamanın nasıl birleştirilebileceğine ilişkin sorular oluşmaya başladı.


O dönemde benim için ufkumun sınırlarını fazlasıyla zorlayan bir yazıyla tanışım: Bir programcının gözünden DNA (DNA seen through the eyes of a coder). Bu yazıda programlama mantığıyla genetiğin ve hücrenin işleyişinin aslında ne kadar benzediğinden örneklerle bahsediyordu. O esnada aldığım genetik dersi ile kafamda bazı şeyleri birleştirip sorular sormaya başladım; bunlardan ilki, genomun yabancı dilde bir metin gibi okunup okunamayacağıydı.

Problemi şu şekilde tarif edebiliriz: diyelim ki artık günümüzde kimsenin bilmediği dilde metinlerle karşılaştınız (mesela Orhun Kitabeleri) ve bu metinlerde neler anlatıldığını merak ediyorsunuz. Bu konuda geliştirilen birçok yaklaşım (kriptografik yaklaşımları kastetmiyorum) var ve bu yaklaşımlar konumuz dışında, ancak özetle genoma da bu şekilde yaklaşıp acaba onu çözebilir miyiz? İddialı bir soru ancak bir kere sormaya başlayınca, farklı bir açıdan bakmaya başlıyorsunuz. O zaman farkına vardım ki, mevcut yaklaşımlar sadece problemin ufak bir parçasını ele alıyor ve bunun üzerinden bir yere varmaya çalışıyor, ancak sistem yaklaşımı adı verilen bir yaklaşım var ve karmaşık problemleri ancak bütüncül yaklaşımlarla çözebilirsiniz. Bu sorularımı ve kendi yaklaşımımı (o zaman için fazlasıyla yüzeyseldi ancak ortaya belirgin bazı şeyler koyabilmiştim) paylaştığım bir hocam o dönemde bu tür şeylerin manasız olduğunu ima etmişti ve büyük bir hayal kırıklığına uğramıştım. Ancak bundan 3 sene sonra veri madenciliği üzerine çalışan dünyaca ünlü bir akademisyenle karşılaştım ve çalıştığı konular üzerine sohbet etmeye başladığımızda kendisinin de bu konuyla uzun süredir uğraştığını ve bunun önemli bir problem olduğunu öğrendim.. O zaman demiştim, keşke, keşke daha önce o kişiyle karşılaşsaydım da, aslında ilginç bir problemi çözmek adına işin ucundan ufacık da olsa tutabildiğimi bilebilseydim ve motivasyonumu kaybetmeseydim.


Sözün özü:
Alakasız görünse dahi başka bilim dallarındaki metodların biyoinformatiğe uygulanmasıyla o zamana kadar çözülemeyen sorulara çok farklı yaklaşımlar geliştirilebilir; maymun iştahlı olmak belki de o kadar kötü değildir.



Proje:
Acaba genomda, bizim çağdaş dillerde gördüğümüz türden ve sık bir şekilde tekrar eden bağlaçlar, sıfatlar, isimler vb. bölümler var mı? Cümleler büyük harfle başlar tarzında kurallar mevcut mu (mesela metionin böyle düşünülebilir mi)? Bir genomu kelimelere, cümlelere, paragraflara ve bölümlere ayırabilir miyiz?

Meraklısına:
Diller hakkında tahmin ettiğimizden çok daha az bilgiye sahibiz; şu wikipedi makalesi ilgililerin ufkunu genişletebilir: Dil (filoloji)