27 Şubat 2013 Çarşamba

Biyoinformatik ve Veri Analizi - 3


Hasta bir şikayetle doktora gittiğinde, doktorun ilk yaptığı şey hastanın şikayetlerini dinlemek ve onun doğrultusunda muayene etmektir. Bu muayene sırasında ilk etapta hastaya sorular sorarak elindeki araçlarla (steteskop vs. ) sorunu anlamaya çalışır. Bu ilk tanı hastalığın genel bir özeti niteliğindedir ve tam bir teşhis koymaz. Fakat resme genel bir bakış atar. Sorunun olduğu yeri tespit eder ve duruma göre o bölge üzerinde genel bir araştırmaya gider ( röntgen, MR gibi ).

Veri analizi de doktorun yaptığı muayeneye benzer. Veriye sorular sorar ve dinler. Verinin yapısını şeklini öğrenir. Yapısı ve şeklinden kasıt; dağılımı, basıklığı, çarpıklığı, genişliği, aykırı değerlerin varlığı gibi özet bilgiler olup, bu bilgiler verinin yapısının belirlenmesinde önemlidir.  Veride bir anormallik var mı onu tespit eder. Varsa tedavisi için gerekli yöntemlerin seçimine verinin yapısına göre karar verilir. Kısacası yanlış teşhis yanlış tedavi demektir. Doğru teşhis için gerekli bilgiyi veren  "keşfedici veri analizi" yöntemleri kullanılır.

Bir önceki yazımda verinin içindeki hatalardan bahsetmiştim. Keşfedici veri analizi, bu hataların bulunmasına yönelik analizleri içerir. Veride, uç değerlerin bulunması ve veri yapısındaki sapmaların olması, uzun kuyruklu olması ( verinin çok geniş olması ) ve veri gözlemlerinin asimetrik dağılıma sahip olması gibi nedenlerden dolayı hataya sebebiyet verir. Çünkü veri içindeki gerçekliğe ulaşmamıza engel olur. Hatalar bulunup giderilebildiği kadar giderilebilmelidir. Giderilemediği durumlarda ise farklı yöntemlere başvurulur. Keşfedici veri analizinde kullanılan teknikler; tanımlayıcı istatistikler, grafik yöntemleri, sağlam ( robust ) istatistikler, ilişki katsayıları gibi yöntemlerdir. Basit ve genel bir bakış vermesine rağmen doğru teşhis ve doğru tedavi için çok önemlidir.



Sözün Özü:

Keşfedici veri analizi verinin yapısını ve şeklini ortaya koyarak veri hakkında genel bir bilgi verir. İçeriyorsa hataları bulur ve giderilmesi için yol gösterici niteliğindedir. Özet bilgiler vererek verinin bütünü açısından genel bir yargıya varmamıza yardımcı olur.