Hasta bir şikayetle doktora gittiğinde, doktorun ilk
yaptığı şey hastanın şikayetlerini dinlemek ve onun doğrultusunda muayene
etmektir. Bu muayene sırasında ilk etapta hastaya sorular sorarak elindeki araçlarla
(steteskop vs. ) sorunu anlamaya çalışır. Bu ilk tanı hastalığın genel bir
özeti niteliğindedir ve tam bir teşhis koymaz. Fakat resme genel bir bakış
atar. Sorunun olduğu yeri tespit eder ve duruma göre o bölge üzerinde genel bir
araştırmaya gider ( röntgen, MR gibi ).
Veri analizi de doktorun yaptığı muayeneye benzer. Veriye
sorular sorar ve dinler. Verinin yapısını şeklini öğrenir. Yapısı ve şeklinden
kasıt; dağılımı, basıklığı, çarpıklığı, genişliği, aykırı değerlerin varlığı
gibi özet bilgiler olup, bu bilgiler verinin yapısının belirlenmesinde önemlidir. Veride bir anormallik var mı onu tespit eder.
Varsa tedavisi için gerekli yöntemlerin seçimine verinin yapısına göre karar
verilir. Kısacası yanlış teşhis yanlış tedavi demektir. Doğru teşhis için
gerekli bilgiyi veren "keşfedici
veri analizi" yöntemleri kullanılır.
Bir önceki yazımda verinin içindeki hatalardan
bahsetmiştim. Keşfedici veri analizi, bu hataların bulunmasına yönelik
analizleri içerir. Veride, uç değerlerin bulunması ve veri yapısındaki sapmaların
olması, uzun kuyruklu olması ( verinin çok geniş olması ) ve veri gözlemlerinin asimetrik
dağılıma sahip olması gibi nedenlerden dolayı hataya sebebiyet verir. Çünkü
veri içindeki gerçekliğe ulaşmamıza engel olur. Hatalar bulunup giderilebildiği
kadar giderilebilmelidir. Giderilemediği durumlarda ise farklı yöntemlere
başvurulur. Keşfedici veri analizinde kullanılan teknikler; tanımlayıcı
istatistikler, grafik yöntemleri, sağlam ( robust ) istatistikler, ilişki
katsayıları gibi yöntemlerdir. Basit ve genel bir bakış vermesine rağmen doğru
teşhis ve doğru tedavi için çok önemlidir.
Sözün Özü:
Keşfedici veri
analizi verinin yapısını ve şeklini ortaya koyarak veri hakkında genel bir
bilgi verir. İçeriyorsa hataları bulur ve giderilmesi için yol gösterici
niteliğindedir. Özet bilgiler vererek verinin bütünü açısından genel bir
yargıya varmamıza yardımcı olur.