Veri analizi sistemi, insan—makine ortak topluluğudur:
- Makine verileri toplar
- Makine veriler üzerinde ön işleme yapar
- Makine çalışma sonuçlarını insanın kolayca ayırt edebileceği bir biçimde gösterir
- İnsan, makinenin çalışmasının üzerine kurarak veriden çıkarımlar yapar
Bu yüzden, veri analizi işini bir “boru/hat” gibi düşünürsek, en azından iki aşamadan söz edebiliriz:
- Makine aşaması:nihai çıktı, insanın işleyebileceği1 grafiklerdir
- İnsan aşaması:nihai çıktı, verilerle ilgili çıkarımdır
Kısacası, bir programcı için veri analizinin temel görevi veriyi görselleştirilebilir hâle getirmektir2。
-
“İnsanın işleyebilmesi”, “insanın ayırt edebilmesi” demek değildir. Çünkü yüzlerce TB veri, büyük ölçüde metin içerikleridir; insan bunları elbette ayırt edebilir. Ancak veri miktarı, insanın işleme kapasitesini çoktan aşmıştır. Yani ayırt edilebilir ama işlenemez. İnsanın işleyebilmesi için veriyi özetlemek gerekir: verinin biçimi insan tarafından ayırt edilebilir olmalı ve veri miktarı da çok büyük olmamalıdır. İnsanların görsel tanımadaki büyük avantajı düşünüldüğünde, veriyi görüntüye dönüştürerek özetlemek; bilgiyi en yüksek yoğunlukla ifade etmeyi mümkün kılar. ↩
-
Muhtemelen R dilinin önemli görünmesinin bir sebebi de budur. ↩