Veri analizi sistemi, insan—makine ortak topluluğudur:

  • Makine verileri toplar
  • Makine veriler üzerinde ön işleme yapar
  • Makine çalışma sonuçlarını insanın kolayca ayırt edebileceği bir biçimde gösterir
  • İnsan, makinenin çalışmasının üzerine kurarak veriden çıkarımlar yapar

Bu yüzden, veri analizi işini bir “boru/hat” gibi düşünürsek, en azından iki aşamadan söz edebiliriz:

  • Makine aşaması:nihai çıktı, insanın işleyebileceği1 grafiklerdir
  • İnsan aşaması:nihai çıktı, verilerle ilgili çıkarımdır

Kısacası, bir programcı için veri analizinin temel görevi veriyi görselleştirilebilir hâle getirmektir2

  1. “İnsanın işleyebilmesi”, “insanın ayırt edebilmesi” demek değildir. Çünkü yüzlerce TB veri, büyük ölçüde metin içerikleridir; insan bunları elbette ayırt edebilir. Ancak veri miktarı, insanın işleme kapasitesini çoktan aşmıştır. Yani ayırt edilebilir ama işlenemez. İnsanın işleyebilmesi için veriyi özetlemek gerekir: verinin biçimi insan tarafından ayırt edilebilir olmalı ve veri miktarı da çok büyük olmamalıdır. İnsanların görsel tanımadaki büyük avantajı düşünüldüğünde, veriyi görüntüye dönüştürerek özetlemek; bilgiyi en yüksek yoğunlukla ifade etmeyi mümkün kılar. 

  2. Muhtemelen R dilinin önemli görünmesinin bir sebebi de budur.