Öncelikle verinin ne olduğunu kısaca söylemek gerekirse; bilgisayar tarafından işlenebilen bilgiler topluluğu diyebiliriz. Sosyal medya paylaşımları, İnternet gezinme kayıtları, e-ticaret işlemleri, online bankacılık işlemleri gibi daha birçok örnekler verebileceğimiz tüm bunlar veri ürettiğimiz ortamlardır. Gelişen teknoloji ile artan İnternet hızı ve artan depolama kapasitesi geleneksel olarak ürettiğimiz ve depolanan veriden çok daha fazla verinin kaydedilmesine imkan sağladı. Teknolojinin çağının ilk zamanlarında KB, MB olarak belirttiğimiz veri boyutları zamanla GB, TB, PB gibi devasa boyutlara ulaştı. Önceleri tablolarda belli bir düzen içerisinde oluşan verinin yerini çok daha hızlı ve büyük boyutlarda üretilen tablolara sığmayan ve düzenli olmayan veri aldı. Büyük veri ifadesini ( Big data ) tam burada çok fazla kaynaktan, çok büyük hızlılıkta ve farklı çeşitlilikte oluşan veri kümelerini tanımlamada kullanmaya başladık.
Büyük veri çok temel bir negatif bir de pozitif sonuca neden oldu. Negatif sonuç; bu kadar büyük boyutta verinin depolanması ve işlenmesi için geleneksel teknolojilerin yetersiz kaldığını görmemizdir. Neyse ki günümüzde teknolojinin büyük bir hızla geliştiğini, devasa boyuttaki verileri depolama ve işleme için gereken donanımların ve yazılımların üretildiğini görmemiz bu negatifliği ortadan kaldırmakta ve büyük verinin pozitif sonucuna bakmamızı sağlıyor. Big Data’nın pozitif sonucu ise çok fazla kaynaktan, yüksek hızla topladığımız bu veriyi hayatımızın tüm alanlarında karşımıza çıkan sorunları çözmede ve hayatımızı kolaylaştıracak yeni teknolojilerin bulunmasında kullanabildiğimizdir. Sağlık sorunlarının daha önceki vaka veri kayıtlarından yararlanılarak önceden tespit edilebilmesi, tarımın daha verimli hale getirilmesi, doğal afetlerin önceden tespit edilip gereken önlemlerin alınması, eğitim kalitesinin arttırılması ve daha birçoğunu sıralayabileceğimiz alanlarda büyür veri kullanılmaktadır ve daha fazla kullanmaya devam edilecektir.
Bahsettiğimiz bu alanlarda verinin kullanılabilmesi için onu anlaşılır bir hale getirmek gerekir. Veri analizi kavramı burada devreye giriyor. Verinin içerisinden gerekli olanı alma, onu anlaşılır hale getirme ve son olarak yorumlayarak ondan yararlanma sürecine veri analizi diyoruz.
Örneğin bir hazır giyim şirketi hangi kategorideki ürünleri hangi ayda raflara ve online satış mecralarına koyması gerektiğini bulmada veriden onu analiz ederek yararlanabilir. Yıl içerisinde bu şirket birçok kanaldan verileri toplayabilir. Örnek hangi ödeme türünün ne kadar kullanıldığı, online mı yoksa mağazalardan mı daha çok satışın yapıldığı ya da hangi saatlerde alışverişlerin yoğun olduğu gibi. Ona bu durumda kategori bazlı satışların hangi aylarda hangi yoğunlukta olduğunu bulması gerekir.
Bu ve bunun gibi birçok örnek verebiliriz. Veri doğru şekilde kullanıldığında ne kadar faydalı olabileceğini çok net görebiliyoruz. Bu gerçekten çok heyecan verici.