[Basit bir anlatım ile] Big Data Nasıl Oluşturulur?

Profesyonel Veri Bilimcilerin jargonundan biraz uzaklaşarak, yüzeysel olarak big data’yı nerede bulabileceğimizi, nasıl big data oluşturabileceğimizi konuşalım.

Öncelikle Big Data (tr:[Büyük Veri]) halihazırda işleyen işleyişin tamamına yakınının kayıt altında tutulmasına dayanır. Buradaki tamama yakınlık, teknolojinin gelişimine bağlı olarak her zaman en maksimum depolama ve işleme donanımlarına yapılacak yatırım ile ilintilidir.

Depolama ve İşlem Gücü

Aslına bakılırsa belli bir odak noktası altında, insan gücüne bağlı kalınarak yapılan anket çalışmaları ve araştırmalar zamanla doğruluk oranınında ‘büyük veri’nin gerisinde kalacak.

Çünkü büyük veri teknolojisi, bilgisayar teknolojileri(depolama kapasitesi, yapay zeka) ilerledikçe,  insanlardan daha hızlı, daha fazla ve daha doğru bilginin işlenebilmesini sağlayacak.

İnsan vücudunda dolaşarak organların ve vücudun işleyişini anlatan “Vücudumuzu Tanıyalım” isimli bir çizgi film vardı. (Orjinal adı: Il était une fois… la vie) Bu çizgi dizide kanayan bölüme doğru koşan Trombositler oraya gitmeleri gerektiğini biliyorlar ve koşar adım gidiyorlardı.

Peki vücudunuzdaki değerleri takip eden, tüm fonksiyonlarınızı izleyen ve müdahale eden mikro robotlar olsaydı, müdahale kararını nasıl alırlardı?

Damarlar içerisinde ilerleyen bir mikro robot nereye doğru yol alması gerektiğini en basit hali ile kan değerlerinizi takip ederek ve sabit değerler ile karşılaştırarak bulabilir. Hatta yeterli kapasitesi var ise belli bir süre sonra hayat fonksiyonlarınızın ne zaman biteceğini bile tahmin edebilir…

Bu korkunç olurdu.

Big Data, bir işleyişi çok yönlü kayıt altına alarak zaman içinde yaşanan tüm olaylardan çıkarımlar yapabilir. Örneğin son 20 yılda bir milli takımın dünya kupası performansı ile o ülkenin ekonomi performansının %99 oranında eşit bulunması gibi.

Bu çıkarımın yapıldığı veritabanının ne denli detaylı ve karma bir bilgiden oluştuğunu düşünmek dahi zor.

Şimdiki zamana gelirsek,

Tabii ki şu an için big datayı örneklerdeki gibi geniş çapta kullanamıyoruz. Fakat bir şirket ekonomik gelir-gider tablolarını nasıl en küçük detayına kadar kayıt altında tutuyor ve iyileştirme raporları hazırlayabiliyorsa artık aynı şirket, işçisinin en mutlu ve en performanslı çalıştığı ortamı da hazırlayabilecek.

Hem de tek bir anket dahi yapmadan!

Çünkü kişilerin hangi saatlerde, hangi günlerde ve hangi koşullarda nasıl performans gösterdiklerini tüm detaylarıyla kayıt altında tutmayı, bu otomasyonu kurmayı öğrenecekler. Ve tabii elde edilen veriyi işlemeyi.
Big datayı zamanla öğrenecek, kavrayacak ve karar verirken ondan faydalanacaklar.

Yazının en son kısmı ise başlıkta yazan “Big Data Nasıl Oluşturulur?” sorusuna net bir cevap olsun.

10 öğrencinin 4 sınav notuna bakarak, sadece bu 10 öğrencinin belirli derslerdeki başarı ortalamalarını ve eğilimlerinin görürsünüz. İstanbul’daki bütün öğrencilerin, tüm notlarına bakarak sadece İstanbul’daki öğrencilerin ders ortalama ve eğilimlerini görebilirsin.

Peki, “İstanbul’daki tüm öğrencilerin notları” veri tablosunda aynı zamanda bu öğrencilerin tüm kimlik bilgileri, seyahat ettiği yerler, okuduğu kitaplar, arkadaşlarının meslekleri vs. ekli olsaydı başka hangi çıkarımları yapabilirdik? Mesela 4 doktor arkadaşı olan bir insanın ortalama ömrünün daha uzun  ve daha sağlıklı olduğunu tespit edebilir miyiz? Aynı zaman 4 doktor arkadaşı olanların üniversite başarı grafiklerini de tespit edebiliriz. İşte big data tüm bu ilintili veri tabanları bütünüdür.

İşlemek ve depolamak için büyük ve yeni teknolojiler gerekiyor fakat anlamak için çok uzağa gitmeye gerek yok. “Deneyimleriyle karar verdiğini” keşfeden insan, “Büyük Veri ” ve “Yapay Zeka”yı yarattı.