• sumadigit@gmail.com
  • +381 63 772 99 55
image

Big Data

Šta je Big Data?

Big data je termin koji se sve češće spominje kada se govori o inovativnim poslovnim modelima ili analizi podataka. Šta zaista stoji iza termina Big data? Na kojim principima se temelji Big Data tehnologija, odnosno kako se ti principi mogu koristiti za unapređenje poslovanja? Pokušaćemo da odgovorimo na ta pitanja u ovoj rubrici.

Da bismo predstavili termin Big Data iskoristićemo primer društvene mreže Facebook, koja je neiscrpan izvor podataka, koji se svakodnevno prikupljaju. Facebook ima preko 1.4 milijardi korisnika, što znači da dnevno prikupi i sačuva preko 600 TB raznih podataka. Kompanija Facebook trenutno poseduje svoje Data skladište veličine 300 PB. Amazon je takođe kompanija koja svakodnevno prikuplja podatke od više od milijardu korisnika širom sveta. Prikupljaju se podaci o stanju računara, našoj lokaciji i mnogi drugi. Svi ti podaci prikupljaju se i obrađuju na velikim farmama podataka.

Svi prikupljeni podaci imaju tri zajedničke karakteristike: veliki volumen (svake sekunde pristižu terabajti podataka), velika brzina pristizanja (u realnom vremenu) i mnogo se razlikuju (nisu strukturirani). Ove tri karakteristike uslovile su potrebu za razvijanjem nove tehnologije, a to je Big Data.

Mogućnosti primene

Posedovanje ovakve količine podataka donosi mnoge mogućnosti primjene. Razumevanje i targetiranje kupaca, razumevanje i optimizacija poslovnih procesa, povećanje lične produktivnosti, poboljšanje zdravstva, poboljšanje sportskih rezultata su samo neki od mogućih primena.

Primeri primene

Google Maps koristi real-time podatke prikupljene od milijardi korisnika kako bi prikazali opterećenje protoka na mreži, društvene mreže dodaju nove aplikacije na temelju ponašanja korisnika na njihovim mrežama, auto industrija optimizuje potrošnju resursa za izradu delova na osnovu prikupljenih podataka.

Big Data alati

Korist od velike količine podataka može se postići jedino ako se koriste odgovarajući alati za analizu takvih podataka. Rezultat analize i zaključak na temelju rezultata omogućavaju da se doista prmeni ono na šta ukazuju podaci. Neki od alata za analizu i čuvanje podataka su MongoDB, Cloudera, Hadoop i Talend.

Virtualizacija i big data

Virtualizacija velikih podataka način je prikupljanja informacija s više izvora na istom mestu. Skupljanje je virtualno: za razliku od drugih metoda, većina podataka ostaje na mestu i preuzima se na zahtev direktno iz izvornog sistema.