BIG DATA

Termin Big Data pierwszy raz został użyty na początku lat 2000, kiedy analityk Doug Laney przedstawił rozpowszechnioną już dziś definicję, według której dane masowe to tzw. 3V: volume (czyli ilość), velocity (czyli szybkość) i variety (czyli różnorodność) (...).

 • ilość – zbieranie dane z różnorodnych źródeł: transakcje biznesowe, media społecznościowe, dane z sensorów, dane wymieniane między urządzeniami. W przeszłości przechowywanie tych danych stanowiło problem, ale obecnie nowe technologie (takie jak np. Hadoop) znacznie to ułatwiły.

• szybkość – dane powstają i są dostarczane niezwykle szybko i muszą być obsługiwane z odpowiednim reżimem czasowym. Czas analizy danych uznaje się zbliżony do rzeczywistego.

• różnorodność – dane ściągane są w różnych formatach, od ustrukturyzowanych, numerycznych danych w tradycyjnych bazach danych do niestrukturalnych dokumentów tekstowych, email, video, audio, danych znaczników magazynowych lub transakcji finansowych.

Obecnie wskazuje się na model 4V, w ramach którego wyróżnia się również weryfikację posiadanych danych, której celem jest wyciąganie wniosków. Natomiast największą zaletą Big Data jest możliwość przetwarzania danych nieustrukturyzowanych (m.in. obrazy cyfrowe, pliki wideo, pliki audio, posty z portali społecznościowych, poczta e-mail, pliki programu Word, arkusze kalkulacyjne, pliki PDF) (...).

Tabela 2. Przetwarzanie danych w Big Data a tradycyjne metody

Charakterystyka

Big Data

Tradycyjne metody

Przetwarzanie danych ustrukturyzowanych

+

+

Przetwarzanie danych nieustrukturyzowanych

+

+

Szybkość przetwarzania w czasie rzeczywistym

+

-

Niskie koszty przetwarzania danych

+

-

Brak usystematyzowanej struktury

+

-

Oszczędność miejsca na serwerach

+

-

Źródło: Opracowanie własne. 

Po przeanalizowaniu powyższych informacji można wskazać kilka zmiennych, które mają kluczową rolę w kwestii odróżnienia Big Data od tradycyjnych metod zbierania i analizy danych. Do najważniejszych z nich należą: możliwość przetwarzania w czasie rzeczywistym (bądź zbliżonym do rzeczywistego), brak usystematyzowanej struktury co związane jest z dzieleniem i przechowywaniem danych w wielu bazach oraz najważniejsza, to niskie koszty obsługi oraz oszczędność miejsca na serwerach. Podsumowując czym jest Big Data, można śmiało stwierdzić, że jest to system, na bazie którego możliwe jest pobieranie, przechowywanie bardzo dużych ilości danych zarówno ustrukturyzowanych, jaki i nieustrukturyzowanych (np. informacje na portalach społeczno- ściowych), dający możliwość szybkiej analizy informacji w czasie zbli- żonym do rzeczywistego, która prowadzi do odkrywczych związków, które dotychczas wydawały się nieoczywiste.

Autor(ka) wpisu: Barbara Fatyga
Rodzaj słownika: Słownik Teorii i Metodologii Badań Kultury
Sprawdź pozostałe wpisy w innych słownikach:
Data aktualizacji: niedziela, 12 Listopad, 2017 - 17:55