Tartalomjegyzék:
Meghatározás - Mit jelent a nagy adat?
A nagy adatok olyan folyamatra utalnak, amelyet akkor használnak, amikor a hagyományos adatbányászási és -kezelési technikák nem tudják feltárni az alapul szolgáló adatok betekintését és jelentését. A nem strukturált, időérzékeny vagy egyszerűen nagyon nagy adatokat nem tudják feldolgozni a relációs adatbázis-motorok. Az ilyen típusú adatok eltérő adatfeldolgozási megközelítést igényelnek, úgynevezett nagy adatnak, amely hatalmas párhuzamosságot használ a könnyen elérhető hardverekkel.
A Techopedia magyarázza a Big Data-t
Egyszerűen: a nagy adatok tükrözik a változó világot, amelyben élünk. Minél inkább változnak a dolgok, annál inkább a változásokat rögzítik és adatként rögzítik. Vegyünk példát az időjárásra. Az időjárás-előrejelző számára a helyi körülmények között a világ minden tájáról összegyűjtött adatmennyiség jelentős. Logikus szempontból lenne értelme, ha a helyi környezet diktálja a regionális hatásokat, a regionális hatások pedig a globális hatásokat diktálják, de valójában fordítva is lehet. Ilyen módon az időjárási adatok tükrözik a nagy adatok tulajdonságait, ahol valós idejű feldolgozásra van szükség hatalmas adatmennyiséghez, és ahol nagyszámú bemenet generálható gépen, személyes megfigyelések vagy külső erők, például napfény foltok révén.
Az ilyen adatok feldolgozása szemlélteti, hogy a nagy adatok miért váltak olyan fontosak:
- A legtöbb most gyűjtött adat strukturálatlan, és eltérő tárolást és feldolgozást igényel, mint a hagyományos relációs adatbázisokban.
- A rendelkezésre álló számítási teljesítmény éghajlatú, azaz több lehetőség van a nagy adatok feldolgozására.
- Az Internet demokratizálódott az adatokkal, folyamatosan növelve a rendelkezésre álló adatokat, miközben egyre több nyers adatot állít elő.
A nyers formájú adatoknak nincs értéke. Az adatokat feldolgozni kell ahhoz, hogy értékesek legyenek. Itt azonban a nagy adatok velejárója. Megéri-e az adatok feldolgozása a natív objektumformátumtól a felhasználható betekintésig az erre irányuló hatalmas tőkeköltségeket? Vagy van-e túl sok ismeretlen értékkel rendelkező adat ahhoz, hogy igazolja a nagy adat eszközökkel történő feldolgozás kockázatát? Legtöbben egyetértenek abban, hogy ha előre tudjuk jósolni az időjárást, akkor értékkel bírnánk, az a kérdés, hogy ez az érték meghaladja-e azokat a költségeket, amelyek az összes valós idejű adat összegyűjtésével egy időjárás-jelentésben beszámíthatók.
