6 Nagy mítoszok a nagy adatok kezeléséről

2026

Tartalomjegyzék:

Mítosz: Mindenki előttünk áll a nagy adatok elfogadásában.
Mítosz: Olyan sok adatunk van; nem kell aggódnunk minden apró adathiány miatt.
Mítosz: A nagy adattechnológia kiküszöböli az adatintegráció szükségességét.
Mítosz: Az adattárház fejlett elemzésre történő felhasználása értelmetlen.
Mítosz: Az adattárak helyettesítik az adattárházat.
A Big Data működik - Lehetséges, hogy nem használnak új adatmanipulációs módszereket

2014 májusában a Forrester Research két jelentést adott ki, amely bizonyos következtetéseket von le a nagy adatok körüli hype-ről. A kutató cég több mint 250 marketing és üzletfejlesztési vezetőt vizsgált meg. A jelentés szerzői szerint a nagy adat retorika minden idők csúcspontja, és a technológiai gyártók olyan termékeket árusítanak, amelyek hihetetlen állításoknak tűnnek.

Gartner egyetért a Forrester Research-rel; jelentős hype veszi körül a nagy adatokat. A 2014. szeptemberi jelentésben a Gartner bemutatja az öt legnagyobb adatmítust, és a Gartner elemzői véleményt adnak arról, hogy mi érti félre a nagy adatokat és azok manipulációját. Tehát mi a big data legnagyobb mítosz? Nézzük meg.

Mítosz: Mindenki előttünk áll a nagy adatok elfogadásában.

Gartner azt mondja, hogy a nagy adatok iránti érdeklődés minden idők csúcsa. Ennek ellenére a megkérdezettek gyenge 13% -a rendelkezik működő rendszerrel. Ennek oka: a legtöbb vállalatnak még nem sikerült kitalálnia, hogyan lehet az értéket a nagy adattárházakból kinyerni. A Gartner felmérése itt optimizáltabb, mint a Forrester-jelentés, amely szerint a felmérés résztvevőinek mindössze 9% -a nyilatkozta arról, hogy a következő évben nagy adatfeldolgozási technológiákat tervez bevezetni. (A nagy adatoknak nagyon sok feladata van. Tudjon meg többet az 5 valós világbeli probléma megoldásáról. A nagy adatok megoldhatók.)

Mítosz: Olyan sok adatunk van; nem kell aggódnunk minden apró adathiány miatt.

Gartner aggodalmát fejezi ki amiatt, hogy mi emberek vagyunk: "Annyiunk van, a kicsi, ami rossz, nem számít." Ted Friedman, a Gartner alelnöke és kiváló elemzője úgy véli, hogy ez a helyzet helytelen megítélése.

"A valóságban, bár minden egyes hibának sokkal kisebb hatása van az egész adatkészletre, mint akkor, amikor kevesebb adat volt, több hiba van, mint korábban, mert több adat van" - mondta Friedman. "Ezért a rossz minőségű adatoknak az egész adatkészletre gyakorolt hatása változatlan marad."

Friedman további aggodalomra ad okot. A nagy adatgyűjtés gyakran magában foglalja a vállalkozáson kívüli adatokat is, amelyek felépítése és eredete tehát ismeretlen. Ez növeli a hibák esélyét.

Mítosz: A nagy adattechnológia kiküszöböli az adatintegráció szükségességét.

Két nagy adatelemzési stratégia alkalmazható a nagy adatokra: "séma írásra" vagy "séma olvasásra". A közelmúltig az írási séma volt az egyetlen módszer. Az olvasott séma az adatbázis-kezelés jelenlegi őrületét jelenti. Az írással kapcsolatos sémától eltérően, amely strukturált formátumot igényel, az adatok betöltésre kerülnek a séma alapján olvasható adatbázisokba nyers formátumban. Ezután a fejlesztők - strukturálatlan adatbázis-platformokat használva, mint például a Hadoop - az eltérő adatokat felhasználható formátumba hajlik. Az olvasott sémanak nyilvánvaló előnyei vannak, ám, amint azt Gartner megemlíti, az adatintegrációnak valamikor meg kell történnie.

Mítosz: Az adattárház fejlett elemzésre történő felhasználása értelmetlen.

Az adatraktár létrehozására fordított idő sok információkezelő számára értelmetlennek tűnik, különösen akkor, ha az újonnan rögzített adatok különböznek az adattárház adataitól. A Gartner azonban még egyszer figyelmezteti, hogy még a fejlett adatelemzők adatraktárakat és új adatokat is használnak, ami azt jelenti, hogy az adatintegrátoroknak:

Finomítsa az új adattípusokat, hogy azok elemzésre alkalmasak legyenek
Döntse el, mely adatok relevánsak, és milyen adatminőségre van szüksége
Határozza meg az adatok összesítésének módját
Tudja meg, hogy az adatok finomítása az adattárházon kívüli helyeken is megtörténhet

Mítosz: Az adattárak helyettesítik az adattárházat.

Az adattavak eltérő adatok tárolói, szemben az adattárakkal, ahol az adatok strukturált formátumban vannak. Az adattó létrehozása kevés előzetes erőfeszítést igényel (nincs szükség az adatok formázására) az adattárházakhoz képest, ezért az adattavak érdeklődnek.

Gartner hangsúlyozza, hogy az adatok birtoklása nem értelme - a lényeg az, ha tudjuk manipulálni a rögzített adatokat megalapozott döntéshozatal céljából. Ezenkívül problematikus a (némileg bizonyítatlan) adattavak használata a döntéshozatal megkönnyítése érdekében.

"Az adattárházak már képesek támogatni a felhasználók sokféleségét az egész szervezetben" - mondta Nick Heudecker, a Gartner kutatási igazgatója. "Az információkezelési vezetőknek nem kell megvárniuk az adattókat. (Tudjon meg többet a nagy adatok átvételéről a 7 olyan dologban, amelyet tudnia kell a nagy adatokról az elfogadás előtt.)

A Big Data működik - Lehetséges, hogy nem használnak új adatmanipulációs módszereket

A jelentés elolvasása után világossá válik az az oka, hogy Gartner szerint a „legnagyobb adatmítoszok” a „nagyadatú mítoszok” helyett. A Gartner nem hagyja ki a nagy adatokat. A Gartner sajnálja azokat, akik úgy érzik, hogy a nagy adatok manipulálásának újabb módszerei készen állnak a „prémium időre”.