Itthon Trends Hogyan lehet a létező adattárház-környezetet a legjobban méretezni a nagy adatanalitika igényeinek kielégítésére?

Hogyan lehet a létező adattárház-környezetet a legjobban méretezni a nagy adatanalitika igényeinek kielégítésére?

Anonim

K:

Hogyan lehet a létező adattárház-környezetet a legjobban méretezni a nagy adatanalitika igényeinek kielégítésére?

A:

Az egyes adattárház-projekteket eseti alapon kell értékelni. Általában, amikor megpróbáljuk meglévő adattárház-terveket kibővíteni a nagy adatok elemzésének jobb kezelése érdekében, egy alapvető folyamat szükséges annak meghatározásához, hogy mit kell tennünk. Az informatikai szakemberek ezt "méretezés" vagy "méretezés" -nek hívhatják.

Webinárium: Big Iron, Meet Big Data: A mainframe adatok felszabadítása a Hadoop & Spark segítségével

Itt regisztrálj

A méretezés általában magában foglalja a megfelelő feldolgozási teljesítmény megszerzését, elegendő mennyiségű memória megszerzését és erősebb szerver tevékenységek befogadását az összes nagyobb adatkészlet kezeléséhez, amelyeket az üzleti vállalkozás feldolgoz. Ezzel ellentétben a méretezés azt jelentheti, hogy a kiszolgáló hardvercsoportjait összegyűjtik, és azokat összekapcsolják a nagy adatok korrelálására.

Egyes informatikai szakértők azt javasolták, hogy az Apache Hadoop és más népszerű nagyadat-eszközök és platformok esetében a leggyakoribb módszer a hardverek méretezése és csoportosítása a kívánt hatások elérése érdekében. Mások azonban rámutatnak, hogy a mai technológiával az adattárház egy beszerzési stratégiával bővíthető, amely erőforrásokat ad hozzá a kiszolgálóhoz, például nagyobb számú feldolgozómaggal és nagyobb RAM-mal együtt.

Az adattárházaknak akár nagyobbra, akár méretezésre is szükségük van további fizikai hardveres eszközökre, hogy képesek legyenek kezelni a nagyobb adatterhelést. További emberi adminisztrációra van szükségük, ami több képzést jelent a belső csapatok számára. Nagyon sok tervezési munkát kell bevonni a projektbe annak meghatározása érdekében, hogy a nagyobb adatterhelés milyen mértékű stresszt és nyomást gyakorol egy meglévő rendszerre annak érdekében, hogy megfeleljen egy új nagy adatökoszisztémának. Az egyik nagy probléma a tárolási szűk keresztmetszetek, amelyek frissítést igényelnek a tárolóközpontokhoz, és másfajta teljesítmény-szűk keresztmetszetek, amelyek a kialakuló rendszert felboríthatják, ha nem, akkor ezekkel nem foglalkoznak.

Hogyan lehet a létező adattárház-környezetet a legjobban méretezni a nagy adatanalitika igényeinek kielégítésére?