Itthon Hang Hogyan tanulhatom meg a hadoop használatát a nagy adatok elemzéséhez?

Hogyan tanulhatom meg a hadoop használatát a nagy adatok elemzéséhez?

Anonim

K:

Hogyan tanulhatom meg a Hadoop használatát a nagy adatok elemzésére?

A:

A Hadoop néven ismert Apache szoftverkészlet nagyon népszerű forrássá válik a nagy adatkészletek kezelésére. Az ilyen típusú adatkezelő szoftver keretrendszer azért lett kifejlesztve, hogy elősegítse az adatok meghatározott módon történő egyesítését, olyan tervek alapján, amelyek bizonyos típusú adatprojekteket hatékonyabbá tehetnek. A Hadoop csak egy a sok adatkészlet közül a nagy adatkészletek kezelésére.

Az egyik első és legalapvetőbb módszer a Hadoop adatainak elemzéséhez a Hadoop legfelső szintű összetevőinek és annak működésének megértése. Ezek közé tartozik a Hadoop YARN "erőforrás-kezelési platform", amely bizonyos típusú hálózati beállításokra alkalmazható, valamint egy Hadoop MapReduce funkciókészlet, amely a nagy adatkészletekre vonatkozik. Van még egy Hadoop elosztott fájlrendszer (HDFS), amely elősegíti az adatok tárolását az elosztott rendszerek között, így gyorsan és hatékonyan indexelhetők vagy letölthetők.

Ezen túlmenően azok, akik jobban meg akarják ismerkedni a Hadoop-lal, megvizsgálhatják a szakemberek számára kiadott egyedi forrásokat, akik relációs szinten magyarázzák a szoftvert. Ez a példa Chris Stucchio-tól egy személyes blogban kiváló pontokkal szolgál a Hadoop-ról és az adatskálaról. Az egyik alapvető elvitel az, hogy a Hadoop-t gyakrabban használják, mint amire szükség van, és nem feltétlenül a legjobb megoldás az egyes projektekhez. Az ilyen típusú források áttekintése elősegíti a szakemberek számára, hogy jobban megismerjék a Hadoop bármely adott forgatókönyv alkalmazásának részleteit. Stucchio metaforákat is tartalmaz a Hadoop funkcióinak a konkrét fizikai feladatokhoz való kapcsolásához. Ebben a példában a könyvtárban lévő könyvek számát számoljuk be, míg a Hadoop függvény ezt a könyvtárat részekre bonthatja, és olyan egyedi számlálókat biztosít, amelyek egy összesített adat eredménybe vannak keverve.

A szakemberek speciális képzési források és programok révén alaposabban megismerhetik a Hadoop-ot és annak nagy adatokra történő alkalmazását. Például az online tanulási társaság, a Cloudera, a távoli képzések kiemelkedő szolgáltatója számos érdekes lehetőséget kínál a Hadoop használatához és hasonló típusú adatkezeléshez.

Hogyan tanulhatom meg a hadoop használatát a nagy adatok elemzéséhez?