Tartalomjegyzék:
- Meghatározás - Mit jelent a nyílt forrású nagy adatelemzés?
- A Techopedia magyarázza a nyílt forráskódú nagy adatelemzést
Meghatározás - Mit jelent a nyílt forrású nagy adatelemzés?
A nyílt forráskódú nagy adatanalitika a nyílt forráskódú szoftverek és eszközök használatát jelenti hatalmas mennyiségű adat elemzéséhez, releváns és gyakorlati információk gyűjtése érdekében, amelyeket a szervezet felhasználhat üzleti céljainak előmozdítása érdekében. A nyílt forráskódú nagy adatok elemzésében a legnagyobb szereplő az Apache's Hadoop - ez a legszélesebb körben használt szoftverkönyvtár, amely hatalmas adatkészletek feldolgozására szolgál egy számítógépcsoportban egy elosztott folyamat segítségével, a párhuzamosság érdekében.
A Techopedia magyarázza a nyílt forráskódú nagy adatelemzést
A nyílt forráskódú nagy adatok elemzése nyílt forrású szoftvereket és eszközöket használ annak érdekében, hogy a nagy adatok elemzését akár teljes szoftverplatform, akár különféle nyílt forrású eszközök segítségével végezzék el az adatok elemzésének különböző feladataira. Az Apache Hadoop a legismertebb rendszer a nagy adatelemzéshez, de más összetevőkre van szükség ahhoz, hogy egy valódi elemző rendszer összeállítható legyen.
A Hadoop a Google és a Yahoo által úttörő MapReduce algoritmus nyílt forrású megvalósítása, tehát a legtöbb elemző rendszer alapja. Számos nagy adatanalitikai eszköz használja a nyílt forráskódú rendszereket, ideértve az olyan robusztus adatbázis-rendszereket is, mint például a nyílt forráskódú MongoDB, egy kifinomult és méretezhető NoSQL adatbázis, amely nagyon alkalmas nagy adatok alkalmazására, valamint mások.
A nyílt forráskódú big data elemző szolgáltatások a következőket foglalják magukban:
- Adatgyűjtő rendszer
- Vezérlő központ a klaszterek adminisztrációjára és megfigyelésére
- Gépi tanulás és az adatbányász könyvtár
- Alkalmazás-koordinációs szolgáltatás
- Számítsuk ki a motort
- Végrehajtási keret