Tartalomjegyzék:
- Meghatározás - Mit jelent a párhuzamos adatelemzés?
- A Techopedia magyarázza a Párhuzamos Adatelemzést
Meghatározás - Mit jelent a párhuzamos adatelemzés?
A párhuzamos adatelemzés egy módszer az adatok elemzésére párhuzamos folyamatok felhasználásával, amelyek egyszerre futnak több számítógépen.
A folyamatot olyan nagy adathalmazok elemzéséhez használják, mint például a nagy telefonhívások, a hálózati naplók és az internetes tárolók szöveges dokumentumokhoz, amelyek túl nagyok ahhoz, hogy egyetlen relációs adatbázisba lehessen helyezni. A módszert gyakran használják a Big Data Analytics és az általános adatelemzés során.
A Techopedia magyarázza a Párhuzamos Adatelemzést
A párhuzamos adatok elemzésének elsődleges fogalma a párhuzamosság, amelyet a számításban a folyamatok egyidejű végrehajtásaként definiálnak.
Ezt gyakran több processzor vagy akár több számítógép használatával érik el, és ez a gyakorlat az elosztott számítástechnika területén. Az adatok párhuzamos elemzésénél az adatok elemzésének különböző szempontjait végrehajtó különböző számítógépek egyidejűleg végrehajtják ezeket a folyamatokat, majd később az eredményeket egyetlen nagy jelentésbe foglalják.
Ennek a párhuzamosságnak az oka elsősorban az elemzés gyorsabbá tétele, de az is azért van, mert néhány adatkészlet túl dinamikus, túl nagy vagy egyszerűen túl nehéz feladat ahhoz, hogy hatékonyan helyezze el egyetlen relációs adatbázisban. Az eredmény az lenne, hogy ezeket az adatkészleteket különféle adatbázisokban tárolják, amelyek optimalizálva vannak az ilyen típusú adatokra, és különböző gépekben, tehát a lineáris elemzés egyszerűen nem lesz hatékony lehetőség.
