Itthon Felhő alapú számítástechnika Mi az a mapreduce? - meghatározás a techopedia alapján

Mi az a mapreduce? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent a MapReduce?

A MapReduce egy olyan programozási modell, amelyet a Google vezetett be nagy adatkészletek feldolgozására és generálására a számítógépcsoportokon.

A Google először megfogalmazta a keretet a Google weblapok indexelésének kiszolgálására, és az új keret váltotta fel a korábbi indexálási algoritmusokat. A kezdõ fejlesztõk számára a MapReduce keretrendszer hasznosnak bizonyul, mivel a könyvtári rutinok felhasználhatók párhuzamos programok létrehozására anélkül, hogy aggódnának az infrafürt kommunikáció, a feladatfigyelés vagy a hibakezelési folyamatok miatt.

A MapReduce egy haszongépjármű-gépek nagy csoportján fut, és nagyon skálázható. A megvalósítás többféle formátumát számos programozási nyelv biztosítja, például Java, C # és C ++.

A Techopedia magyarázza a MapReduce-t

A MapReduce keret két részből áll:

  1. A "Térkép" elnevezésű funkció lehetővé teszi az elosztott fürt különböző pontjai számára a munka elosztását
  2. A "Reduce" elnevezésű funkció célja, hogy a klaszterek eredményeinek végső formáját egyetlen kimenetre redukálja

A MapReduce keretrendszer fő előnye a hibatűrés, ahol a fürt minden csomópontjáról időszakos jelentések várhatók a munka befejezésekor.

A feladat átvitele egyik csomópontról a másikra. Ha a főcsomópont észreveszi, hogy egy csomópont a vártnál hosszabb ideig néma volt, akkor a fő csomópont elvégzi a befagyasztott / késleltetett feladathoz való újra-hozzárendelési folyamatot.

A MapReduce keretrendszert a funkcionális programozásban használt "Térkép" és "Reduce" funkciók ihlette. A számítógépes feldolgozás a fájlrendszerben vagy az adatbázisban tárolt adatokon történik, amelyek egy sor bemeneti kulcs értéket vesznek fel, és a kimeneti kulcs értékek halmazát állítják elő.

Minden nap számos MapReduce program és MapReduce feladat végrehajtódik a Google klaszterein. A programokat automatikusan párhuzamosítják és végrehajtják az árucikkek nagy klaszterén. A futásidejű rendszer a bemeneti adatok particionálásával, a program végrehajtásának ütemezésével állítja össze a gépeket, a gépi hibakezeléssel és a szükséges gépeken belüli kommunikáció kezelésével. A párhuzamos és elosztott rendszerekkel kapcsolatos tapasztalatok nélküli programozók könnyen használhatják a nagy elosztott rendszerek erőforrásait.

A MapReduce elosztott grep-ben, elosztott rendezésben, web-link-gráf megfordításban, webes hozzáférési napló statisztikában, dokumentum-csoportosításban, gépi tanulásban és statisztikai gépi fordításban használható.

Mi az a mapreduce? - meghatározás a techopedia alapján