Tartalomjegyzék:
Meghatározás - Mit jelent a JobTracker?
A JobTracker egy démon, amely az Apache Hadoop MapReduce motorján fut. A JobTracker egy alapvető szolgáltatás, amely az összes MapReduce feladatot a fürt különböző csomópontjaira továbbítja, ideális azokban a csomópontokban, amelyek már tartalmazzák az adatokat, vagy legalábbis ugyanabban a rackben helyezkednek el, mint az adatokat tartalmazó csomópontok.
A Techopedia magyarázza a JobTracker-t
A JobTracker az a szolgáltatás, amely a Hadoop-n belül felelős az ügyfélkérések fogadásáért. Rendelteti őket a DataNodes TaskTrackerekkel, ahol a szükséges adatok helyben vannak. Ha ez nem lehetséges, a JobTracker megpróbálja hozzárendelni a feladatokat a TaskTrackershez ugyanabban a rackben, ahol az adatok helyben vannak. Ha ez valamilyen okból szintén nem sikerül, a JobTracker a feladatot egy TaskTrackerhez rendeli, ahol létezik az adatok másolata. A Hadoop alkalmazásban az adatblokkok a DataNodes-on keresztül replikálódnak a redundancia biztosítása érdekében, így ha a fürt egyik csomópontja meghiúsul, akkor a feladat sem fog sikertelen.
JobTracker folyamat:
- Az ügyfélalkalmazásokból érkező munkakereséseket a JobTracker fogadja,
- A JobTracker konzultál a NameNode-tal a szükséges adatok helyének meghatározása érdekében.
- A JobTracker megkeresi a TaskTracker csomópontokat, amelyek tartalmazzák az adatokat, vagy legalábbis az adatok közelében vannak.
- A feladat elküldésre kerül a kiválasztott TaskTrackerbe.
- A TaskTracker a JobTracker szoros figyelemmel kísérése mellett végzi feladatait. Ha a feladat sikertelen, a JobTracker egyszerűen újraküldi a feladatot egy másik TaskTracker számára. Maga a JobTracker azonban egyetlen meghibásodási pont, azaz ha kudarcot vall, az egész rendszer leesik.
- A JobTracker frissíti az állapotát, amikor a munka befejeződik.
- Az ügyfélkérelmező most információkat kérhet a JobTrackerről.
