Az adatforrások kombinálása a Hadoop-ban összetett üzlet. Ennek néhány oka a következő:
- Az adatforrásokat egyesítő, egyéni, forrás-specifikus szkriptek problémák.
- Az adatintegráció vagy az adattudományi eszközök használata túl sok bizonytalanságot vezet be.
- A külső forrásokból származó adatok hozzáadása szinte lehetetlen.
Ma azt fogom megvitatni, hogy a Hadoop elemzését hogyan fejlesztették ki olyan forrás-agnosztikai technológiák, amelyek megkönnyítik a belső és a külső adatforrások kombinálását. A forrás-agnosztikai módszerek működésének ismertetése mellett azt is bemutatom, hogy a Hadoop analitika miért igényel beépített intelligencia- és tudásátviteli képességeket, a kapcsolatok és az adatjellemzők megértését, valamint a skálázható és nagy teljesítményű architektúrát.
Webinar: Jelentésmátrixok: A pontok összekapcsolása a Hadoop-en belül - Regisztráljon itt |