Tartalomjegyzék:
- Meghatározás - Mit jelent az Extract Transform Load (ETL)?
- A Techopedia magyarázza az Extract Transform Load-ot (ETL)
Meghatározás - Mit jelent az Extract Transform Load (ETL)?
Az extrakciós transzfer terhelés (ETL) az extrakció, átalakítás és betöltés folyamata az adatbázis használata során, de különösen az adattárolás használatakor. Ez magában foglalja a következő alfolyamatokat:
- Adatok beolvasása külső adattárolási vagy továbbítási forrásokból
- Adatok átalakítása érthető formátumba, ahol az adatokat rendszerint egy hibadetektálási és -javító kóddal együtt tárolják a működési igények kielégítése érdekében
- Adatok továbbítása és betöltése a fogadó végére
A Techopedia magyarázza az Extract Transform Load-ot (ETL)
Az ETL-folyamat első szakasza az adatoknak a tárolási forrásból történő lekérésére koncentrál. A legtöbb adattároló projekt integrálja a különféle forrásrendszerekből kapott adatokat. Minden egyes rendszer külön adatszervezetet vagy formátumot alkalmazhat. Az általános adatforrás-struktúrák a relációs adatbázisok és a tiszta adatfájlok. Tartalmazhatnak nem relációs adatbázis-mintákat, például információkezelő rendszereket vagy egyéb adatstruktúrákat, például virtuális tárolási hozzáférési módszert (VSAM) vagy indexált szekvenciális hozzáférési módszert (ISAM). Az adatforrások akár külső forrásokat is magukban foglalhatnak, például az internetről vagy a szkennelő rendszeren keresztül származó adatokat.
A transzformációs szakasz egy sor szabályt vagy műveletet használ a tiszta adatoknak a forrásból történő kinyerésére, az adatok végső formájában történő továbbítására, a manipuláció céljából a fogadó végén. Néhány adatforrás nagyon kevés vagy akár egyáltalán nem is igényel adatfeldolgozást. Időnként egy vagy több átalakítás kritikus lehet, hogy megfeleljen a cél adatbázis üzleti és műszaki követelményeinek.
A betöltési vagy továbbítási szakasz célja az adatok küldése a fogadó véghez, amely valószínűleg adattárolás. Az alkalmazás igényei szerint ez a folyamat nagyon egyszerű vagy nagyon bonyolult lehet. Egyes adattárolási módszerek a régi adatokat kumulatív adatokkal helyettesíthetik. A kinyert adatok frissítésére általában rendszeres időközönként kerül sor.