Tartalomjegyzék:
Meghatározás - Mit jelent az adatkitermelés?
Az adatkitermelés során az adatokat elemezzük és bejárjuk, hogy egy adott mintában releváns információkat szerezzünk az adatforrásokból (például adatbázisból). További adatfeldolgozásra kerül sor, amely metaadatok hozzáadását és egyéb adatintegrációt foglal magában; egy másik folyamat az adatfolyamatban.
Az adatok kinyerésének többsége strukturálatlan adatforrásokból és különböző adatformátumokból származik. Ez a nem strukturált adat bármilyen formában lehet, például táblázatok, indexek és elemzések.
A Techopedia magyarázza az adatkitermelést
A raktárban lévő adatok különböző forrásokból származhatnak, az adattárháznak három különböző módszerre van szüksége a bejövő adatok felhasználásához. Ezek a folyamatok Extraction, Transformation and Loading (ETL) néven ismertek.
Az adatkivonás folyamata magában foglalja az adatok kinyerését a szétszórt adatforrásokból. Az adatkivonatokat ezután betölti a relációs adatbázis átmeneti területére. Itt a kibontási logikát alkalmazzák, és a forrásrendszer adatainak lekérdezése az alkalmazásprogramozási felületek használatával történik. Ezt a folyamatot követően az adatok készen állnak az ETL-folyamat átalakulási szakaszának átengedésére.
