Tartalomjegyzék:
Meghatározás - Mit jelent a kitermelés?
A kitermelés az a folyamat, amellyel a releváns információkat adatforrásokból nyerik ki egy meghatározott mintában, adattárolási környezetben történő felhasználás céljából. A kibontás értelmet ad az adatoknak, és az adatátalakítási folyamat első lépése. Az extrakció csak bizonyos adatokat választ ki, amelyek megfelelnek egy adott feltételnek vagy kategóriának, a különféle forrásokból származó hatalmas adatgyűjteményből.
A Techopedia magyarázza a kinyerést
Adatraktározási környezetben a különféle struktúrákból és nem strukturált forrásokból származó hatalmas adatgyűjtést kell feldolgozni, átalakítani és tárolni, hogy értelmes következtetéseket és előrejelzéseket lehessen levonni. Az elsődleges forrásokból származó adatokat szisztematikusan kell importálni az adattárolási rendszerbe, amely megkönnyíti az adatokkal kapcsolatos különféle műveletek elvégzését. Ezt a folyamatot extrahálásnak nevezzük. A kibontás bizonyos szabályok betartásával hozzáadja az egyébként nem strukturált adatok struktúráját. Az alábbiakban felsorolunk néhány adatgyűjtési technikát:
- Minta illesztés
- Táblázat-alapú megközelítés
- Szöveges elemzés