Tartalomjegyzék:
- Meghatározás - Mit jelent az adatok előfeldolgozása?
- A Techopedia magyarázza az adat előfeldolgozását
Meghatározás - Mit jelent az adatok előfeldolgozása?
Az adat előfeldolgozása egy olyan adatbányászati technika, amely magában foglalja a nyers adatok érthető formátumba történő átalakítását. A valós adatok gyakran hiányosak, következetlenek és / vagy hiányoznak bizonyos viselkedésmódok vagy trendek, és valószínűleg sok hibát tartalmaznak. Az adatok előfeldolgozása bevált módszer az ilyen kérdések megoldására. Az adatok előfeldolgozása előkészíti a nyers adatokat a további feldolgozáshoz.
Az adat előfeldolgozása adatbázis-vezérelt alkalmazások, például ügyfélkapcsolat-kezelés és szabályalapú alkalmazások (például neurális hálózatok).
A Techopedia magyarázza az adat előfeldolgozását
Az adatok az előfeldolgozás során lépések sorozatán mennek keresztül:
- Adatok tisztítása: Az adatok olyan folyamatokkal tisztíthatók, mint például a hiányzó értékek kitöltése, a zajos adatok simítása vagy az adatok következetlenségeinek kiküszöbölése.
- Adatintegráció: A különböző ábrázolásokkal ellátott adatokat összegyűjtjük, és az adatokban felmerülő konfliktusok megoldódnak.
- Adatok átalakítása: Az adatok normalizálva, összesítve és általánosítva vannak.
- Adatcsökkentés: Ennek a lépésnek az a célja, hogy csökkentse az adatok adattárházban való megjelenítését.
- Adatok diszkretizálása: A folyamatos attribútum számos értékének csökkentését vonja maga után az attribútum-intervallumok tartományának elosztása révén.
