Itthon A hírekben Mi az adatok előfeldolgozása? - meghatározás a techopedia alapján

Mi az adatok előfeldolgozása? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent az adatok előfeldolgozása?

Az adat előfeldolgozása egy olyan adatbányászati ​​technika, amely magában foglalja a nyers adatok érthető formátumba történő átalakítását. A valós adatok gyakran hiányosak, következetlenek és / vagy hiányoznak bizonyos viselkedésmódok vagy trendek, és valószínűleg sok hibát tartalmaznak. Az adatok előfeldolgozása bevált módszer az ilyen kérdések megoldására. Az adatok előfeldolgozása előkészíti a nyers adatokat a további feldolgozáshoz.


Az adat előfeldolgozása adatbázis-vezérelt alkalmazások, például ügyfélkapcsolat-kezelés és szabályalapú alkalmazások (például neurális hálózatok).

A Techopedia magyarázza az adat előfeldolgozását

Az adatok az előfeldolgozás során lépések sorozatán mennek keresztül:

  • Adatok tisztítása: Az adatok olyan folyamatokkal tisztíthatók, mint például a hiányzó értékek kitöltése, a zajos adatok simítása vagy az adatok következetlenségeinek kiküszöbölése.
  • Adatintegráció: A különböző ábrázolásokkal ellátott adatokat összegyűjtjük, és az adatokban felmerülő konfliktusok megoldódnak.
  • Adatok átalakítása: Az adatok normalizálva, összesítve és általánosítva vannak.
  • Adatcsökkentés: Ennek a lépésnek az a célja, hogy csökkentse az adatok adattárházban való megjelenítését.
  • Adatok diszkretizálása: A folyamatos attribútum számos értékének csökkentését vonja maga után az attribútum-intervallumok tartományának elosztása révén.
Mi az adatok előfeldolgozása? - meghatározás a techopedia alapján