Tartalomjegyzék:
Meghatározás - Mit jelent az adatok profilozása?
Az adatprofilálás az adatok különböző célokra történő megvizsgálására szolgáló módszer, például a pontosság és a teljesség meghatározása. Ez a folyamat megvizsgál egy adatforrást, például adatbázist, hogy feltárja az adatszervezés téves területeit. Ennek a technikának a telepítése javítja az adatminőséget.
Az adatprofilozást adatmegállapításnak is nevezik.
A Techopedia magyarázza az adat profilozását
Az adatprofilálás az adatforrásban rendelkezésre álló adatok vizsgálata, valamint az adatokra vonatkozó statisztikák és információk gyűjtése. Ez a statisztika segít meghatározni a metaadatok felhasználását és adatminőségét. Ezt a módszert széles körben használják a vállalati adattárolásban.
Az adatok profilolása tisztázza az adatok szerkezetét, kapcsolatát, tartalmát és származási szabályait, amelyek elősegítik a metaadatokban szereplő rendellenességek megértését. Az adatok profilozása különféle leíró statisztikákat használ, beleértve az átlagot, a minimumot, a maximumot, a percentilt, a gyakoriságot és más aggregátumokat, például a számot és az összeget. A profilozás során kapott további metaadat-információk az adattípus, hosszúság, diszkrét értékek, egyediség és absztrakt típusfelismerés.
