Itthon IT-Business Mi a nem strukturált adatbányászat? - meghatározás a techopedia alapján

Mi a nem strukturált adatbányászat? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent a nem strukturált adatbányászat?

A nem strukturált adatbányászat az a gyakorlat, amikor megvizsgáljuk a viszonylag strukturálatlan adatokat, és megpróbálunk finomabb adatkészleteket kinyerni belőlük. Ez gyakran az adatok kinyeréséből származik forrásokból, amelyeket hagyományosan nem használnak az adatbányászati ​​tevékenységekhez.


A Techopedia magyarázza a nem strukturált adatbányászatot

Az adatbányászat általában az a gyakorlat, hogy összegyűjtik az adatkészleteket, és megpróbálják csak a legértékesebb információs biteket beszerezni egy meghatározott formátumba. Ez viszonylag strukturálatlan adatokkal jellemzően nehezebb. Az informatikai szakértők a nem strukturált adatokat olyan adatoknak tekintik, amelyek nem egy meghatározott formátumban vannak, „szöveg nehéz” vagy „rejtett” adatok olyan pontatlan dokumentumokban, amelyeket hivatalosan nem rendelnek el műszaki információ szolgáltatására.


A nem strukturált dokumentumra példa lehet levél vagy levelezés két vagy több fél között. A nem strukturált adatbányászatban a technológiák lebontják ezt a levelet, és konkrét azonosítókat és információs bitteket keresnek, például a kapcsolt felek nevét, a levelek küldésének dátumát, az érintett vállalkozások nevét, a pénznem mennyiségét vagy egyéb számszerűsítést adatbitek, vagy az egyes termékekhez, szolgáltatásokhoz vagy üzletekhez rendelt kódok. Az ilyen típusú adatokat kibányozzák, majd olyan formátumba helyezik, amelyet a vállalkozások vagy más felek használhatnak gyors referenciaként vagy fejlett üzleti intelligencia alkalmazásokhoz.

Mi a nem strukturált adatbányászat? - meghatározás a techopedia alapján