Tartalomjegyzék:
- Meghatározás - Mit jelent a nem strukturált adatbányászat?
- A Techopedia magyarázza a nem strukturált adatbányászatot
Meghatározás - Mit jelent a nem strukturált adatbányászat?
A nem strukturált adatbányászat az a gyakorlat, amikor megvizsgáljuk a viszonylag strukturálatlan adatokat, és megpróbálunk finomabb adatkészleteket kinyerni belőlük. Ez gyakran az adatok kinyeréséből származik forrásokból, amelyeket hagyományosan nem használnak az adatbányászati tevékenységekhez.A Techopedia magyarázza a nem strukturált adatbányászatot
Az adatbányászat általában az a gyakorlat, hogy összegyűjtik az adatkészleteket, és megpróbálják csak a legértékesebb információs biteket beszerezni egy meghatározott formátumba. Ez viszonylag strukturálatlan adatokkal jellemzően nehezebb. Az informatikai szakértők a nem strukturált adatokat olyan adatoknak tekintik, amelyek nem egy meghatározott formátumban vannak, „szöveg nehéz” vagy „rejtett” adatok olyan pontatlan dokumentumokban, amelyeket hivatalosan nem rendelnek el műszaki információ szolgáltatására.
A nem strukturált dokumentumra példa lehet levél vagy levelezés két vagy több fél között. A nem strukturált adatbányászatban a technológiák lebontják ezt a levelet, és konkrét azonosítókat és információs bitteket keresnek, például a kapcsolt felek nevét, a levelek küldésének dátumát, az érintett vállalkozások nevét, a pénznem mennyiségét vagy egyéb számszerűsítést adatbitek, vagy az egyes termékekhez, szolgáltatásokhoz vagy üzletekhez rendelt kódok. Az ilyen típusú adatokat kibányozzák, majd olyan formátumba helyezik, amelyet a vállalkozások vagy más felek használhatnak gyors referenciaként vagy fejlett üzleti intelligencia alkalmazásokhoz.