Itthon Hang Mi a szöveges adatbányászat? - meghatározás a techopedia alapján

Mi a szöveges adatbányászat? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent a szöveges adatbányászat?

A szöveges adatbányászat magában foglalja egy szöveges dokumentum vagy erőforrás átfésülését, hogy értékes strukturált információkat nyerjenek. Ehhez kifinomult elemző eszközökre van szükség, amelyek feldolgozzák a szöveget annak érdekében, hogy meghatározott kulcsszavakat vagy kulcsfontosságú adatpontokat kiszűrjék a viszonylag nyers vagy nem strukturált formátumokból.

A szöveges adatbányászat szöveges bányászatnak vagy szöveges elemzésnek is nevezik.

A Techopedia magyarázza a szöveges adatok bányítását

A szöveges adatbányászatban a tervezett rendszerek olyan dolgokat használnak, mint a taxonómia és a lexikai elemzés annak meghatározására, hogy a szöveges dokumentum mely részei értékesek bányászott adatokként. A statisztikai modellek általában hasznosak, és a rendszerek heurisztikákat vagy algoritmikus találgatásokat is használhatnak annak meghatározására, hogy a szöveg mely részei vannak fontosak. Más vezérlőrendszerek magukban foglalják a címkézést és a kulcsszóelemzést, ahol az eszközök konkrét megfelelő főneveket vagy egyéb címkéket és kulcsszavakat keresnek, hogy kitalálják, miről van szó.

A szövegbányászat egy másik egyedi elemét gyakran érzelmi elemzésnek hívják. Az érzelmi elemzés során, amely általában sokkal nehezebb, mint a statisztikai elemzés, az analitikai eszközök megpróbálják kitalálni az írott szöveg mögött meghúzódó hangulatot vagy érzetet, valamint a szubjektív és intuitív szintű szempontjait. A mesterséges intelligencia eszközeinek megjelenésével sok előrelépés történt az érzelmi elemzésben, így a modern szöveges adatbányászat nem csupán mennyiségi referenciák gyűjtése, és magában foglalja a szövegbányászatban magas szintű fogalmi modellek bevezetését az új és egyedi módszerek kidolgozása érdekében. az értékes adatok összesítése.

Mi a szöveges adatbányászat? - meghatározás a techopedia alapján