Tartalomjegyzék:
- Meghatározás - Mit jelent a szöveges adatbányászat?
- A Techopedia magyarázza a szöveges adatok bányítását
Meghatározás - Mit jelent a szöveges adatbányászat?
A szöveges adatbányászat magában foglalja egy szöveges dokumentum vagy erőforrás átfésülését, hogy értékes strukturált információkat nyerjenek. Ehhez kifinomult elemző eszközökre van szükség, amelyek feldolgozzák a szöveget annak érdekében, hogy meghatározott kulcsszavakat vagy kulcsfontosságú adatpontokat kiszűrjék a viszonylag nyers vagy nem strukturált formátumokból.
A szöveges adatbányászat szöveges bányászatnak vagy szöveges elemzésnek is nevezik.
A Techopedia magyarázza a szöveges adatok bányítását
A szöveges adatbányászatban a tervezett rendszerek olyan dolgokat használnak, mint a taxonómia és a lexikai elemzés annak meghatározására, hogy a szöveges dokumentum mely részei értékesek bányászott adatokként. A statisztikai modellek általában hasznosak, és a rendszerek heurisztikákat vagy algoritmikus találgatásokat is használhatnak annak meghatározására, hogy a szöveg mely részei vannak fontosak. Más vezérlőrendszerek magukban foglalják a címkézést és a kulcsszóelemzést, ahol az eszközök konkrét megfelelő főneveket vagy egyéb címkéket és kulcsszavakat keresnek, hogy kitalálják, miről van szó.
A szövegbányászat egy másik egyedi elemét gyakran érzelmi elemzésnek hívják. Az érzelmi elemzés során, amely általában sokkal nehezebb, mint a statisztikai elemzés, az analitikai eszközök megpróbálják kitalálni az írott szöveg mögött meghúzódó hangulatot vagy érzetet, valamint a szubjektív és intuitív szintű szempontjait. A mesterséges intelligencia eszközeinek megjelenésével sok előrelépés történt az érzelmi elemzésben, így a modern szöveges adatbányászat nem csupán mennyiségi referenciák gyűjtése, és magában foglalja a szövegbányászatban magas szintű fogalmi modellek bevezetését az új és egyedi módszerek kidolgozása érdekében. az értékes adatok összesítése.