K:
Hogyan teszik lehetővé az új gépi tanulási képességek a pénzügyi adatokra vonatkozó készletdokumentumok bányászatát?
A:A gépi tanulás és az AI egyik izgalmas új határa az, hogy a tudósok és a mérnökök különféle módszereket keresnek a teljesen új típusú források felhasználására a készletmozgás és a befektetési eredmények előrejelzésére. Ez egy hatalmas játékváltó a pénzügyi világban, és nagyon mélyreható módon forradalmasítja a befektetési stratégiákat.
Az ilyen típusú állománykutatás kibővítésének egyik alapvető ötlete a számítási nyelvészet, amely magában foglalja a természetes nyelv modellezését. A szakértők azt vizsgálják, hogy hogyan lehet szöveges dokumentumokat használni, a SEC-i beküldésektől a részvényesek leveleitől a többi perifériás szöveg-alapú erőforrásig, az állomány elemzésének bővítése vagy finomítása, vagy teljesen új elemzések kidolgozása érdekében.
Ingyenes letöltés: Gépi tanulás és miért számít? |
A fontos nyilatkozat az, hogy mindezt csak az idegi hálózatok, a gépi tanulás és a természetes nyelvi elemzés vadonatúj fejlesztése révén lehet megvalósítani. Az ML / AI megjelenése előtt a számítástechnikák többnyire lineáris programozást alkalmaztak a bemenetek "olvasására". A szöveges dokumentumok túl strukturálatlanok voltak, hogy hasznosak legyenek. Azonban a természetes nyelv elemzésében az elmúlt néhány évben elért haladással a tudósok azt találják, hogy lehetséges a természetes nyelvet "bányászni" számszerűsíthető eredményekre, vagyis olyan eredményekre, amelyek valamilyen módon kiszámíthatók.
A legjobb bizonyítékok és a leghasznosabb példák a weben elérhető különféle disszertációkból és doktori munkákból származnak. Lili Gao a 2016. áprilisban közzétett, „Gépi tanulás és számítástechnikai nyelvészet alkalmazásai a pénzügyi közgazdaságtanban” című cikkben képesek elmagyarázni a vállalati SEC-bejelentések, részvényesi felhívások és a közösségi média üzeneteinek bányászására vonatkozó releváns folyamatokat.
"Az értelmes jelek kivonása a strukturálatlan és nagy méretű szöveges adatokból nem könnyű feladat" - írja Gao. "Ugyanakkor a gépi tanulás és a számítási nyelvi technikák fejlesztésével a szöveges dokumentumok feldolgozása és statisztikai elemzése elvégezhető. A statisztikai szövegelemzés számos, társadalomtudományi alkalmazásában sikeresnek bizonyult." A modellezés és a kalibrálás elvont Gao-beszélgetéséből az egész kidolgozott dokumentum bemutatja, hogy az ilyen típusú elemzések miként működnek részletesen.
Az aktív projektek további forrásai között szerepelnek a GitHub projekt rövid ismertetőjei, és ez az IEEE erőforrás kifejezetten arról szól, hogy értékes pénzügyi információkat szerezzenek a „Twitter érzelmi elemzésből”.
A lényeg az, hogy ezen új NLP modellek gyors innovációt hajtanak végre mindenféle szöveges dokumentum felhasználásában, nemcsak pénzügyi elemzés céljából, hanem más, élvonalbeli felfedezéshez is, elhomályosítva a hagyományosan kialakított vonalat a „nyelv” és a „nyelv” között. "adat."