K:
Miért olyan fontos a szolgáltatáskiválasztás a gépi tanulásban?
A:A szolgáltatáskiválasztás rendkívül fontos a gépi tanulásban, elsősorban azért, mert alapvető módszer arra, hogy a változók használatát arra irányítsa, amelyik a leghatékonyabb és leghatékonyabb az adott gépi tanulási rendszerben.
A szakértők arról beszélnek, hogy miként működik a szolgáltatáskiválasztás és a szolgáltatáskicsomagolás a dimenzió átok minimalizálása érdekében, vagy segít a túlfűtés kezelésében - ezek a módok a túlzottan összetett modellezés ötletének kezelésére.
Ingyenes letöltés: Gépi tanulás és miért számít? |
Egy másik módszer ezt mondani: a szolgáltatásválasztás segít abban, hogy a fejlesztők az eszközöket csak a legrelevánsabb és leghasznosabb adatok felhasználására használják a gépi tanulási képzési készletekben, ami drámaian csökkenti a költségeket és az adatmennyiséget.
Az egyik példa a komplex forma méretarányú mérésének ötlete. A program méretezésével nagyobb számú adatpontot azonosít, és a rendszer sokkal összetettebbé válik. De az összetett alak nem az a tipikus adatkészlet, amelyet egy gépi tanulási rendszer használ. Ezek a rendszerek olyan adatkészleteket használhatnak, amelyek eltérő eltérési szintjei vannak a különböző változók között. Például a fajok osztályozásában a mérnökök a szolgáltatáskiválasztás segítségével csak azokat a változókat tanulmányozhatják, amelyek a legeredményesebben eredményeznek számukra. Ha a grafikon minden állatában azonos számú szem vagy láb található, akkor ezeket az adatokat eltávolíthatják, vagy más relevánsabb adatpontok nyerhetők ki.
A szolgáltatás kiválasztása az a megkülönböztető folyamat, amellyel a mérnökök a gépi tanulási rendszereket egy cél felé irányítják. A rendszerek komplexitásának eltávolításán alapuló ötlet mellett a funkciók kiválasztása hasznos lehet annak optimalizálása szempontjából is, amit a szakértők a gépi tanulás során „elfogultsági variancia-kompromisszumnak” hívnak.
Az okok, amelyek miatt a funkciók kiválasztása segít az elfogultságon és a varianciaelemzésen, összetettebbek. A Cornell Egyetemen a funkciók kiválasztásáról, az torzítás varianciájáról és a csomagolásról készített tanulmány bemutatja, hogy a funkciók kiválasztása miként támogatja a projektet.
A szerzők szerint a cikk "megvizsgálja azt a mechanizmust, amellyel a funkciók kiválasztása javítja a felügyelt tanulás pontosságát".
A tanulmány továbbá kimondja:
Az empirikus torzítás / varianciaanalízis a szolgáltatáskiválasztás előrehaladtával azt jelzi, hogy a legpontosabb tulajdonságkészlet megfelel a tanulási algoritmus legjobb torzítás-variancia-átváltási pontjának.
Az erős vagy gyenge relevancia használatának megvitatásakor az írók a funkcióválasztásról mint "variancia-redukciós módszerről" beszélnek - ez akkor értelmes, ha a varianciára gondol, mint lényegében a variáció mennyiségére egy adott változóban. Ha nincs szórás, az adatpont vagy tömb lényegében haszontalan lehet. Rendkívül nagy szórás esetén felmerülhet a mérnökök véleménye szerint "zaj" vagy irreleváns, önkényes eredmény, amelyet a gépi tanulási rendszer számára nehéz kezelni.
Ennek fényében a funkcióválasztás alapvető része a tervezésnek a gépi tanulásban.