Itthon Hang Miért csökkenti a gépi tanulásba való csomagolás varianciáját?

Miért csökkenti a gépi tanulásba való csomagolás varianciáját?

Anonim

K:

Miért csökkenti a gépi tanulásba való csomagolás varianciáját?

A:

A bootstrap aggregáció vagy a „csomagolás” a gépi tanulásban csökkenti a varianciát azáltal, hogy összetettebb adatkészletek fejlettebb modelljeit építik fel. Pontosabban, a csomagolási megközelítés olyan részhalmazokat hoz létre, amelyek gyakran átfedésben vannak, hogy az adatokat jobban bevonják.

Az egyik érdekes és egyértelmû elképzelés a csomagolás alkalmazásáról, hogy véletlenszerű mintákat készítsen és kiszámítsa az egyszerû átlagot. Ezután ugyanazon mintakészlet használatával hozzon létre tucatnyi részhalmazt, amelyek döntési fákként épülnek fel az esetleges eredmények manipulálására. A második átlagnak pontosabb képet kell mutatnia arról, hogy az egyes minták hogyan viszonyulnak egymáshoz az érték szempontjából. Ugyanez az ötlet bármely adatpont halmazára alkalmazható.

Ingyenes letöltés: Gépi tanulás és miért számít?

Mivel ez a megközelítés határozottabb határokba foglalja a felfedezést, csökkenti a varianciát és segít a túlfűtésben. Gondolj egy kissé elosztott adatpontokkal rendelkező scatterplotra; zsákolási módszer alkalmazásával a mérnökök "összecsukják" a komplexitást, és a felfedezési vonalakat a simább paraméterekhez igazítják.

Vannak olyan vélemények, akik a zsákolás értékét „osztják és meghódítják”, vagy „támogatott heurisztikának”. Az ötlet az, hogy együttes modellezéssel, például véletlenszerű erdők felhasználásával azok, akik zsákolást használnak technikának, alacsonyabb szórású adatokhoz juthatnak. A bonyolultság csökkentése szempontjából a zsákolás is segíthet a túlcsordulásban. Gondolj egy olyan modellekre, ahol túl sok adatpont van: mondjuk, a csatlakozási pont 100 egymással nem igazított ponttal. A kapott vizuális adatsor egyenetlen, dinamikus, illékony. Ezután "vasalja ki" a varianciát azáltal, hogy összeállítja az értékelési készleteket. Az együttes tanulás során ezt gyakran úgy gondolják, hogy több „gyenge tanulót” csatlakoztat, hogy „erős tanulási” együttműködési eredményt érjenek el. Az eredmény simább, körvonalasabb adatvonal és kevesebb vad variancia a modellben.

Könnyű belátni, hogyan lehet a zsákolás ötletét alkalmazni a vállalati IT rendszerekben. Az üzleti vezetők gyakran "madártávlati képet" akarnak arról, hogy mi történik a termékekkel, ügyfelekkel stb. A túl felszerelt modell visszatérhet kevésbé emészthető adatokat és több "szétszórt" eredményt eredményez, ahol a csomagolás a modell "stabilizálhatja" és hasznosabbá teheti. a végfelhasználók számára.

Miért csökkenti a gépi tanulásba való csomagolás varianciáját?