Tartalomjegyzék:
Meghatározás - Mit jelent a túlfűtés?
A statisztikákban és a gépi tanulásban a túlteljesítés akkor fordul elő, amikor egy modell megkísérel megjósolni az adatok túl zajos trendjét. A túlzott felszerelés egy túlságosan összetett modell eredménye, túl sok paraméterrel. A túl felszerelt modell pontatlan, mivel a trend nem tükrözi az adatok valóságát.
A Techopedia magyarázza a túlfűtést
A túl felszerelt modell egy trendvonallal rendelkező modell, amely a képzett adatok hibáit tükrözi ahelyett, hogy pontosan megjósolta volna a láthatatlan adatokat. Ez vizuálisan jobban látható az adatpontok grafikonjával és a trendvonallal. A túl felszerelt modell egy magasabb és alsó ponttal rendelkező görbét, míg a megfelelően felszerelt modell sima görbét vagy egy lineáris regressziót mutat.
A túlfűtés fő problémája az, hogy a modell hatékonyan memorizálja a meglévő adatpontokat, ahelyett, hogy megpróbálta volna megjósolni, milyen láthatatlan adatpontok lennének.
A túllépés általában túl sok edzési ponttal jár. Számos olyan módszer létezik, amelyet a gépi tanulásban részt vevő kutatók használhatnak a túlfűtés enyhítésére, ide értve a kereszt-validálást, a legalizálást, a korai leállítást, a metszést, a bayesi prírokat, a lemorzsolódást és a modell összehasonlítását.