Itthon Trends Mi a q-learning? - meghatározás a techopedia alapján

Mi a q-learning? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent a Q-tanulás?

A Q-learning egy algoritmus-struktúra kifejezése, amely modellezés nélküli megerősítési tanulást képvisel. A politika értékelésével és sztochasztikus modellezéssel a Q-learning megtalálja a legjobb utat a Markov döntési folyamatában.

A Techopedia magyarázza a Q-tanulást

A Q-learning algoritmus technikai felépítése egy ügynököt, állapotkészletet és műveletek halmazát tartalmazza állapotonként.

A Q függvény a különféle lépések súlyát használja egy diszkont tényezővel együtt a jutalom értékeléséhez.

Noha ez egyszerű ötletnek tűnik, a Q-tanulás rendkívül fontos a megerősítő tanulás és a mélyreható tanulási modellek sokféle formájában. Az egyik legjobb példa az, amikor a mély Q-tanulást arra használják fel, hogy a gépi tanulási programok megtanulják a játékstratégiákat különféle típusú videojátékokban, például az 1980-as évek Atari-játékaiban. Itt egy konvolúciós neurális hálózat mintákat vesz a játékból, hogy létrehozzon egy sztochasztikus modellt, amely segít a számítógépnek, hogy jobban tudja játszani a játékot az idő múlásával.

A Q-tanulásnak nagy a lehetősége arra, hogy elősegítse a mesterséges intelligencia és a gépi tanulás előmozdítását.

Mi a q-learning? - meghatározás a techopedia alapján