Itthon Fejlesztés Mi a Markov döntési folyamat (mdp)? - meghatározás a techopedia alapján

Mi a Markov döntési folyamat (mdp)? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent a Markov döntési folyamat (MDP)?

A Markov döntési folyamatot (MDP) a szakemberek „diszkrét időbeli sztochasztikus ellenőrzési folyamatnak” nevezik. Ennek alapja a matematika, amelyet az Andrey Markov orosz akadémia úttörője alakított ki a 19. század végén és a 20. század elején.

A Techopedia magyarázza a Markov döntési folyamatot (MDP)

A Markov-döntési folyamat és a hozzá kapcsolódó Markov-láncok magyarázatának egyik módja az, hogy ezek a modern játékelmélet elemei, amelyeket az orosz tudósok száz évvel ezelőtt végzett egyszerűbb matematikai kutatásaira alapoztak. A Markov döntési folyamat leírása szerint egy olyan forgatókönyvet tanulmányoz, amelyben a rendszer egy adott állapotkészletben van, és a döntéshozó döntései alapján halad előre egy másik államba.

A Markov lánc mint modell olyan események sorozatát mutatja, ahol egy adott esemény valószínűsége az előzőleg elért állapottól függ. A szakemberek a „megszámlálható államtérről” beszélhetnek a Markov-döntési folyamat leírásakor - egyesek a Markov-döntési modell ötletét „véletlenszerű séta” -modellhez vagy más valószínűségeken alapuló sztochasztikus modellhez társítják (a „Wall” -on gyakran idézett véletlenszerű séta-modell) Street, modellezi a részvény mozgását felfelé vagy lefelé a piaci valószínűség összefüggésében).

Általánosságban elmondható, hogy a Markov döntési folyamatait gyakran alkalmazzák a legfejlettebb technológiákra, például a robotikában, az automatizálásban és a kutatási modellekben, amelyekkel a szakemberek ma dolgoznak.

Mi a Markov döntési folyamat (mdp)? - meghatározás a techopedia alapján