Tartalomjegyzék:
- Meghatározás - Mit jelent a Markov döntési folyamat (MDP)?
- A Techopedia magyarázza a Markov döntési folyamatot (MDP)
Meghatározás - Mit jelent a Markov döntési folyamat (MDP)?
A Markov döntési folyamatot (MDP) a szakemberek „diszkrét időbeli sztochasztikus ellenőrzési folyamatnak” nevezik. Ennek alapja a matematika, amelyet az Andrey Markov orosz akadémia úttörője alakított ki a 19. század végén és a 20. század elején.
A Techopedia magyarázza a Markov döntési folyamatot (MDP)
A Markov-döntési folyamat és a hozzá kapcsolódó Markov-láncok magyarázatának egyik módja az, hogy ezek a modern játékelmélet elemei, amelyeket az orosz tudósok száz évvel ezelőtt végzett egyszerűbb matematikai kutatásaira alapoztak. A Markov döntési folyamat leírása szerint egy olyan forgatókönyvet tanulmányoz, amelyben a rendszer egy adott állapotkészletben van, és a döntéshozó döntései alapján halad előre egy másik államba.
A Markov lánc mint modell olyan események sorozatát mutatja, ahol egy adott esemény valószínűsége az előzőleg elért állapottól függ. A szakemberek a „megszámlálható államtérről” beszélhetnek a Markov-döntési folyamat leírásakor - egyesek a Markov-döntési modell ötletét „véletlenszerű séta” -modellhez vagy más valószínűségeken alapuló sztochasztikus modellhez társítják (a „Wall” -on gyakran idézett véletlenszerű séta-modell) Street, modellezi a részvény mozgását felfelé vagy lefelé a piaci valószínűség összefüggésében).
Általánosságban elmondható, hogy a Markov döntési folyamatait gyakran alkalmazzák a legfejlettebb technológiákra, például a robotikában, az automatizálásban és a kutatási modellekben, amelyekkel a szakemberek ma dolgoznak.
