Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Introduksjon
- Læring gjennom positiv forsterkning
Elements av Reinforcement Learning
Viktige vilkår (handlinger, stater, belønninger, retningslinjer, verdi, Q-verdi osv.)
Oversikt over tabellløsningsmetoder
Opprette en programvareagent
Forstå verdibaserte, policybaserte og modellbaserte tilnærminger
Arbeide med Markov Decision Process (MDP)
Hvordan retningslinjer definerer en agents måte å oppføre seg på
Bruke Monte Carlo-metoder
Temporal-Difference Learning
n-trinn Bootstrapping
Omtrentlig løsningsmetoder
Forutsigelse i henhold til retningslinjer med tilnærming
On-policy kontroll med tilnærming
Off-policy Metoder med tilnærming
Forstå kvalifikasjonsspor
Bruke policygradientmetoder
Oppsummering og konklusjon
Krav
- Erfaring med maskinlæring
- Programming erfaring
Publikum
- Dataforskere
21 timer