Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduksjon
Reinforcement Learning Grunnleggende
Grunnleggende Reinforcement Learning teknikker
Introduksjon til BURLAP
Konvergens av verdi og policy-iterasjon
Belønningsforming
Utforskning
Generalisering
Delvis observerbare MDP-er
Alternativer
Logistikk
TD Lambda
Politikk gradienter
Deep Q-Learning
Emner i Spillteori
Sammendrag og neste trinn
Krav
- Ferdigheter i Python
- En forståelse av høyskoleregning og lineær algebra
- Grunnleggende forståelse av sannsynlighet og Statistics
- Erfaring med å lage maskinlæringsmodeller i Python og Numpy
Publikum
- Utviklere
- Dataforskere
21 timer