Kursplan

Introduksjon

Reinforcement Learning Grunnleggende

Grunnleggende Reinforcement Learning teknikker

Introduksjon til BURLAP

Konvergens av verdi og policy-iterasjon

Belønningsforming

Utforskning

Generalisering

Delvis observerbare MDP-er

Alternativer

Logistikk

TD Lambda

Politikk gradienter

Deep Q-Learning

Emner i Spillteori

Sammendrag og neste trinn

Krav

  • Ferdigheter i Python
  • En forståelse av høyskoleregning og lineær algebra
  • Grunnleggende forståelse av sannsynlighet og Statistics
  • Erfaring med å lage maskinlæringsmodeller i Python og Numpy

Publikum

  • Utviklere
  • Dataforskere
 21 timer

Antall deltakere



Price per participant

Relaterte kurs

Related Categories