Kursplan

Introduksjon

    Læring gjennom positiv forsterkning

Elementer av Reinforcement Learning

Viktige vilkår (handlinger, stater, belønninger, retningslinjer, verdi, Q-verdi osv.)

Oversikt over tabellløsningsmetoder

Opprette en programvareagent

Forstå verdibaserte, policybaserte og modellbaserte tilnærminger

Arbeide med Markov Decision Process (MDP)

Hvordan retningslinjer definerer en agents måte å oppføre seg på

Bruke Monte Carlo-metoder

Tidsmessig forskjellslæring

n-trinn Bootstrapping

Omtrentlig løsningsmetoder

On-policy Prediction with Approximation

On-policy kontroll med tilnærming

Off-policy metoder med tilnærming

Forstå kvalifikasjonsspor

Bruke policygradientmetoder

Oppsummering og konklusjon

Krav

  • Erfaring med maskinlæring
  • Programming erfaring

Publikum

  • Dataforskere
 21 timer

Antall deltakere



Price per participant

Relaterte kurs

AI and Robotics for Nuclear - Extended

120 timer

AI and Robotics for Nuclear

80 timer

Related Categories