Kursplan

Innføring i forsterkende læring

  • Oversikt over forsterkende læring og dens anvendelser
  • Forskjeller mellom overvåket, uovervåket og forsterkende læring
  • Nøkkelbegreper: agent, miljø, belønninger og politikk

Markov beslutningsprosesser (MDPs)

  • Forståelse av tilstander, handlinger, belønninger og tilstandsoverganger
  • Verdifunksjoner og Bellmans likning
  • Dynamisk programmering for å løse MDPs

Kjerne RL-algoritmer

  • Tabellmetoder: Q-Learning og SARSA
  • Politibaserte metoder: REINFORCE-algoritmen
  • Actor-Critic-rammeverk og deres anvendelser

Dyp forsterkende læring

  • Innføring i Deep Q-Networks (DQN)
  • Erfaringsspilling og målnettsverk
  • Politigradienter og avanserte dype RL-metoder

RL-rammeverk og verktøy

  • Innføring i OpenAI Gym og andre RL-miljøer
  • Bruk av PyTorch eller TensorFlow for RL-modellutvikling
  • Trening, testing og benchmarking av RL-agenter

Utfordringer i RL

  • Balansering mellom utforskning og utnyttelse under trening
  • Håndtering av sjeldne belønninger og kredittildelingsproblemer
  • Skalerbarhet og beregningsutfordringer i RL

Praktiske aktiviteter

  • Implementering av Q-Learning og SARSA-algoritmer fra bunnen av
  • Trening av en DQN-basert agent for å spille et enkelt spill i OpenAI Gym
  • Justering av RL-modeller for forbedret ytelse i egendefinerte miljøer

Oppsummering og neste skritt

Krav

  • Stor forståelse av prinsipper og algoritmer innen maskinlæring
  • Dyktighet i Python-programmering
  • Kjennskap til neuronale nettverk og dyplearning-rammeverk

Målgruppe

  • Maskinlæringsingeniører
  • AI-spesialister
 14 timer

Antall deltakere


Price per participant

Testimonials (1)

Upcoming Courses

Related Categories