Kursplan

Innføring i styrket læringsalgoritmer

  • Hva er styrket læringsalgoritmer?
  • Nøkkelbegreper: agent, miljø, tilstander, handlinger og belønninger
  • Utfordringer i styrket læringsalgoritmer

Uttømming og Utforskning

  • Balansere utforskning og utnyttelse i styrket læringsalgoritmer-modeller
  • Utforskningsstrategier: epsilon-greedy, softmax og mer

Q-læring og dypt Q-Nettverk (DQN)

  • Innføring i Q-læring
  • Implementering av DQN ved bruk av TensorFlow
  • Optimering av Q-læring med erfaringsgjentakelse og målrettede nettverk

Policy-baserte metoder

  • Policy gradient-algoritmer
  • REINFORCE-algoritme og dens implementering
  • Actor-critic-metoder

Arbeid med OpenAI Gym

  • Oppsett av miljøer i OpenAI Gym
  • Simulering av agenter i dynamiske miljøer
  • Vurdering av agentens ytelse

Avanserte styrket læringsalgoritmer-teknikker

  • Multi-agent styrket læringsalgoritmer
  • Deep deterministic policy gradient (DDPG)
  • Proximal policy optimization (PPO)

Utplassering av styrket læringsalgoritmer-modeller

  • Praktiske anvendelser av styrket læringsalgoritmer
  • Integrering av styrket læringsalgoritmer-modeller i produksjonsmiljøer

Oppsummering og Neste Skritt

Krav

  • Erfaring med Python programmering
  • Grunnleggende forståelse av dyplearning og maskinlæringskonsepter
  • Kunnskap om algoritmer og matematiske konsepter som brukes i forsterkende læringsmetoder

Målgruppe

  • Datavitere
  • Maskinlæringspraktikere
  • AI-forskere
 28 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories