Kursplan

Avanserte Reinforcement Learning-teknikker

Utplasser Reinforcement Learning-modeller

Uutforsking og utnytting

Innføring i Reinforcement Learning

Policybaserte metoder

Q-learning og dype Q-nettverk (DQNs)

Oppsummering og neste trinn

Arbeid med OpenAI Gym

  • Balansere utforsking og utnytting i RL-modeller
  • Utforskingsstrategier: epsilon-greedy, softmax og mer
  • Innføring i Q-learning
  • Implementere DQNs ved hjelp av TensorFlow
  • Optimalisere Q-learning med erfaringsgjengivelse og målrettede nettverk
  • Multi-agent-forsterkende læring
  • Deep deterministic policy gradient (DDPG)
  • Proximal policy optimization (PPO)
  • Policy gradient algoritmer
  • REINFORCE-algoritmen og dens implementering
  • Actor-critic-metoder
  • Reelle applikasjoner av forsterkende læring
  • Integrere RL-modeller i produksjonsmiljøer
  • Opprette miljøer i OpenAI Gym
  • Simulere agenter i dynamiske miljøer
  • Vurdere agenteres ytelse
  • Hva er forsterkende læring?
  • Nøkkelbegreper: agent, miljø, tilstander, handlinger og belønninger
  • Utfordringer innenfor forsterkende læring

Krav

Målgruppe

  • Data scientists
  • Maskinlæringspraktikanter
  • AI-forskere
  • Erfaring med Python programmering
  • Grunnleggende forståelse av dypelæring og maskinlæringskonsepter
  • Kunnskap om algoritmer og matematiske konsepter som brukes i forsterkende læring
 28 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories