Kursplan

Innføring i reinforsement learning og agens AI

  • Beslutningsfattning under usikkerhet og sekvensiell planlegging
  • Nøkkelsalg i RL: agenter, miljøer, tilstander og belønninger
  • Rolle av RL i tilpassede og agens AI-systemer

Markov Decision Processes (MDPs)

  • Formell definisjon og egenskaper av MDPs
  • Verdifunksjoner, Bellman-ligninger og dynamisk programmering
  • Politivurdering, forbedring og iterasjon

Model-free reinforsement learning

  • Monte Carlo- og Temporal-Difference (TD) læring
  • Q-læring og SARSA
  • Praktiske øvelser: implementere tabulære RL-metoder i Python

Dyp reinforsement learning

  • Kombinering av nevrale nettverk og RL for funksjonstilnærming
  • Deep Q-Networks (DQN) og erfaringstrening
  • Actor-Critic-arkitekturer og policygradients
  • Praktiske øvelser: trene en agent ved hjelp av DQN og PPO med Stable-Baselines3

Utforskingsstrategier og belønningsskaping

  • Balansere utforskning mot utbytte (ε-greedy, UCB, entropimetoder)
  • Design av belønningssystemer og unngåing av uønskede oppføringer
  • Belønningsskaping og curriculum learning

Avanserte temaer i RL og beslutningsfattning

  • Multi-agent reinforsement learning og kooperative strategier
  • Hierarkisk reinforsement learning og options-rammeverk
  • Offline RL og imitation learning for sikrere drift

Simuleringsmiljøer og evaluering

  • Bruk av OpenAI Gym og tilpassede miljøer
  • Kontinuerlige vs. diskrete handlingrom
  • Metrikker for agentytelse, stabilitet og samples effektivitet

Integrering av RL i agens AI-systemer

  • Kombinering av resonning og RL i hybrid agent-arkitekturer
  • Integrering av reinforsement learning med verktøy-brukende agenter
  • Driftsaspekter ved skaling og drift

Masterprosjekt

  • Design og implementering av en reinforsement learning-agent for en simulert oppgave
  • Analyse av treningsytelse og optimalisering av hyperparametre
  • Demonstrere tilpasning og beslutningsfattning i en agens kontekst

Sammendrag og neste trinn

Krav

  • Sterk kompetanse i Python-programmering
  • Solid forståelse av maskinlæring og dyp læring-konsepter
  • Familiaritet med lineær algebra, sannsynlighetsteori og grunnleggende optimeringsmetoder

Målgruppe

  • Reinforsement learning-ingeniører og anvendte AI-forskere
  • Robotikk- og automatisering-utviklere
  • Ingeniørteam som jobber med tilpassede og agens AI-systemer
 28 timer

Antall deltakere


Pris per deltaker

Referanser (3)

Kommende kurs

Relaterte kategorier