Kursplan
Innføring i reinforsement learning og agens AI
- Beslutningsfattning under usikkerhet og sekvensiell planlegging
- Nøkkelsalg i RL: agenter, miljøer, tilstander og belønninger
- Rolle av RL i tilpassede og agens AI-systemer
Markov Decision Processes (MDPs)
- Formell definisjon og egenskaper av MDPs
- Verdifunksjoner, Bellman-ligninger og dynamisk programmering
- Politivurdering, forbedring og iterasjon
Model-free reinforsement learning
- Monte Carlo- og Temporal-Difference (TD) læring
- Q-læring og SARSA
- Praktiske øvelser: implementere tabulære RL-metoder i Python
Dyp reinforsement learning
- Kombinering av nevrale nettverk og RL for funksjonstilnærming
- Deep Q-Networks (DQN) og erfaringstrening
- Actor-Critic-arkitekturer og policygradients
- Praktiske øvelser: trene en agent ved hjelp av DQN og PPO med Stable-Baselines3
Utforskingsstrategier og belønningsskaping
- Balansere utforskning mot utbytte (ε-greedy, UCB, entropimetoder)
- Design av belønningssystemer og unngåing av uønskede oppføringer
- Belønningsskaping og curriculum learning
Avanserte temaer i RL og beslutningsfattning
- Multi-agent reinforsement learning og kooperative strategier
- Hierarkisk reinforsement learning og options-rammeverk
- Offline RL og imitation learning for sikrere drift
Simuleringsmiljøer og evaluering
- Bruk av OpenAI Gym og tilpassede miljøer
- Kontinuerlige vs. diskrete handlingrom
- Metrikker for agentytelse, stabilitet og samples effektivitet
Integrering av RL i agens AI-systemer
- Kombinering av resonning og RL i hybrid agent-arkitekturer
- Integrering av reinforsement learning med verktøy-brukende agenter
- Driftsaspekter ved skaling og drift
Masterprosjekt
- Design og implementering av en reinforsement learning-agent for en simulert oppgave
- Analyse av treningsytelse og optimalisering av hyperparametre
- Demonstrere tilpasning og beslutningsfattning i en agens kontekst
Sammendrag og neste trinn
Krav
- Sterk kompetanse i Python-programmering
- Solid forståelse av maskinlæring og dyp læring-konsepter
- Familiaritet med lineær algebra, sannsynlighetsteori og grunnleggende optimeringsmetoder
Målgruppe
- Reinforsement learning-ingeniører og anvendte AI-forskere
- Robotikk- og automatisering-utviklere
- Ingeniørteam som jobber med tilpassede og agens AI-systemer
Referanser (3)
God blanding av kunnskap og praksis
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI for Enterprise Applications
Maskinoversatt
Blandingen av teori og praksis, samt perspektiver på både høy nivå og lav nivå
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Autonomous Decision-Making with Agentic AI
Maskinoversatt
praktiske øvelser
Daniel - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI in Multi-Agent Systems
Maskinoversatt