Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Innføring i reinforsement learning og agens AI
- Beslutningsfattning under usikkerhet og sekvensiell planlegging
- Nøkkelsalg i RL: agenter, miljøer, tilstander og belønninger
- Rolle av RL i tilpassede og agens AI-systemer
Markov Decision Processes (MDPs)
- Formell definisjon og egenskaper av MDPs
- Verdifunksjoner, Bellman-ligninger og dynamisk programmering
- Politivurdering, forbedring og iterasjon
Model-free reinforsement learning
- Monte Carlo- og Temporal-Difference (TD) læring
- Q-læring og SARSA
- Praktiske øvelser: implementere tabulære RL-metoder i Python
Dyp reinforsement learning
- Kombinering av nevrale nettverk og RL for funksjonstilnærming
- Deep Q-Networks (DQN) og erfaringstrening
- Actor-Critic-arkitekturer og policygradients
- Praktiske øvelser: trene en agent ved hjelp av DQN og PPO med Stable-Baselines3
Utforskingsstrategier og belønningsskaping
- Balansere utforskning mot utbytte (ε-greedy, UCB, entropimetoder)
- Design av belønningssystemer og unngåing av uønskede oppføringer
- Belønningsskaping og curriculum learning
Avanserte temaer i RL og beslutningsfattning
- Multi-agent reinforsement learning og kooperative strategier
- Hierarkisk reinforsement learning og options-rammeverk
- Offline RL og imitation learning for sikrere drift
Simuleringsmiljøer og evaluering
- Bruk av OpenAI Gym og tilpassede miljøer
- Kontinuerlige vs. diskrete handlingrom
- Metrikker for agentytelse, stabilitet og samples effektivitet
Integrering av RL i agens AI-systemer
- Kombinering av resonning og RL i hybrid agent-arkitekturer
- Integrering av reinforsement learning med verktøy-brukende agenter
- Driftsaspekter ved skaling og drift
Masterprosjekt
- Design og implementering av en reinforsement learning-agent for en simulert oppgave
- Analyse av treningsytelse og optimalisering av hyperparametre
- Demonstrere tilpasning og beslutningsfattning i en agens kontekst
Sammendrag og neste trinn
Krav
- Sterk kompetanse i Python-programmering
- Solid forståelse av maskinlæring og dyp læring-konsepter
- Familiaritet med lineær algebra, sannsynlighetsteori og grunnleggende optimeringsmetoder
Målgruppe
- Reinforsement learning-ingeniører og anvendte AI-forskere
- Robotikk- og automatisering-utviklere
- Ingeniørteam som jobber med tilpassede og agens AI-systemer
28 Timer
Referanser (3)
God blanding av kunnskap og praksis
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI for Enterprise Applications
Maskinoversatt
Blandingen av teori og praksis, samt perspektiver på både høy nivå og lav nivå
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Autonomous Decision-Making with Agentic AI
Maskinoversatt
praktiske øvelser
Daniel - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI in Multi-Agent Systems
Maskinoversatt