Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Innføring i forsterkende læring
- Oversikt over forsterkende læring og dens anvendelser
- Forskjeller mellom overvåket, uovervåket og forsterkende læring
- Nøkkelbegreper: agent, miljø, belønninger og politikk
Markov beslutningsprosesser (MDPs)
- Forståelse av tilstander, handlinger, belønninger og tilstandsoverganger
- Verdifunksjoner og Bellmans likning
- Dynamisk programmering for å løse MDPs
Kjerne RL-algoritmer
- Tabellmetoder: Q-Learning og SARSA
- Politibaserte metoder: REINFORCE-algoritmen
- Actor-Critic-rammeverk og deres anvendelser
Dyp forsterkende læring
- Innføring i Deep Q-Networks (DQN)
- Erfaringsspilling og målnettsverk
- Politigradienter og avanserte dype RL-metoder
RL-rammeverk og verktøy
- Innføring i OpenAI Gym og andre RL-miljøer
- Bruk av PyTorch eller TensorFlow for RL-modellutvikling
- Trening, testing og benchmarking av RL-agenter
Utfordringer i RL
- Balansering mellom utforskning og utnyttelse under trening
- Håndtering av sjeldne belønninger og kredittildelingsproblemer
- Skalerbarhet og beregningsutfordringer i RL
Praktiske aktiviteter
- Implementering av Q-Learning og SARSA-algoritmer fra bunnen av
- Trening av en DQN-basert agent for å spille et enkelt spill i OpenAI Gym
- Justering av RL-modeller for forbedret ytelse i egendefinerte miljøer
Oppsummering og neste skritt
Krav
- Stor forståelse av prinsipper og algoritmer innen maskinlæring
- Dyktighet i Python-programmering
- Kjennskap til neuronale nettverk og dyplearning-rammeverk
Målgruppe
- Maskinlæringsingeniører
- AI-spesialister
14 timer
Testimonials (1)
Trener som svarer på spørsmål på stedet.
Adrian
Kurs - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated