Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduksjon til Reinforcement Learning
- Oversikt over forsterkende læring og dens anvendelser
- Forskjeller mellom veiledet, uovervåket og forsterkende læring
- Nøkkelbegreper: agent, miljø, belønninger og politikk
Markov-beslutningsprosesser (MDPs)
- Forstå tilstander, handlinger, belønninger og tilstandsoverganger
- Verdifunksjoner og Bellman-ligningen
- Dynamisk programmering for å løse MDP-er
Kjerne RL-algoritmer
- Tabellformede metoder: Q-Learning og SARSA
- Policybaserte metoder: FORSTERK algoritme
- Aktørkritiske rammeverk og deres anvendelser
Dyp Reinforcement Learning
- Introduksjon til Deep Q-Networks (DQN)
- Opplev replay og målnettverk
- Policygradienter og avanserte dype RL-metoder
RL-rammer og verktøy
- Introduksjon til OpenAI Gym og andre RL-miljøer
- Bruker PyTorch eller TensorFlow for utvikling av RL-modeller
- Trening, testing og benchmarking av RL-agenter
Utfordringer i RL
- Balansering av leting og utnyttelse i trening
- Håndtering av sparsomme belønninger og kredittoppgaveproblemer
- Scalaevne og beregningsmessige utfordringer i RL
Hands-On Activities
- Implementering av Q-Learning og SARSA-algoritmer fra bunnen av
- Trene en DQN-basert agent til å spille et enkelt spill i OpenAI Gym
- Finjustering av RL-modeller for forbedret ytelse i tilpassede miljøer
Sammendrag og neste trinn
Krav
- Sterk forståelse av maskinlæringsprinsipper og algoritmer
- Ferdighet i Python programmering
- Kjennskap til nevrale nettverk og dype læringsrammer
Publikum
- Maskinlæringsingeniører
- AI-spesialister
14 timer
Testimonials (1)
Trener som svarer på spørsmål på stedet.
Adrian
Kurs - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated