Kursplan

Grundlag for agentbaserede systemer i produksjon

  • Agentarkitekturer: løkker, verktøy, hukommelse og orchestrasjonslag
  • Livsløp for agenter: utvikling, drift og kontinuerlig drift
  • Ufordelene ved produksjonsskalerte agentstyring

Infrastruktur og driftsmodeller

  • Drift av agenter i containerte og skyemiljøer
  • Skaleringsmønstre: horisontal vs. vertikal skalering, konkurrens, og trossing
  • Multiagent-orchestrasjon og arbeidsbelastningsbalansering

Overvåking og observabilitet

  • Nøkkelmetrikker: forsinkelse, suksessrate, hukommelsesbruk, og agentkall dybde
  • Sporing av agentaktivitet og kallgrafik
  • Instrumentering av observabilitet ved hjelp av Prometheus, OpenTelemetry, og Grafana

Logging, overvåking og samsvar

  • Sentralisert logging og strukturerte hendelsesinnsamling
  • Samsvar og overvåking i agentarbeidsflyt
  • Design av kontrolljournaler og replaymekanismer for feilsøkning

Prestasjonstuning og ressurs-optimalisering

  • Redusere inferensoverkostnader og optimalisere agent-orchestrasjonscykluser
  • Modellcaching og lette embeddings for raskere henting
  • Lasttesting og stresscenarioer for AI-rørledninger

Kostnadskontroll og styring

  • Forståelse av agentkostnadstrekkere: API-kall, hukommelse, regnekraft, og eksterne integrasjoner
  • Sporing av agentnivå kostnader og implementering av chargeback-modeller
  • Automatiseringspolicyer for å forebygge agentspreiling og idle ressursforbruk

CI/CD og driftstrategier for agenter

  • Integrering av agentpipelines i CI/CD-systemer
  • Testing, versjonskontroll, og tilbakekallingsstrategier for iterative agentoppdateringer
  • Progressiv drift og sikre driftsmekanismer

Feilhåndtering og pålitelighetsingeniøring

  • Design for feiltolerans og smidig nedstyrking
  • Retry, timeout, og circuit breaker mønstre for agent pålitelighet
  • Hendelsesrespons og post-mortem rammer for AI-drift

Avsluttende prosjekt

  • Bygge og drift en agentbasert AI-system med full overvåking og kostnadssporing
  • Simulere last, måle prestasjon, og optimalisere ressursbruk
  • Presentere endelig arkitektur og overvåkingsdashboard til medarbeidere

Sammendrag og neste steg

Krav

  • Sterk forståelse av MLOps og produksjonsmaskinlæringssystemer
  • Erfaring med containerte driftssetninger (Docker/Kubernetes)
  • Kjennskap til skykostnadsoptimalisering og observabilitetverktøy

Målgruppe

  • MLOps-ingeniører
  • Site Reliability Engineers (SREs)
  • Ingeniørledere som har ansvar for AI-infrastruktur
 21 timer

Antall deltakere


Pris per deltaker

Referanser (3)

Kommende kurs

Relaterte kategorier