Kursplan

Introduksjon til AIOps

  • Hva er AIOps og hvorfor det er viktig
  • Tradisjonell overvåking vs. AIOps-drevet observabilitet
  • AIOps-arkitektur og nøkkeldelene

Innhenting og normalisering av driftsdata

  • Typer observabilitetsdata: metrikker, logger og spor
  • Innhenting av data fra flere kilder (servere, containere, sky)
  • Bruk av agenter og eksportører (Prometheus, Beats, Fluentd)

Datakorrelasjon og anomalideteksjon

  • Tidsrekkekorrelasjon og statistiske metoder
  • Bruk av ML-modeller for anomalideteksjon
  • Deteksjon av hendelser i distribuerte systemer

Alerting og støyreduksjon

  • Design av intelligente alert-regler og grenser
  • Undertrykkelse, dedupliserering og gruppering av alerts
  • Integrering med Alertmanager, Slack, PagerDuty eller Opsgenie

Røttsårsaksanalyse og visualisering

  • Bruk av dashboards for å visualisere metrikker og oppdage trender
  • Utforskning av hendelser og tidslinjer for Røttsårsaksanalyse (RCA)
  • Sporing av problemer over lag med distribuerte sporingstverktøy

Automatisering og korrigerende handlinger

  • Triggering av automatiske skript eller arbeidsflyter fra hendelser
  • Integrering med ITSM-systemer (ServiceNow, Jira)
  • Bruksfall: selvheiling, skalering, trafikkomdirigering

Open Source og kommersielle AIOps-plattformer

  • Oversikt over verktøy: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Evalueringsevner for valg av en AIOps-plattform
  • Demo og hands-on med en valgt stack

Oppsummering og neste steg

Krav

  • Et forståelse for IT-operasjoner og systemovervåking konsepter
  • Erfaring med overvåkingsverktøy eller dashboards
  • Kjennskap til grunnleggende logger og metrikker formater

Målgruppe

  • Operasjonslag ansvarlige for infrastruktur og applikasjoner
  • Site Reliability Engineers (SREs)
  • IT-overvåkings- og observabilitetslag
 14 Timer

Antall deltakere


Pris per deltaker

Kommende kurs

Relaterte kategorier