Kursplan

Innføring i AIOps

  • Hva er AIOps og hvorfor det er viktig
  • Tradisjonell overvåking vs. AIOps-drevet observabilitet
  • AIOps arkitektur og hovedkomponenter

Samle og normalisere operasjonsdata

  • Typer av observabilitetsdata: metrikker, logger og sporing
  • Innhente data fra flere kilder (servere, containere, sky)
  • Bruke agenter og eksportører (Prometheus, Beats, Fluentd)

Datakorrelasjon og anomalideteksjon

  • Tidsseriekorrelasjon og statistiske metoder
  • Bruke ML-modeller for anomalideteksjon
  • Detektere hendelser i fordelte systemer

Varsling og støyreduksjon

  • Design av intelligente varslingsregler og terskler
  • Undertrykking, deduplisering og varslingsgruppering
  • Integrering med Alertmanager, Slack, PagerDuty eller Opsgenie

Rotårsaksanalyse og visualisering

  • Bruke dashboards til å visualisere metrikker og oppdage trender
  • Utforske hendelser og tidlinjer for rotårsaksanalyse
  • Spore problemer gjennom lag med fordelt sporing

Automatisering og gjenoppretting

  • Utløse automatiserte skript eller arbeidsflyter fra hendelser
  • Integrering med ITSM-systemer (ServiceNow, Jira)
  • Bruksområder: selvhelbredelse, skaling, trafikkomdirigering

Åpne og kommersielle AIOps-plattformer

  • Oversikt over verktøy: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kriterier for å velge en AIOps-plattform
  • Demo og henderfaring med en valgt stabel

Sammenfatning og neste skritt

Krav

  • Forståelse av IT-operasjons- og systemovervåkingskonsepter
  • Erfaring med overvåkningsverktøy eller dashboards
  • Kjennskap til grunnleggende logg- og metrikkformater

Målgruppe

  • Operasjonsteam ansvarlig for infrastruktur og applikasjoner
  • Site Reliability Engineers (SREs)
  • IT-overvåkings- og observabilitetsteam
 14 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories