Kursplan

Grunnleggende prinsipper for trygg og rettferdig AI

  • Nøkkelbegreper: sikkerhet, bias, rettferdighet, transparens
  • Typer av bias: datasett, representasjon, algoritmisk
  • Oversikt over reguleringsrammeverk (EU AI-loven, GDPR, etc.)

Bias i fine-tuned modeller

  • Hvordan fine-tuning kan introdusere eller forsterke bias
  • Case studies og reelle feilslag
  • Å identifisere bias i datasett og modellforutsetninger

Teknikker for bias-reduksjon

  • Datainnsiktstrategier (balansering, utvidelse)
  • Strategier under trening (regulering, motstridende debiasing)
  • Post-prosesseringsstrategier (utdatafiltrering, kalibrering)

Modellsikkerhet og robusthet

  • Å oppdage usikre eller skadelige utdata
  • Håndtering av motstridende inndata
  • Red teaming og stress testing av fine-tuned modeller

Revurdering og overvåking av AI-systemer

  • Bias- og rettferdighetsvurderingsmålinger (e.g., demografisk likhet)
  • Forståelsesverktøy og transparensrammeverk
  • Ongoing overvåking og styretid

Verktøykasser og praktisk trening

  • Å bruke åpne kilder (e.g., Fairlearn, Transformers, CheckList)
  • Praktisk: Å oppdage og redusere bias i en fine-tuned modell
  • Å generere trygge utdata gjennom prompt design og begrensninger

Bedriftsbrukstilfeller og beredskap for overholdelse

  • Beste praksis for å integrere sikkerhet i LLM-arbeidsflyter
  • Dokumentasjon og modellkort for overholdelse
  • Forberedelse for revurdering og eksterne vurderinger

Oppsummering og neste trinn

Krav

  • Forståelse av maskinlæringsmodeller og treningprosesser
  • Erfaring med finjustering og LLMs
  • Kjennskap til Python og NLP-konsepter

Målgruppe

  • AI-samtykke team
  • ML ingeniører
 14 timer

Antall deltakere


Pris per deltaker

Kommende kurs

Relaterte kategorier