Kursplan

Introduksjon

  • Forstå viktigheten av dataforberedelse i analyse og maskinlæringsprosesser
  • Dataforberedelses-pipeline og dens rolle i data-livsyklusen
  • Utforskning av vanlige utfordringer i rådata og deres innvirkning på analysen

Datainnsamling og -tilgang

  • Kilder til data: databaser, API-er, regneark, tekstfiler og mer
  • Teknikker for innsamling av data og sikring av datakvalitet under innsamlingen
  • Innsamling av data fra ulike kilder

Teknikker for rensing av data

  • Identifisering og håndtering av manglende verdier, utliggere og uoverensstemmelser
  • Håndtering av duplikater og feil i datasettet
  • Rensing av virkelige datasett

Data-transformasjon og standardisering

  • Teknikker for data-normalisering og -standardisering
  • Håndtering av kategorisk data: koding, binning og feature engineering
  • Transformering av rådata til brukbare formater

Dataintegrasjon og aggregasjon

  • Sammenføyning og kombinasjon av datasett fra ulike kilder
  • Løsning av data-konflikter og justering av datatyper
  • Teknikker for data-aggregasjon og konsolidering

Data-kvalitetssikring

  • Metoder for å sikre data-kvalitet og -integritet gjennom hele prosessen
  • Implementering av kvalitetskontroller og valideringsprosedyrer
  • Tilfeller og praktiske anvendelser av data-kvalitetssikring

Dimensjonredusering og feature-seleksjon

  • Forstå behovet for dimensjonreduksjon
  • Teknikker som PCA, feature-seleksjon og reduksjonsstrategier
  • Implementering av dimensjonreduksjonsteknikker

Oppsummering og neste skritt

Krav

  • Grunnleggende forståelse av datakonsepter

Målgruppe

  • Dataanalytikere
  • Databasedministratorer
  • IT-profesjonelle
 14 timer

Antall deltakere


Pris per deltaker

Referanser (2)

Kommende kurs

Relaterte kategorier