Kursplan

Grunnleggende Python for Dataprosesser

  • Installering av Python og oppsett av utviklingsmiljø
  • Språkgrundlag: variabler, datatyper, kontrollstrukturer
  • Skriving og kjøring av enkle Python-skript

Filhåndtering: CSV og Excel

  • Lesing og skriving av CSV-filer med csv-modulen og Pandas
  • Arbeid med Excel-filer med openpyxl/xlrd og Pandas
  • Praktiske øvelser: automatisering av filkonverteringer

Introduksjon til Pandas

  • Grunnleggende DataFrame: opprettelse, indeksering, valg og filtrering
  • Aggregasjon og grupperingsoperasjoner
  • Vanlige rensingsoperasjoner: manglende verdier, duplikat og typkonverteringer

Introduksjon til Polars

  • Polars-konsepter og ytelsesegenskaper sammenlignet med Pandas
  • Grunnleggende DataFrame-operasjoner i Polars
  • Brukseksempel: når man skal velge Polars fremfor Pandas

Avansert Data-transformasjon (Mellomnivå)

  • Komplekse joins, vindusfunksjoner og pivoteringsoperasjoner i Pandas
  • Effektive dataforbehandlingsmønstre med Polars
  • Kjeding av operasjoner og optimalisering av minnebruk

Prosessautomatisering med Python

  • Skriving av skript for automatisering av gjentatte dataprosesser og ETL-trinn
  • Planlegging av skript med OS-schedulere eller oppgaveplanleggere
  • Logging, feilhåndtering og varsler

Pakking av Skript og Beste Praksis

  • Opprettelse av eksekverbare filer med PyInstaller eller lignende verktøy
  • Prosjektstruktur, virtuelle miljøer og avhengighetshåndtering
  • Grunnleggende versjonskontroll og dokumentering av arbeidsflyt

Pratisk Mini-prosjekt

  • Helhetlig oppgave: lesing av råfiler, rensing og transformasjon av data, produksjon av utdata
  • Automatisering av arbeidsflyten og pakking som et kjørbart skript eller eksekverbar fil
  • Gjennomgang og forbedringer basert på kollegaer tilbakemelding

Oppsummering og Neste Skritt

Krav

  • Grunnleggende kjennskap til programmeringskonsepter eller vilje til å lære
  • Komfortabel med bruk av kommando-linje eller terminal for pakkeinstallasjon
  • Erfaring med å arbeide med regneark (CSV/Excel)

Målgruppe

  • Dataanalytikere og operasjonelt personell som automatiserer dataprosesser
  • Analytiske ingeniører som søker lettvekts ETL-scripting
  • Profesjonelle interessert i praktiske Python-baserte dataprosesser
 14 timer

Antall deltakere


Pris per deltaker

Referanser (5)

Kommende kurs

Relaterte kategorier