Kursplan

Innføring i Maskinlæring

  • Typer av maskinlæring – overvåket vs. uovervåket
  • Fra statistisk læring til maskinlæring
  • Datagransforming: forretningsforståelse, dataforberedelse, modellering, implementering
  • Valg av riktig algoritme for oppgaven
  • Overfitting og bias-varians-handlingen

Oversikt over Python og ML-biblioteker

  • Hvorfor bruke programmeringsspråk for ML
  • Valg mellom R og Python
  • Python innføringskurs og Jupyter Notebooks
  • Python-biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testing og vurdering av ML-algoritmer

  • Generalisering, overfitting og modellvalidering
  • Vurderingsstrategier: holdout, korskjøring, bootstrapping
  • Metrikker for regresjon: ME, MSE, RMSE, MAPE
  • Metrikker for klassifisering: nøyaktighet, forvirringsmatrise, ubalanserte klasser
  • Modellytelsevisualisering: fortjenestekurve, ROC-kurve, hevekurve
  • Modellvalg og grid-søking for tuning

Datapreparering

  • Dataimportering og lagring i Python
  • Eksplorativ analyse og sammenstillingsstatistikk
  • Håndtering av manglende verdier og utliggere
  • Standardisering, normalisering og transformasjon
  • Kvalitativ datakoding og datahantering med pandas

Klassifiseringsalgoritmer

  • Binær vs. flerklasses klassifisering
  • Logistisk regresjon og diskriminantfunksjoner
  • Naïve Bayes, k-nærmeste naboer
  • Beslutningstre: CART, Random Forests, Bagging, Boosting, XGBoost
  • Støttemaskiner og kjerner
  • Ensembløringsteknikker

Regresjon og numerisk prediksjon

  • Minste kvadrat og variabelvalg
  • Regulariseringsmetoder: L1, L2
  • Polynomial regresjon og ikke-lineære modeller
  • Regresjonstrær og splines

Neuralnetts

  • Innføring i neuralnetts og dyp læring
  • Aktiveringsfunksjoner, lag og backpropagation
  • Flerlagsperceptroner (MLP)
  • Bruk av TensorFlow eller PyTorch for grunnleggende neuralnettsmodellering
  • Neuralnetts for klassifisering og regresjon

Salgsprognoser og prediktiv analyse

  • Tidsrekkebaserte vs. regresjonsbaserte prognoser
  • Håndtering av sesongbaserte og trendbaserte data
  • Opprettelse av salgsprognosemodell ved hjelp av ML-teknikker
  • Vurdering av prognosepresisjon og usikkerhet
  • Forretningsfortolkning og kommunikasjon av resultater

Uovervåket Læring

  • Klusterteknikker: k-means, k-medoider, hierarkisk klustering, SOMs
  • Dimensjonsreduksjon: PCA, faktoranalyse, SVD
  • Flerdimensjonell skaling

Tekstmining

  • Tekstforbehandling og tokenisering
  • Bag-of-words, stemming og lemmatisering
  • Stemningsanalyse og ordfrekvens
  • Visualisering av tekstdata med ordskyer

Anbefalingssystemer

  • Brukerbasert og objektsbasert kollaborativ filtrering
  • Design og vurdering av anbefalingssystemer

Assosiasjonsmønsteranalyse

  • Hyppige objektgrupper og Apriori-algoritme
  • Markedskurvanalyse og hevelag

Utliggerdeteksjon

  • Ekstremverdianalyse
  • Avstandsbaserte og tetthetsbaserte metoder
  • Utliggerdeteksjon i høydimensjonale data

Maskinlæringsstudie

  • Forstå forretningsproblemet
  • Datapreparering og feature engineering
  • Modellvalg og parameterjustering
  • Vurdering og presentasjon av funn
  • Implementering

Oppsummering og Neste Skritt

Krav

  • Grunnleggende kunnskap om maskinlæringskonsepter som overvåket og uovervåket lærings
  • Kjennskap til Python-programmering (variabler, løkker, funksjoner)
  • Noe erfaring med datahåndtering ved bruk av biblioteker som pandas eller NumPy er nyttig, men ikke nødvendig
  • Ingen forutgående erfaring med avansert modellering eller nevrale nettverk forventes

Målgruppe

  • Datavitere
  • Business analyser
  • Programvareingeniører og tekniske fagpersoner som arbeider med data
 28 timer

Antall deltakere


Price per participant

Testimonials (2)

Upcoming Courses

Related Categories