Kursplan

Machine Learning Innføring

  • Typer av maskinlæring – overvåket vs. uovervåket
  • Fra statistisk lære til maskinlæring
  • Datautvinningens arbeidsflyt: forståelse av forretningsbehov, datapreparering, modellering, innføring
  • Å velge riktig algoritme for oppgaven
  • Overfitting og bias-variance tradeoff

Python og oversikt over ML-biblioteker

  • Hvorfor bruke programmeringsspråk for ML
  • Å velge mellom R og Python
  • Python grunnkurs og Jupyter Notebooks
  • Python biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testing og vurdering av ML-algoritmer

  • Generalisering, overfitting, og modellvalidering
  • Vurderingsstrategier: holdout, kryssvalidering, bootstrapping
  • Metrikker for regresjon: ME, MSE, RMSE, MAPE
  • Metrikker for klassifisering: nøyaktighet, forvirringmatrise, ubalanserte klasser
  • Visualisering av modellytelse: profitkurve, ROC-kurve, lift-kurve
  • Modellvalg og grid search for tuning

Datapreparering

  • Dataimport og lagring i Python
  • Eksplorativ analyse og sammenfatningsstatistikk
  • Håndtering av manglende verdier og utliggere
  • Standardisering, normalisering og transformasjon
  • Kvalitativ datakoding og databehandling med pandas

Klassifiseringsalgoritmer

  • Binær vs. flerklasset klassifisering
  • Logistisk regresjon og diskriminerende funksjoner
  • Naïve Bayes, k-nearest neighbors
  • Beslutningstrær: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines og kjerner
  • Ensemble-læringsmetoder

Regresjon og numerisk prediksjon

  • Minste kvadraters metode og variabelvalg
  • Regulariseringsmetoder: L1, L2
  • Polynomial regresjon og ikke-lineære modeller
  • Regresjonstrær og splines

Unsupervised Learning

  • Klusterteknikker: k-means, k-medoids, hierarkisk klustering, SOMs
  • Redusere dimensjonalitet: PCA, faktoranalyse, SVD
  • Multidimensjonal skaling

Tekstmining

  • Tekstforbehandling og tokenisering
  • Bag-of-words, stemming, og lemmatisering
  • Sentimentanalyse og ordfrekvens
  • Visualisering av tekstdata med ordskyer

Anbefalingssystemer

  • Brukerbasert og elementbasert kollaborativ filtrering
  • Design og vurdering av anbefalingssystemer

Assosiasjonsmønstermining

  • Hyppige elementer og Apriori-algoritmen
  • Markedsbasketanalyse og lift-forhold

Avviksdeteksjon

  • Analyse av ekstremverdier
  • Avstandsbaserte og tetthetsbaserte metoder
  • Avviksdeteksjon i høydimensjonal data

Machine Learning Case Study

  • Forstå forretningsproblemet
  • Datapreparering og feature engineering
  • Modellvalg og parameterjustering
  • Vurdering og presentasjon av funn
  • Innføring

Oppsummering og neste steg

Krav

  • Grunnleggende forståelse av statistikk og lineær algebra
  • Kjennskap til dataanalyse eller forretningsintelligensbegreper
  • Noen erfaring med programmering (helst Python eller R) anbefales
  • Interesse for å lære applikert maskinlæring for data-drevne prosjekter

Målgruppe

  • Dataanalytikere og forskere
  • Statistikerer og forskningsprofesjonelle
  • Utviklere og IT-profesjonelle som utforsker maskinlæringsverktøy
  • Alle som er involvert i datafaglige eller prediktive analytiske prosjekter
 21 timer

Antall deltakere


Price per participant

Testimonials (3)

Upcoming Courses

Related Categories