Kursplan

Machine Learning Innledning

  • Typer av maskinlæring – overvåket vs uovervåket
  • Fra statistisk læring til maskinlæring
  • Datagravingens arbeidsflyt: forståelse av virksomheten, dataforberedelse, modellering, distribusjon
  • Å velge riktig algoritme for oppgaven
  • Overfitting og bias-variance tradeoff

Python og oversikt over ML-biblioteker

  • Hvorfor bruke programmeringsspråk for ML
  • Å velge mellom R og Python
  • Python rask gjennomgang og Jupyter Notebooks
  • Python biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testing og vurdering av ML-algoritmer

  • Generalisering, overfitting og modellvalidering
  • Vurderingsstrategier: holdout, krysvalidering, bootstrapping
  • Metrikker for regresjon: ME, MSE, RMSE, MAPE
  • Metrikker for klassifisering: nøyaktighet, forvirringsmatrise, ubalanserte klasser
  • Visulalisering av modellytelse: profittkurve, ROC-kurve, løftkurve
  • Modellvalg og grid search for justering

Dataforberedelse

  • Dataimportering og lagring i Python
  • Utforskende analyse og samle statistikk
  • Håndtering av manglende verdier og utliggere
  • Standardisering, normalisering og transformasjon
  • Kvalitativ datakoding og datahåndtering med pandas

Klassifiseringsalgoritmer

  • Binær vs flerklasses klassifisering
  • Logistisk regresjon og diskriminantfunksjoner
  • Naïve Bayes, k-nærmeste naboer
  • Beslutningstre: CART, Random Forests, Bagging, Boosting, XGBoost
  • Støttemaskiner og kjerner
  • Ensemble-læringsmetoder

Regresjon og numerisk prediksjon

  • Minste kvadrat og variabelvalg
  • Regulariseringsmetoder: L1, L2
  • Polynomregresjon og ikke-lineære modeller
  • Regresjonstrær og splines

Neural Networks

  • Innføring i neuronnettverk og dyplæring
  • Aktiveringsfunksjoner, lag og backpropagation
  • Multilagert perceptron (MLP)
  • Bruk av TensorFlow eller PyTorch for grunnleggende neuronnettverksmodellering
  • Neuronnettverk for klassifisering og regresjon

SalgsForecasting og Predictive Analytics

  • Tidsserie vs regresjonsbasert forutsiing
  • Håndtering av sesongbasert og trendbasert data
  • Bygging av en salgsforutseende modell ved hjelp av ML-teknikker
  • Vurdering av forutseende nøyaktighet og usikkerhet
  • Business tolkning og kommunikasjon av resultater

Unsupervised Learning

  • Klusterteknikker: k-means, k-medoids, hierarkisk klustering, SOMs
  • Dimensjonsreduksjon: PCA, faktoranalyse, SVD
  • Multidimensjonal skaleringsmetode

Tekstmining

  • Tekstforbehandling og tokenisering
  • Bag-of-words, stemming og lemmatisering
  • Sentimentanalyse og ordfrekvens
  • Visulalisering av tekstdata med ordskyer

Anbefalingsystemer

  • Brukerbasert og elementbasert samarbeidsfiltrering
  • Design og vurdering av anbefalingssystemer

Assosiasjonsmønstermining

  • Hyppige elementsett og Apriori-algoritmen
  • Markedsbasketanalyse og løftforhold

Uttakelsesdeteksjon

  • Analyse av ekstremverdier
  • Avstandsbaserte og tetthetsbaserte metoder
  • Uttakelsesdeteksjon i høy-dimensionell data

Machine Learning Casesøk

  • Forståelse av forretningsproblemet
  • Dataforbehandling og feature engineering
  • Modellvalg og parameterjustering
  • Vurdering og presentasjon av funn
  • Distribusjon

Oppsummering og neste trinn

Krav

  • Grunnleggende kunnskap om maskinlæringskonsepter, som overvåket og uovervåket lærings
  • Kjennskap til Python programmering (variabler, løkker, funksjoner)
  • Noen erfaring med databehandling ved hjelp av biblioteker som pandas eller NumPy er nyttig, men ikke nødvendig
  • Det forventes ikke at deltakerne har erfaring med avansert modellering eller neuronnettverks

Målgruppe

  • Dataforskere
  • Business analytikere
  • Programmerere og tekniske fagfolk som jobber med data
 28 timer

Antall deltakere


Price per participant

Testimonials (2)

Upcoming Courses

Related Categories