Kursplan
Machine Learning Innføring
- Typer av maskinlæring – overvåket vs. uovervåket
- Fra statistisk lære til maskinlæring
- Datautvinningens arbeidsflyt: forståelse av forretningsbehov, datapreparering, modellering, innføring
- Å velge riktig algoritme for oppgaven
- Overfitting og bias-variance tradeoff
Python og oversikt over ML-biblioteker
- Hvorfor bruke programmeringsspråk for ML
- Å velge mellom R og Python
- Python grunnkurs og Jupyter Notebooks
- Python biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testing og vurdering av ML-algoritmer
- Generalisering, overfitting, og modellvalidering
- Vurderingsstrategier: holdout, kryssvalidering, bootstrapping
- Metrikker for regresjon: ME, MSE, RMSE, MAPE
- Metrikker for klassifisering: nøyaktighet, forvirringmatrise, ubalanserte klasser
- Visualisering av modellytelse: profitkurve, ROC-kurve, lift-kurve
- Modellvalg og grid search for tuning
Datapreparering
- Dataimport og lagring i Python
- Eksplorativ analyse og sammenfatningsstatistikk
- Håndtering av manglende verdier og utliggere
- Standardisering, normalisering og transformasjon
- Kvalitativ datakoding og databehandling med pandas
Klassifiseringsalgoritmer
- Binær vs. flerklasset klassifisering
- Logistisk regresjon og diskriminerende funksjoner
- Naïve Bayes, k-nearest neighbors
- Beslutningstrær: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines og kjerner
- Ensemble-læringsmetoder
Regresjon og numerisk prediksjon
- Minste kvadraters metode og variabelvalg
- Regulariseringsmetoder: L1, L2
- Polynomial regresjon og ikke-lineære modeller
- Regresjonstrær og splines
Unsupervised Learning
- Klusterteknikker: k-means, k-medoids, hierarkisk klustering, SOMs
- Redusere dimensjonalitet: PCA, faktoranalyse, SVD
- Multidimensjonal skaling
Tekstmining
- Tekstforbehandling og tokenisering
- Bag-of-words, stemming, og lemmatisering
- Sentimentanalyse og ordfrekvens
- Visualisering av tekstdata med ordskyer
Anbefalingssystemer
- Brukerbasert og elementbasert kollaborativ filtrering
- Design og vurdering av anbefalingssystemer
Assosiasjonsmønstermining
- Hyppige elementer og Apriori-algoritmen
- Markedsbasketanalyse og lift-forhold
Avviksdeteksjon
- Analyse av ekstremverdier
- Avstandsbaserte og tetthetsbaserte metoder
- Avviksdeteksjon i høydimensjonal data
Machine Learning Case Study
- Forstå forretningsproblemet
- Datapreparering og feature engineering
- Modellvalg og parameterjustering
- Vurdering og presentasjon av funn
- Innføring
Oppsummering og neste steg
Krav
- Grunnleggende forståelse av statistikk og lineær algebra
- Kjennskap til dataanalyse eller forretningsintelligensbegreper
- Noen erfaring med programmering (helst Python eller R) anbefales
- Interesse for å lære applikert maskinlæring for data-drevne prosjekter
Målgruppe
- Dataanalytikere og forskere
- Statistikerer og forskningsprofesjonelle
- Utviklere og IT-profesjonelle som utforsker maskinlæringsverktøy
- Alle som er involvert i datafaglige eller prediktive analytiske prosjekter
Testimonials (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Kurs - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback