Kursplan
Machine Learning Innledning
- Typer av maskinlæring – overvåket vs uovervåket
- Fra statistisk læring til maskinlæring
- Datagravingens arbeidsflyt: forståelse av virksomheten, dataforberedelse, modellering, distribusjon
- Å velge riktig algoritme for oppgaven
- Overfitting og bias-variance tradeoff
Python og oversikt over ML-biblioteker
- Hvorfor bruke programmeringsspråk for ML
- Å velge mellom R og Python
- Python rask gjennomgang og Jupyter Notebooks
- Python biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testing og vurdering av ML-algoritmer
- Generalisering, overfitting og modellvalidering
- Vurderingsstrategier: holdout, krysvalidering, bootstrapping
- Metrikker for regresjon: ME, MSE, RMSE, MAPE
- Metrikker for klassifisering: nøyaktighet, forvirringsmatrise, ubalanserte klasser
- Visulalisering av modellytelse: profittkurve, ROC-kurve, løftkurve
- Modellvalg og grid search for justering
Dataforberedelse
- Dataimportering og lagring i Python
- Utforskende analyse og samle statistikk
- Håndtering av manglende verdier og utliggere
- Standardisering, normalisering og transformasjon
- Kvalitativ datakoding og datahåndtering med pandas
Klassifiseringsalgoritmer
- Binær vs flerklasses klassifisering
- Logistisk regresjon og diskriminantfunksjoner
- Naïve Bayes, k-nærmeste naboer
- Beslutningstre: CART, Random Forests, Bagging, Boosting, XGBoost
- Støttemaskiner og kjerner
- Ensemble-læringsmetoder
Regresjon og numerisk prediksjon
- Minste kvadrat og variabelvalg
- Regulariseringsmetoder: L1, L2
- Polynomregresjon og ikke-lineære modeller
- Regresjonstrær og splines
Neural Networks
- Innføring i neuronnettverk og dyplæring
- Aktiveringsfunksjoner, lag og backpropagation
- Multilagert perceptron (MLP)
- Bruk av TensorFlow eller PyTorch for grunnleggende neuronnettverksmodellering
- Neuronnettverk for klassifisering og regresjon
SalgsForecasting og Predictive Analytics
- Tidsserie vs regresjonsbasert forutsiing
- Håndtering av sesongbasert og trendbasert data
- Bygging av en salgsforutseende modell ved hjelp av ML-teknikker
- Vurdering av forutseende nøyaktighet og usikkerhet
- Business tolkning og kommunikasjon av resultater
Unsupervised Learning
- Klusterteknikker: k-means, k-medoids, hierarkisk klustering, SOMs
- Dimensjonsreduksjon: PCA, faktoranalyse, SVD
- Multidimensjonal skaleringsmetode
Tekstmining
- Tekstforbehandling og tokenisering
- Bag-of-words, stemming og lemmatisering
- Sentimentanalyse og ordfrekvens
- Visulalisering av tekstdata med ordskyer
Anbefalingsystemer
- Brukerbasert og elementbasert samarbeidsfiltrering
- Design og vurdering av anbefalingssystemer
Assosiasjonsmønstermining
- Hyppige elementsett og Apriori-algoritmen
- Markedsbasketanalyse og løftforhold
Uttakelsesdeteksjon
- Analyse av ekstremverdier
- Avstandsbaserte og tetthetsbaserte metoder
- Uttakelsesdeteksjon i høy-dimensionell data
Machine Learning Casesøk
- Forståelse av forretningsproblemet
- Dataforbehandling og feature engineering
- Modellvalg og parameterjustering
- Vurdering og presentasjon av funn
- Distribusjon
Oppsummering og neste trinn
Krav
- Grunnleggende kunnskap om maskinlæringskonsepter, som overvåket og uovervåket lærings
- Kjennskap til Python programmering (variabler, løkker, funksjoner)
- Noen erfaring med databehandling ved hjelp av biblioteker som pandas eller NumPy er nyttig, men ikke nødvendig
- Det forventes ikke at deltakerne har erfaring med avansert modellering eller neuronnettverks
Målgruppe
- Dataforskere
- Business analytikere
- Programmerere og tekniske fagfolk som jobber med data
Testimonials (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.