Kursplan
Innføring i Maskinlæring
- Typer av maskinlæring – overvåket vs. uovervåket
- Fra statistisk læring til maskinlæring
- Datagransforming: forretningsforståelse, dataforberedelse, modellering, implementering
- Valg av riktig algoritme for oppgaven
- Overfitting og bias-varians-handlingen
Oversikt over Python og ML-biblioteker
- Hvorfor bruke programmeringsspråk for ML
- Valg mellom R og Python
- Python innføringskurs og Jupyter Notebooks
- Python-biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testing og vurdering av ML-algoritmer
- Generalisering, overfitting og modellvalidering
- Vurderingsstrategier: holdout, korskjøring, bootstrapping
- Metrikker for regresjon: ME, MSE, RMSE, MAPE
- Metrikker for klassifisering: nøyaktighet, forvirringsmatrise, ubalanserte klasser
- Modellytelsevisualisering: fortjenestekurve, ROC-kurve, hevekurve
- Modellvalg og grid-søking for tuning
Datapreparering
- Dataimportering og lagring i Python
- Eksplorativ analyse og sammenstillingsstatistikk
- Håndtering av manglende verdier og utliggere
- Standardisering, normalisering og transformasjon
- Kvalitativ datakoding og datahantering med pandas
Klassifiseringsalgoritmer
- Binær vs. flerklasses klassifisering
- Logistisk regresjon og diskriminantfunksjoner
- Naïve Bayes, k-nærmeste naboer
- Beslutningstre: CART, Random Forests, Bagging, Boosting, XGBoost
- Støttemaskiner og kjerner
- Ensembløringsteknikker
Regresjon og numerisk prediksjon
- Minste kvadrat og variabelvalg
- Regulariseringsmetoder: L1, L2
- Polynomial regresjon og ikke-lineære modeller
- Regresjonstrær og splines
Neuralnetts
- Innføring i neuralnetts og dyp læring
- Aktiveringsfunksjoner, lag og backpropagation
- Flerlagsperceptroner (MLP)
- Bruk av TensorFlow eller PyTorch for grunnleggende neuralnettsmodellering
- Neuralnetts for klassifisering og regresjon
Salgsprognoser og prediktiv analyse
- Tidsrekkebaserte vs. regresjonsbaserte prognoser
- Håndtering av sesongbaserte og trendbaserte data
- Opprettelse av salgsprognosemodell ved hjelp av ML-teknikker
- Vurdering av prognosepresisjon og usikkerhet
- Forretningsfortolkning og kommunikasjon av resultater
Uovervåket Læring
- Klusterteknikker: k-means, k-medoider, hierarkisk klustering, SOMs
- Dimensjonsreduksjon: PCA, faktoranalyse, SVD
- Flerdimensjonell skaling
Tekstmining
- Tekstforbehandling og tokenisering
- Bag-of-words, stemming og lemmatisering
- Stemningsanalyse og ordfrekvens
- Visualisering av tekstdata med ordskyer
Anbefalingssystemer
- Brukerbasert og objektsbasert kollaborativ filtrering
- Design og vurdering av anbefalingssystemer
Assosiasjonsmønsteranalyse
- Hyppige objektgrupper og Apriori-algoritme
- Markedskurvanalyse og hevelag
Utliggerdeteksjon
- Ekstremverdianalyse
- Avstandsbaserte og tetthetsbaserte metoder
- Utliggerdeteksjon i høydimensjonale data
Maskinlæringsstudie
- Forstå forretningsproblemet
- Datapreparering og feature engineering
- Modellvalg og parameterjustering
- Vurdering og presentasjon av funn
- Implementering
Oppsummering og Neste Skritt
Krav
- Grunnleggende kunnskap om maskinlæringskonsepter som overvåket og uovervåket lærings
- Kjennskap til Python-programmering (variabler, løkker, funksjoner)
- Noe erfaring med datahåndtering ved bruk av biblioteker som pandas eller NumPy er nyttig, men ikke nødvendig
- Ingen forutgående erfaring med avansert modellering eller nevrale nettverk forventes
Målgruppe
- Datavitere
- Business analyser
- Programvareingeniører og tekniske fagpersoner som arbeider med data
Testimonials (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.