Kursplan
Innføring i Maskinlæring
- Typer av maskinlæring – overvåket vs. uovervåket
- Fra statistisk læring til maskinlæring
- Datagransforming: forretningsforståelse, dataforberedelse, modellering, implementering
- Valg av riktig algoritme for oppgaven
- Overfitting og bias-varians-handlingen
Oversikt over Python og ML-biblioteker
- Hvorfor bruke programmeringsspråk for ML
- Valg mellom R og Python
- Python innføringskurs og Jupyter Notebooks
- Python-biblioteker: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testing og vurdering av ML-algoritmer
- Generalisering, overfitting og modellvalidering
- Vurderingsstrategier: holdout, korskjøring, bootstrapping
- Metrikker for regresjon: ME, MSE, RMSE, MAPE
- Metrikker for klassifisering: nøyaktighet, forvirringsmatrise, ubalanserte klasser
- Modellytelsevisualisering: fortjenestekurve, ROC-kurve, hevekurve
- Modellvalg og grid-søking for tuning
Datapreparering
- Dataimportering og lagring i Python
- Eksplorativ analyse og sammenstillingsstatistikk
- Håndtering av manglende verdier og utliggere
- Standardisering, normalisering og transformasjon
- Kvalitativ datakoding og datahantering med pandas
Klassifiseringsalgoritmer
- Binær vs. flerklasses klassifisering
- Logistisk regresjon og diskriminantfunksjoner
- Naïve Bayes, k-nærmeste naboer
- Beslutningstre: CART, Random Forests, Bagging, Boosting, XGBoost
- Støttemaskiner og kjerner
- Ensembløringsteknikker
Regresjon og numerisk prediksjon
- Minste kvadrat og variabelvalg
- Regulariseringsmetoder: L1, L2
- Polynomial regresjon og ikke-lineære modeller
- Regresjonstrær og splines
Neuralnetts
- Innføring i neuralnetts og dyp læring
- Aktiveringsfunksjoner, lag og backpropagation
- Flerlagsperceptroner (MLP)
- Bruk av TensorFlow eller PyTorch for grunnleggende neuralnettsmodellering
- Neuralnetts for klassifisering og regresjon
Salgsprognoser og prediktiv analyse
- Tidsrekkebaserte vs. regresjonsbaserte prognoser
- Håndtering av sesongbaserte og trendbaserte data
- Opprettelse av salgsprognosemodell ved hjelp av ML-teknikker
- Vurdering av prognosepresisjon og usikkerhet
- Forretningsfortolkning og kommunikasjon av resultater
Uovervåket Læring
- Klusterteknikker: k-means, k-medoider, hierarkisk klustering, SOMs
- Dimensjonsreduksjon: PCA, faktoranalyse, SVD
- Flerdimensjonell skaling
Tekstmining
- Tekstforbehandling og tokenisering
- Bag-of-words, stemming og lemmatisering
- Stemningsanalyse og ordfrekvens
- Visualisering av tekstdata med ordskyer
Anbefalingssystemer
- Brukerbasert og objektsbasert kollaborativ filtrering
- Design og vurdering av anbefalingssystemer
Assosiasjonsmønsteranalyse
- Hyppige objektgrupper og Apriori-algoritme
- Markedskurvanalyse og hevelag
Utliggerdeteksjon
- Ekstremverdianalyse
- Avstandsbaserte og tetthetsbaserte metoder
- Utliggerdeteksjon i høydimensjonale data
Maskinlæringsstudie
- Forstå forretningsproblemet
- Datapreparering og feature engineering
- Modellvalg og parameterjustering
- Vurdering og presentasjon av funn
- Implementering
Oppsummering og Neste Skritt
Krav
- Grunnleggende kunnskap om maskinlæringskonsepter som overvåket og uovervåket lærings
- Kjennskap til Python-programmering (variabler, løkker, funksjoner)
- Noe erfaring med datahåndtering ved bruk av biblioteker som pandas eller NumPy er nyttig, men ikke nødvendig
- Ingen forutgående erfaring med avansert modellering eller nevrale nettverk forventes
Målgruppe
- Datavitere
- Business analyser
- Programvareingeniører og tekniske fagpersoner som arbeider med data
Referanser (2)
ML-økosystemet omfatter ikke bare MLFlow, men også Optuna, Hyperopt, Docker og Docker Compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
Maskinoversatt
Jeg nyttet på å delta i Kubeflow-treningen, som ble holdt pa nätet. Denne treningen gjorde det mulig for meg å fest igjen kunnskapen min om AWS-tjenester, K8s og alle devOps-verktøyene rundt Kubeflow, som er de nødvendige grunnlagene for å tilnærme seg emnet på riktig måte. Jeg ønsker å takke Malawski Marcin for hans tålmodighet og profesjonale innstilling når det gjelder trening og råd om beste praksis. Malawski tilnærmer seg emnet fra ulike vinkler, med ulike distribusjonsverktøy som Ansible, EKS kubectl, Terraform. Nå er jeg helt overbevist om at jeg går inn i det riktige anvendelsesfeltet.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurs - Kubeflow
Maskinoversatt