Kursplan

Introduksjon

Denne delen gir en generell introduksjon av når du skal bruke "maskinlæring", hva som bør vurderes og hva det betyr, inkludert fordeler og ulemper. Datatyper (strukturert/ustrukturert/statisk/strømmet), datavaliditet/volum, datadrevet vs brukerdrevet analyse, statistiske modeller vs. maskinlæringsmodeller/ utfordringer ved uovervåket læring, avveining av skjevhetsvarians, iterasjon/evaluering, kryssvalideringstilnærminger , overvåket/uovervåket/forsterkning.

STORE EMNER

1. Forstå naive Bayes

    Grunnleggende begreper for Bayesianske metoder Sannsynlighet Fellessannsynlighet Betinget sannsynlighet med Bayes' teorem Den naive Bayes-algoritmen Den naive Bayes-klassifiseringen Laplace-estimatoren Bruke numeriske trekk med naive Bayes

2. Forstå beslutningstrær

    Del og hersk C5.0-beslutningstrealgoritmen Velge den beste splittelsen Beskjæring av beslutningstreet

3. Forstå nevrale nettverk

    Fra biologiske til kunstige nevroner Aktiveringsfunksjoner Nettverkstopologi Antall lag Informasjonens reiseretning Antall noder i hvert lag Trening av nevrale nettverk med tilbakepropagasjon Deep Learning

4. Forstå støttevektormaskiner

    Klassifisering med hyperplan Finne maksimal margin Tilfellet av lineært separerbare data Tilfellet av ikke-lineært separerbare data Bruke kjerner for ikke-lineære rom

5. Forstå clustering

    Klynger som en maskinlæringsoppgave K-betyr-algoritmen for klynger Bruke avstand til å tildele og oppdatere klynger Velge riktig antall klynger

6. Måling av ytelse for klassifisering

    Arbeide med klassifikasjonsprediksjonsdata En nærmere titt på forvirringsmatriser Bruke forvirringsmatriser for å måle ytelse Utover nøyaktighet – andre mål for ytelse Kappa-statistikken Sensitivitet og spesifisitet Presisjon og tilbakekalling F-målet Visualisering av ytelsesavveininger ROC-kurver Anslå fremtidig ytelse Holdout-metoden Kryss- validering Bootstrap prøvetaking

7. Tuning lagermodeller for bedre ytelse

    Bruke caret for automatisert parameterinnstilling Lage en enkel innstilt modell Tilpasse innstillingsprosessen Forbedre modellytelse med meta-læring Forstå ensembler Bagging Boosting Tilfeldige skoger Trening tilfeldige skoger Evaluering av tilfeldig skogytelse

MINDRE EMNER

8. Forstå klassifisering ved hjelp av nærmeste naboer

    kNN-algoritmen Beregne avstand Velge en passende k Forberede data for bruk med kNN Hvorfor er kNN-algoritmen lat?

9. Forstå klassifiseringsregler

    Separer og erobre The One Rule-algoritmen RIPPER-algoritmen Regler fra beslutningstrær

10. Forstå regresjon

    Enkel lineær regresjon Ordinær minste kvadraters estimering Korrelasjoner Multippel lineær regresjon

11. Forstå regresjonstrær og modelltrær

    Legge til regresjon til trær

12. Forstå foreningens regler

    Apriori-algoritmen for assosiasjonsregellæring Måling av regelinteresse – støtte og tillit Bygge et sett med regler med Apriori-prinsippet

Ekstrautstyr

    Spark/PySpark/MLlib og flerarmede banditter
  21 timer
 

Antall deltakere


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Testimonials (5)

Relaterte kurs

Related Categories