Ta kontakt

Kursplan

Innføring

Denne delen gir en generell introduksjon til når man bør bruke "maskinlæring", hva som bør vurderes og hva det innebærer, inkludert fordeler og ulemper. Datatyper (strukturerte/ustrukturerte/statiske/strømmende), datagyldighet/volum, datadrevet versus brukerstyrt analyse, statistiske modeller versus maskinlæringsmodeller/ utfordringer med usupervisert læring, bias-varians-handel, iterasjon/evaluering, tilnærminger for kryssvalidering, supervisert/usupervisert/forsterkning.

Viktige emner

1. Forstå Naive Bayes

  • Grunnleggende konsepter for Bayesiske metoder
  • Sannsynlighet
  • Felles sannsynlighet
  • Vilkårlig sannsynlighet med Bayes' teorem
  • Naive Bayes-algoritmen
  • Klassifisering med Naive Bayes
  • Estimering med Laplace
  • Å bruke numeriske funksjoner med Naive Bayes

2. Forstå beslutningstrær

  • Del og hersk
  • Algoritmen for beslutningstre C5.0
  • Å velge den beste delingen
  • Pruning av beslutningstrær

3. Forstå neurale nettverk

  • Fra biologiske til kunstige nevroner
  • Aktiveringsfunksjoner
  • Nettverktopologi
  • Antall lag
  • Retning for informasjonsflyt
  • Antall noder i hvert lag
  • Trening av neurale nettverk med bakoverpropagasjon
  • Dyplæring

4. Forstå støttende vektormaskiner

  • Klassifisering med hyperflater
  • Finner det maksimale margin
  • Tilfellet med lineært separerbare data
  • Tilfellet med ikke-lineært separerbare data
  • Å bruke kernelfunksjoner i ikke-lineære rom

5. Forstå klustering

  • Klustering som en maskinlæringsoppgave
  • Klustringsalgoritmen k-means
  • Å bruke avstand til å tildele og oppdatere klustere
  • Å velge passende antall klustere

6. Måling av prestasjon for klassifisering

  • Arbeiding med data fra klassifiseringsprediksjon
  • En nærmere titt på forvekslingsmatriser
  • Å bruke forvekslingsmatriser for å måle prestasjon
  • Utenfor nøyaktighet – andre prestasjonsmål
  • Kappa-statistikk
  • Sensitivitet og spesifikitet
  • Nøyaktighet og presisjon
  • F-målet
  • Visualisering av prestasjonskompromisser
  • ROC-kurver
  • Estimering av fremtidig prestasjon
  • Holdout-metoden
  • Kryssvalidering
  • Bootstrap-stikkprøvetaking

7. Tilpassing av standardmodeller for bedre prestasjon

  • Å bruke caret for automatisk parametertilpasning
  • Opprettelse av en enkel tilpasset modell
  • Skreddersye tilpasningsprosessen
  • Forbedring av modellprestasjon med meta-læring
  • Forstå ensemble
  • Bagging
  • Boosting
  • Tilfeldige skoger
  • Trening av tilfeldige skoger
  • Evaluering av prestasjon for tilfeldige skoger

Uviktige emner

8. Forstå klassifisering ved hjelp av nærmeste naboer

  • Algoritmen kNN
  • Beregning av avstand
  • Å velge en passende k
  • Forbereder data for bruk med kNN
  • Hvorfor er kNN-algoritmen "lazy"?

9. Forstå klassifiseringsregler

  • Separer og hersk
  • Algoritmen One Rule
  • Algoritmen RIPPER
  • Regler fra beslutningstrær

10. Forstå regresjon

  • Enkel lineær regresjon
  • Estimering med ordinære minste kvadrater
  • Korrelasjoner
  • Flere lineære regresjoner

11. Forstå regresjonstrær og modelltrær

  • Legge til regresjon til trær

12. Forstå assosiasjonsregler

  • Apriori-algoritmen for læring av assosiasjonsregler
  • Måling av regelinteresse – støtte og tillit
  • Bygger et sett av regler med Apriori-prinsippet

Ekstramateriale

  • Spark/PySpark/MLlib og flerarmet banditt

Krav

Python-kunnskap

 21 Timer

Antall deltakere


Pris per deltaker

Referanser (7)

Kommende kurs

Relaterte kategorier