Kursplan

Introduksjon Denne delen gir en generell introduksjon til når du bør bruke "maskinlæring", hva som bør vurderes og hva det betyr, inkludert fordeler og ulemper. Datatyper (strukturert/ustrukturert/statisk/strømmet), datavaliditet/volum, datadrevet vs brukerdrevet analyse, statistiske modeller vs maskinlæringsmodeller, utfordringer ved uovervåket læring, avveining av skjevhetsvarians, iterasjon/evaluering, kryssvalideringstilnærminger, overvåket/uovervåket/forsterkning. STORE EMNER 1. Forstå naive Bayes
  • Grundleggende konsepter for bayesianske metoder
  • Sannsynlighet
  • Felles sannsynlighet
  • Betinget sannsynlighet med Bayes' teorem
  • Naive Bayes-algoritmen
  • Naive Bayes-klassifisering
  • Laplace-estimatoren
  • Bruk av numeriske egenskaper med naive Bayes
2. Forstå beslutningstrær
  • Del og hersk
  • C5.0-beslutningstræalgoritmen
  • Å velge den beste delingen
  • Trimming av beslutningstræet
3. Forstå nevrale nettverk
  • Fra biologiske til kunstige nevroner
  • Aktiveringsfunksjoner
  • Nettverkstopologi
  • Antall lag
  • Informasjonens reiseretning
  • Antall noder i hvert lag
  • Trening av nevrale nettverk med tilbakepropagering
  • Deep Learning
4. Forstå støttevektormaskiner
  • Klassifisering med hyperplan
  • Finn den største marginen
  • Tilfelle med linjært skillelige data
  • Tilfelle med ikke-linjært skillelige data
  • Bruk av kjernefunksjoner for ikke-linære rom
5. Forstå clustering
  • Clustering som en maskinlæringsoppgave
  • K-means-algoritmen for clustering
  • Bruk av avstand for å tildele og oppdatere kluster
  • Å velge riktig antall kluster
6. Måling av ytelse for klassifisering
  • Arbeide med klassifiseringsprediksjonsdata
  • En nærmere titt på forvirringsmatriser
  • Bruk av forvirringsmatriser for å måle ytelse
  • Utenom nøyaktighet – andre målinger av ytelse
  • Kappa-statistikk
  • Sensitivitet og spesifisitet
  • Presisjon og tilbakekalling
  • F-måling
  • Visualisering av ytelsesavveininger
  • ROC-kurver
  • Estimering av fremtidig ytelse
  • Holdout-metoden
  • Kryssvalidering
  • Bootstrap sampling
7. Tuning av lagermodeller for bedre ytelse
  • Bruk av caret for automatisk parameterjustering
  • Opprettelse av en enkel justert modell
  • Tilpassing av justeringsprosessen
  • Forbedring av modellytelse med meta-læring
  • Forståelse av ensemble
  • Bagging
  • Boosting
  • Tilfeldige skoger
  • Trening av tilfeldige skoger
  • Vurdering av ytelse for tilfeldige skoger
MINDRE EMNER 8. Forstå klassifisering ved hjelp av nærmeste naboer
  • kNN-algoritmen
  • Beregning av avstand
  • Å velge et passende k
  • Forberedelse av data for bruk med kNN
  • Hvorfor er kNN-algoritmen lat?
9. Forstå klassifiseringsregler
  • Skille og hersk
  • One Rule-algoritmen
  • RIPPER-algoritmen
  • Regler fra beslutningstrær
10. Forstå regresjon
  • Enkel lineær regresjon
  • Ordinary least squares-estimering
  • Korrelasjoner
  • Multiplere lineære regresjoner
11. Forstå regresjonstrær og modelltrær
  • Legge til regresjon i trær
12. Forstå foreningens regler
  • Apriori-algoritmen for foreningens regellearing
  • Måling av regelinteresse – støtte og tillit
  • Bygging av en regelsett med Apriori-prinsippet
Ekstrautstyr
  • Spark/PySpark/MLlib og Multi-armed bandits

Krav

Python Kunnskap

 21 timer

Antall deltakere


Price per participant

Testimonials (7)

Upcoming Courses

Related Categories