Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
spark.mllib: datatyper, algoritmer og verktøy
- Datatyper
- Grunnleggende statistikk
- oppsummerende statistikk
- korrelasjoner
- stratifisert prøvetaking
- hypotesetesting
- streaming signifikanstesting
- generering av tilfeldig data
- Klassifisering og regresjon
- lineære modeller (SVM, logistisk regresjon, lineær regresjon)
- naive Bayes
- beslutningstrær
- ensembler av trær (Random Forests og gradient-forsterkede trær)
- isotonisk regresjon
- Samarbeidsfiltrering
- alternerende minste kvadrater (ALS)
- Klynger
- k-betyr
- Gaussisk blanding
- power iteration clustering (PIC)
- latent Dirichlet-allokering (LDA)
- halverende k-betyr
- streaming k-betyr
- Dimensjonsreduksjon
- singular verdi dekomponering (SVD)
- hovedkomponentanalyse (PCA)
- Funksjonsutvinning og transformasjon
- Hyppig mønsterutvinning
- FP-vekst
- foreningens regler
- PrefiksSpan
- Evalueringsberegninger
- Eksport av PMML-modeller
- Optimalisering (utvikler)
- stokastisk gradientnedstigning
- BFGS med begrenset minne (L-BFGS)
spark.ml: API-er på høyt nivå for ML-rørledninger
- Oversikt: estimatorer, transformatorer og rørledninger
- Utpakke, transformere og velge funksjoner
- Klassifisering og regresjon
- Klynger
- Avanserte emner
Krav
Kunnskap om ett av følgende:
- Java
- Scala
- Python
- SparkR.
35 timer
Testimonials (1)
Mange praktiske eksempler, forskjellige måter å nærme seg det samme problemet på, og noen ganger ikke så åpenbare triks for å forbedre den nåværende løsningen
Rafał - Nordea
Kurs - Apache Spark MLlib
Machine Translated