Kursplan
Introduksjon
- Oversikt over Spark og Hadoop funksjoner og arkitektur
- Forstå big data
- Python grunnleggende programmering
Starter
- Sette opp Python, Spark og Hadoop
- Forstå datastrukturer i Python
- Forstå PySpark API
- Forstå HDFS og MapReduce
Integrering av Spark og Hadoop med Python
- Implementering av Spark RDD i Python
- Behandler data ved hjelp av MapReduce
- Opprette distribuerte datasett i HDFS
Machine Learning med Spark MLlib
Behandler Big Data med Spark Streaming
Arbeid med Recommender Systems
Jobber med Kafka, Sqoop, Kafka og Flume
Apache Mahout med Spark og Hadoop
Feilsøking
Sammendrag og neste trinn
Krav
- Erfaring med Spark og Hadoop
- Python programmeringserfaring
Publikum
- Dataforskere
- Utviklere
Referanser (3)
Det er en fordel at vi kunne medføre mest av informasjonen/kursmaterialet/presentasjonene/øvingene med oss, slik at vi kan se gjennom dem og kanskje gjøre om det vi ikke forsto første gang eller forbedre det vi allerede har gjort.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
Jeg likte at det klarte å legge grunnlaget for emnet og gå til noen ganske avanserte øvelser. Det ga også enkle måter å skrive/teste koden på.
Ionut Goga - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
De live-eksemplene
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt