Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduksjon:
- Apache Spark in Hadoop Ecosystem Kort intro for python, scala
Grunnleggende (teori):
- Arkitektur RDD-transformasjon og handlingsfase, oppgave, avhengigheter
Ved å bruke Databricks miljø forstå det grunnleggende (praktisk verksted):
- Øvelser ved hjelp av RDD API Grunnleggende handlings- og transformasjonsfunksjoner ParRDD Bli med Caching-strategier Øvelser med DataFrame API SparkSQL DataFrame: velg, filtrer, grupper, sorter UDF (brukerdefinert funksjon) Ser inn i DataSet API-streaming
Ved å bruke AWS-miljøet forstå distribusjonen (praktisk verksted):
- Grunnleggende om AWS Glue Forstå forskjellene mellom AWS EMR og AWS Glue Eksempeljobber i begge miljøet Forstå fordeler og ulemper
Ekstra:
- Introduksjon til Apache Airflow orkestrering
Krav
Programmeringsferdigheter (helst python, scala)
SQL grunnleggende
21 timer
Testimonials (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Kurs - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Kurs - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift