Kursplan
Innledning
Oversikt over tilganger til data (Hive, databaser, etc.)
Oversikt over Spark-funksjoner og arkitektur
Installasjon og konfigurasjon av Spark
Forklaring av Dataframes i Spark
Definisjon av tabeller og importering av datasett
Utgjørelse av SQL-spørringer på Dataframes
Gjennomføring av aggregeringer, JOINs og nestede spørringer
Last opp og tilgang til data
Forespørsel om ulike typer data
- JSON, Parquet, etc.
Forespørsel om datalaker med SQL
Felsøking
Sammendrag og konklusjon
Krav
- Erfaring med SQL-spørringer
- Programmeringserfaring i noe språk
Målgruppe
- Dataanalytikere
- Datavitenskapsfolk
- Dataingeniører
Referanser (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks