Kursplan
Innledning
Oversikt over tilganger til data (Hive, databaser, etc.)
Oversikt over Spark-funksjoner og arkitektur
Installasjon og konfigurasjon av Spark
Forklaring av Dataframes i Spark
Definisjon av tabeller og importering av datasett
Utgjørelse av SQL-spørringer på Dataframes
Gjennomføring av aggregeringer, JOINs og nestede spørringer
Last opp og tilgang til data
Forespørsel om ulike typer data
- JSON, Parquet, etc.
Forespørsel om datalaker med SQL
Felsøking
Sammendrag og konklusjon
Krav
- Erfaring med SQL-spørringer
- Programmeringserfaring i noe språk
Målgruppe
- Dataanalytikere
- Datavitenskapsfolk
- Dataingeniører
Referanser (5)
De live-eksemplene
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
meget interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskinoversatt
Nokkel praktisk erfaring, instruktøren er kunnskapsrik
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskinoversatt
Få muligheten til å lære Spark Streaming, Databricks og AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskinoversatt
øvelseoppgaver
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskinoversatt