Kursplan

Innledning

Oversikt over tilganger til data (Hive, databaser, etc.)

Oversikt over Spark-funksjoner og arkitektur

Installasjon og konfigurasjon av Spark

Forklaring av Dataframes i Spark

Definisjon av tabeller og importering av datasett

Utgjørelse av SQL-spørringer på Dataframes

Gjennomføring av aggregeringer, JOINs og nestede spørringer

Last opp og tilgang til data

Forespørsel om ulike typer data

  • JSON, Parquet, etc.

Forespørsel om datalaker med SQL

Felsøking

Sammendrag og konklusjon

Krav

  • Erfaring med SQL-spørringer
  • Programmeringserfaring i noe språk

Målgruppe

  • Dataanalytikere
  • Datavitenskapsfolk
  • Dataingeniører
 7 timer

Antall deltakere


Pris per deltaker

Referanser (5)

Kommende kurs

Relaterte kategorier