Kursplan
Innledning
Oversikt over tilganger til data (Hive, databaser, etc.)
Oversikt over Spark-funksjoner og arkitektur
Installasjon og konfigurasjon av Spark
Forklaring av Dataframes i Spark
Definisjon av tabeller og importering av datasett
Utgjørelse av SQL-spørringer på Dataframes
Gjennomføring av aggregeringer, JOINs og nestede spørringer
Last opp og tilgang til data
Forespørsel om ulike typer data
- JSON, Parquet, etc.
Forespørsel om datalaker med SQL
Felsøking
Sammendrag og konklusjon
Krav
- Erfaring med SQL-spørringer
- Programmeringserfaring i noe språk
Målgruppe
- Dataanalytikere
- Datavitenskapsfolk
- Dataingeniører
Referanser (3)
Jeg likte at det var praktisk. Elsket å anvende den teoretiske kunnskapen med praktiske eksempler.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
Maskinoversatt
Det er en fordel at vi kunne medføre mest av informasjonen/kursmaterialet/presentasjonene/øvingene med oss, slik at vi kan se gjennom dem og kanskje gjøre om det vi ikke forsto første gang eller forbedre det vi allerede har gjort.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
meget interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskinoversatt