Kursplan

  1. Innføring i Scala

    • En rask innføring i Scala
    • Labs: Lære å kjenne Scala
  2. Spark grunnleggende

    • Bakgrunn og historie
    • Spark og Hadoop
    • Spark konsepter og arkitektur
    • Spark økosystem (core, spark sql, mlib, streaming)
    • Labs: Installere og kjøre Spark
  3. Første innblikk i Spark

    • Kjøre Spark i lokal modus
    • Spark web UI
    • Spark shell
    • Analysere datamengde – del 1
    • Inspektere RDDs
    • Labs: Udforske Spark shell
  4. RDDs

    • RDD konsepter
    • Partisjoner
    • RDD operasjoner / transformasjoner
    • RDD typer
    • Nøkkel-verdi par RDDs
    • MapReduce på RDD
    • Caching og persistering
    • Labs: Opprette & inspektere RDDs; Caching RDDs
  5. Spark API-programmering

    • Innføring i Spark API / RDD API
    • Sende første program til Spark
    • Feilsøking / logging
    • Konfigurasjonsegenskaper
    • Labs: Programmering i Spark API, Sende oppgaver
  6. Spark SQL

    • SQL-støtte i Spark
    • Dataframes
    • Definere tabeller og importere datamengder
    • Spørre dataframes ved hjelp av SQL
    • Lagring formater: JSON / Parquet
    • Labs: Opprette og spørre dataframes; Vurdere dataformater
  7. MLlib

    • Innføring i MLlib
    • MLlib-algoritmer
    • Labs: Skrive MLib-applikasjoner
  8. GraphX

    • Oversikt over GraphX-biblioteket
    • GraphX-APIer
    • Labs: Behandle grafdata med Spark
  9. Spark Streaming

    • Streaming-oversikt
    • Vurdere Streaming-plattformer
    • Streaming-operasjoner
    • Glidende vindusoperasjoner
    • Labs: Skrive Spark Streaming-applikasjoner
  10. Spark og Hadoop

    • Innføring i Hadoop (HDFS / YARN)
    • Hadoop + Spark-arkitektur
    • Kjøre Spark på Hadoop YARN
    • Behandle HDFS-filer med Spark
  11. Spark ytelse og justering

    • Broadcast-variabler
    • Accumulators
    • Minnehåndtering & caching
  12. Spark-operasjoner

    • Utplassere Spark i produksjon
    • Eksempel på utplasseringstemplater
    • Konfigurasjoner
    • Overvåking
    • Feilsøking

Krav

FORUTSETNINGER

Kjennskap med enten Java / Scala / Python språk (våre labber i Scala og Python)

grunnleggende forståelse av Linux-utviklingsmiljø (kommando-linje navigering / redigering av filer ved bruk av VI eller nano)

 21 timer

Antall deltakere


Pris per deltaker

Referanser (6)

Kommende kurs

Relaterte kategorier