Kursplan
Introduksjon til Apache Spark
- Rollen til Spark i stordatabehandling
- Gnistarkitektur og dens komponenter
Oppsett Apache Spark
- Krav til maskinvare og programvare
- Installasjonsprosedyrer for frittstående og klyngemoduser
- Beste praksis for konfigurasjon for systemadministratorer
Administrering av gnistklynger
- Klyngehåndteringsverktøy og teknikker
- Overvåking av Spark-applikasjoner og klyngeressurser
- Sikkerhetskonfigurasjoner og brukeradministrasjon
Ytelsesjustering og optimering
- Ressursfordeling og planlegging
- Tuning Spark for optimal ytelse
- Identifisere og løse vanlige flaskehalser
Feilsøking og problemløsning
- Vanlige Spark-administrasjonsutfordringer
- Diagnostiske verktøy og teknikker for feilsøking
- Trinn-for-trinn tilnærming til å løse vanlige problemer
- Beste praksis for å opprettholde et sunt Spark-miljø
Avanserte administrasjonsemner
- Integrasjon med andre store dataverktøy
- Sikre høy tilgjengelighet og katastrofegjenoppretting
- Oppgradering og skalering av Spark-klynger
Sammendrag og neste trinn
Krav
- Grunnleggende kunnskap om nettverkskonfigurasjon og -administrasjon
- Kjennskap til Linux operativsystem og kommandolinjegrensesnitt
- Interesse for å lære om distribuerte datasystemer og big data management
Publikum
- Systemadministratorer
Testimonials (5)
Mange praktiske eksempler, forskjellige måter å nærme seg det samme problemet på, og noen ganger ikke så åpenbare triks for å forbedre den nåværende løsningen
Rafał - Nordea
Kurs - Apache Spark MLlib
Machine Translated
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks