Kursplan
Introduksjon til Apache Spark
- Rollen til Spark i stordatabehandling
- Gnistarkitektur og dens komponenter
Oppsett Apache Spark
- Krav til maskinvare og programvare
- Installasjonsprosedyrer for frittstående og klyngemoduser
- Beste praksis for konfigurasjon for systemadministratorer
Administrering av gnistklynger
- Klyngehåndteringsverktøy og teknikker
- Overvåking av Spark-applikasjoner og klyngeressurser
- Sikkerhetskonfigurasjoner og brukeradministrasjon
Ytelsesjustering og optimering
- Ressursfordeling og planlegging
- Tuning Spark for optimal ytelse
- Identifisere og løse vanlige flaskehalser
Feilsøking og problemløsning
- Vanlige Spark-administrasjonsutfordringer
- Diagnostiske verktøy og teknikker for feilsøking
- Trinn-for-trinn tilnærming til å løse vanlige problemer
- Beste praksis for å opprettholde et sunt Spark-miljø
Avanserte administrasjonsemner
- Integrasjon med andre store dataverktøy
- Sikre høy tilgjengelighet og katastrofegjenoppretting
- Oppgradering og skalering av Spark-klynger
Sammendrag og neste trinn
Krav
- Grunnleggende kunnskap om nettverkskonfigurasjon og -administrasjon
- Kjennskap til Linux operativsystem og kommandolinjegrensesnitt
- Interesse for å lære om distribuerte datasystemer og big data management
Publikum
- Systemadministratorer
Testimonials (9)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Kurs - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Mange praktiske eksempler, forskjellige måter å nærme seg det samme problemet på, og noen ganger ikke så åpenbare triks for å forbedre den nåværende løsningen
Rafał - Nordea
Kurs - Apache Spark MLlib
Machine Translated
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Engasjement og vilje til å forklare sekundære emner.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Kurs - Apache Spark Fundamentals
Machine Translated
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Kurs - Apache Spark in the Cloud
Øvelser og utveksling under spørsmål/svar
Antoine - Physiobotic
Kurs - Scaling Data Pipelines with Spark NLP
Machine Translated