Kursplan
Introduksjon
- Introduksjon til Cloud Computing og Big Data-løsninger Oversikt over Apache Hadoop Funksjoner og arkitektur
Oppsett Hadoop
- Planlegging av en Hadoop-klynge (on-premise, sky, etc.) Velge OS og Hadoop-distribusjon Tilretteleggingsressurser (maskinvare, nettverk, etc.) Laste ned og installere programvaren Dimensjonere klyngen for fleksibilitet
Jobber med HDFS
- Forstå Hadoop Distribuert filsystem (HDFS) Oversikt over HDFS Command Reference Få tilgang til HDFS Utføre grunnleggende filoperasjoner på HDFS Bruke S3 som et komplement til HDFS
Oversikt over MapReduce
- Forstå dataflyt i MapReduce Framework Map, Shuffle, Sort and Reduce Demo: Computing Top Salaries
Arbeid med GARN
- Forstå ressursadministrasjon i Hadoop Arbeide med ResourceManager, NodeManager, Application Master Planleggingsjobber under YARN-planlegging for et stort antall noder og klynger Demo: Jobbplanlegging
Integrering Hadoop med Spark
- Sette opp lagring for Spark (HDFS, Amazon, S3, NoSQL, etc.) Forstå Resilient Distributed Dataset (RDDs) Opprette en RDD Implementere RDD Transformations Demo: Implementere et tekstsøkeprogram for filmtitler
Administrere en Hadoop klynge
- Overvåking Hadoop Sikre en Hadoop-klynge Legge til og fjerne noder Kjøre en ytelsesstandard Justere en Hadoop-klynge for å optimalisere ytelsen Sikkerhetskopiering, gjenoppretting og forretningskontinuitetsplanlegging Sikre høy tilgjengelighet (HA)
Oppgradere og migrere en Hadoop klynge
- Vurdere krav til arbeidsbelastning Oppgradering Hadoop Flytte fra lokalt til sky og omvendt Gjenoppretting etter feil
Feilsøking
Oppsummering og konklusjon
Krav
- Erfaring med systemadministrasjon
- Erfaring med Linux kommandolinje
- En forståelse av big data-konsepter
Publikum
- Systemadministratorer
- DBAer
Testimonials (7)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
Mange praktiske eksempler, forskjellige måter å nærme seg det samme problemet på, og noen ganger ikke så åpenbare triks for å forbedre den nåværende løsningen
Rafał - Nordea
Kurs - Apache Spark MLlib
Machine Translated
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Kurs - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Kurs - Data Analysis with Hive/HiveQL
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Having hands on session / assignments