Thank you for sending your enquiry! One of our team member will contact you shortly.
Thank you for sending your booking! One of our team member will contact you shortly.
Kursplan
1.1Hadoop Konsepter
1.1.1HDFS
- Utformingen av HDFS kommandolinjegrensesnitt Hadoop Filsystem
1.1.2Klynger
- Anatomi av en klynge Mater Node / Slave node Navn Node / Data Node
1.2 Datamanipulering
1.2.1MapReduce detaljert
- Kartfase Reduser fase Shuffle
1.2.2Analytics med Map Reduce
- Group-By med MapReduce Frekvensdistribusjoner og sortering med MapReduce Plottresultater (GNU Plot) Histogrammer med MapReduce Scatterplott med MapReduce Parsing komplekse datasett Telle med MapReduce og Combiners Bygg rapporter
1.2.3 Datarensing
- Dokumentrengjøring Fuzzy strengsøk Postkobling / datadeduplisering Transform og sorter hendelsesdatoer Valider kildepålitelighet Trim Outliers
1.2.4 Trekke ut og transformere data
- Transformere logger Bruke Apache Pig til å filtrere Bruke Apache Pig til å sortere Bruke Apache Pig til å sesjon
1.2.5 Avanserte sammenføyninger
- Sammenføyning av data i Mapper ved hjelp av MapReduce Sammenføyning av data ved hjelp av Apache Pig replikert sammenføyning Sammenføyning av sorterte data ved hjelp av Apache Pig flette sammenføyning Koble sammen skjeve data ved hjelp av Apache Pig skjev sammenføyning Bruke en kartsidesammenføyning i Apache Hive Bruke optimaliserte fullstendige ytre sammenføyninger i Apache [1 ] Sammenføyning av data ved hjelp av et eksternt nøkkelverdilager
1.3 Ytelsesdiagnose og optimaliseringsteknikker
- Kart Undersøker topper i inngangsdata Identifiser skjevhetsproblemer med data på kartsiden Kartoppgavegjennomstrømning Små filer Filer som ikke kan deles opp
Krav
Deltakere er ikke pålagt å ha noen spesifikke ferdigheter da opplæringen er fokusert på ferdigheter for sluttbrukere for både administrasjon og manipulering av data under Apache Hadoop
21 timer
Testimonials (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Kurs - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Kurs - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay