Hjem
Big Data Treningskurs
Hadoop Treningskurs
Administratoropplæring for Apache Hadoop Treningskurs

Administratoropplæring for Apache Hadoop Treningskurs

Målgruppe:

Kurset er ment for IT-spesialister som ser etter en løsning for å lagre og behandle store datasett i en distribusjonssystemmiljø.

Goal:

Dypt kunnskap om Hadoop klusteradministrasjon.

Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.

Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.

Kursplan

1: HDFS (17%)

Beskriv funksjonen til HDFS Daemons
Beskriv normal drift av et Apache Hadoop-kluster, både for datalagring og databehandling.
Identifiser nåværende egenskaper ved beregningsystemer som motiverer et system som Apache Hadoop.
Klassifiser hovedmålene for HDFS-design
For en gitt scenarie, identifiser passende bruksscenarie for HDFS Federation
Identifiser komponentene og demonen i et HDFS HA-Quorum-kluster
Analysere rollen til HDFS-sikkerhet (Kerberos)
Bestem den beste datasekvensvalget for en gitt scenarie
Beskriv fillesings- og skriveveier
Identifiser kommandoene for å manipulere filer i Hadoop File System Shell

2: YARN og MapReduce versjon 2 (MRv2) (17%)

Forstå hvordan oppgradering av et kluster fra Hadoop 1 til Hadoop 2 påvirker klusterinnstillinger
Forstå hvordan du deployer MapReduce v2 (MRv2 / YARN), inkludert alle YARN-demoner
Forstå grunnleggende designstrategi for MapReduce v2 (MRv2)
Bestem hvordan YARN håndterer ressursallokeringer
Identifiser arbeidsflyten for en MapReduce-job som kjører på YARN
Bestem hvilke filer du må endre og hvordan du skal migre et kluster fra MapReduce versjon 1 (MRv1) til MapReduce versjon 2 (MRv2) som kjører på YARN.

3: Hadoop Klusterplanlegging (16%)

Hovedpunkter å vurdere når du velger maskinvare og operativsystemer for å hoste et Apache Hadoop-kluster.
Analysere valgene ved å velge et operativsystem
Forstå kjernejustering og diskswapping
For en gitt scenarie og arbeidslastmønster, identifiser en maskinvarekonfigurasjon som er egnet for scenarien
For en gitt scenarie, bestem hvilke økosystemkomponenter klusteret ditt trenger for å oppfylle SLA
Klusterstørrelse: for en gitt scenarie og hyppighet av utføring, identifiser spesifika for arbeidslasten, inkludert CPU, minne, lagring, diski/O
Diskstørrelse og -konfigurasjon, inkludert JBOD versus RAID, SANs, virtualisering og diskstørrelseskrav i et kluster
Nettverkstopologier: forstå nettverksbruk i Hadoop (for både HDFS og MapReduce) og foreslå eller identifiser viktige nettverksdesignkomponenter for en gitt scenarie

4: Hadoop Klusterinstallasjon og administrasjon (25%)

For en gitt scenarie, identifiser hvordan klusteret vil håndtere disker og maskinfelle
Analysere en loggkonfigurasjon og loggkonfigurasjonsfilformat
Forstå grunnleggende prinsipper for Hadoop-målinger og klusterhelsemonitorering
Identifiser funksjonen og formålet med tilgjengelige verktøy for klusterovervåking
Være i stand til å installere alle økosystemkomponentene i CDH 5, inkludert (men ikke begrenset til): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive, og Pig
Identifiser funksjonen og formålet med tilgjengelige verktøy for å administrere Apache Hadoop-filsystemet

5: Ressurs Management (10%)

Forstå de overordnede designmålene for hver av Hadoop-planleggerne
For en gitt scenarie, bestem hvordan FIFO-planleggeren allokerer klusterressurser
For en gitt scenarie, bestem hvordan Fair-planleggeren allokerer klusterressurser under YARN
For en gitt scenarie, bestem hvordan Capacity-planleggeren allokerer klusterressurser

6: Overvåking og loggføring (15%)

Forstå funksjonene og egenskapene til Hadoop's målingsinnsamlingsevner
Analysere NameNode- og JobTracker-webbrukergrensesnitt
Forstå hvordan du overvåker klusterdemoner
Identifiser og overvåke CPU-bruk på mesternoder
Beskriv hvordan du overvåker swap og minneallokering på alle noder
Identifiser hvordan du viser og administrerer Hadoop’s loggfiler
Tolke en loggfil

Krav

Grunnleggende administrasjonsevner Linux
Grunnleggende programmeringsevner

35 Timer

Antall deltakere

(Online)

Klasserom

Velg sted

Vennligst velg et sted

Pris per deltaker

Åpne kurs krever 5+ deltakere.

Administratoropplæring for Apache Hadoop Treningskurs - Bestilling

Fullt navn *

E-post *

Telefon *

Stillingstittel

Bedriftsnavn

Adresse 1 *

By *

Fylke / Provinse

Land *

Postnummer *

Startdato

Merverdiavgiftsnr

Datoer er underlagt tilgjengelighet og finner sted mellom 09:30 og 16:30.

Betaling *

Bankoverføring (Faktura, PO)

Debit / Kreditkort

Kommentarer

Vilkår og Betingelser *

Jeg er en autorisert representant for kunden ovenfor og ønsker å bestille de ovennevnte kursene eller tjenestene i henhold til NobleProgs vilkår og betingelser og personvernerklæring.

Informér meg om rabatter og markedsføring

Vennligst les vår Personvernerklæring for å se hvordan vi bruker dine data.

Administratoropplæring for Apache Hadoop Treningskurs - Forespørsel

Fullt navn *

E-post *

Telefon *

Antall deltakere

Bedriftsnavn

Bedriftsadresse

Hvordan vil du ta kurset?

Kundebygninger

Nettbasert

Klasserom

Kommentarer

Informér meg om rabatter og markedsføring

Vennligst les vår Personvernerklæring for å se hvordan vi bruker dine data.

Administratoropplæring for Apache Hadoop - Konsulentforespørsel

Fullt navn *

Telefon *

E-post *

Bedriftsnavn

Konsulentemne *

Konsulentmål

Hvem vil konsulenten jobbe med?

Konsulentnødvendighet *

Kommentarer

Informér meg om rabatter og markedsføring

Vennligst les vår Personvernerklæring for å se hvordan vi bruker dine data.

Referanser (3)

7500 EUR (Nettbasert)

8500 EUR (Klasserom)

Relaterte kurs

Avansert R

14 Timer

Denne instruktørledede live-opplæringen i Norge (online eller på stedet) er rettet mot mellomnivå-brukere av avansert R som ønsker å bruke R til å bygge raskere arbeidsflyter, forbedre kodekvaliteten og håndtere mer komplekse analysoppgaver.

Etter denne opplæringen vil deltakerne kunne: lage gjenbrukbare funksjoner, forbedre dataarbeidsflyter, feilsøke og optimere kode, samt lage reproducerbare rapporter.

Les mer...

Algoritmisk handel med Python og R

14 Timer

Denne instruktørledede, live-kurs i Norge (online eller på stedet) er rettet mot virksomhetsanalytikere som ønsker å automatisere handel med algoritmisk handel, Python og R.

Ved slutten av dette kurset vil deltakerne kunne:

Bruke algoritmer for å kjøpe og selge verdipapirer raskt på spesialiserte intervaller.
Redusere kostnadene forbundet med handel ved hjelp av algoritmisk handel.
Automatiske overvåking av aksjekurser og plassering av ordre.

Les mer...

Programming med Big Data i R

21 Timer

Big Data er en betegnelse som refererer til løsninger som er beregnet på å lagre og behandle store datamengder. Utviklet av Google i utgangspunktet, har disse Big Data-løsningene utviklet seg og inspirert andre lignende prosjekter, mange av disse tilgjengelig som open source. R er et populært programmeringsspråk innen finansbransjen.

Les mer...

Introductory R (Basic to Intermediate)

14 Timer

Dette instruktørførte, live-kurset i Norge (online eller plassert) er rettet mot begynnernivå dataanalytikere som ønsker å bruke R-programmering til å manipulere data, utføre grunnleggende dataanalyse og lage overbevisende visualiseringer for innsikt.

Avslutningen på dette kurset vil deltakerne kunne:

Føre grunnleggende R-programmering.
Anvende grunnleggende data science-prosesser.
Lage visuelle representasjoner av data.

Les mer...

R Grunnleggende

21 Timer

R er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har også funnet tilhengere blant statistikere, ingeniører og forskere uten dataprogrammeringsevner som synes det er enkelt å bruke. Dens popularitet skyldes den økende bruken av data mining for forskjellige mål, for eksempel angitte annonsepriser, finne nye medisiner raskere eller finjustere økonomiske modeller. R har et bredt utvalg av pakker for data mining.

Les mer...

Klusteranalyse med R og SAS

14 Timer

Denne veiledede, live-opplæringen i Norge (online eller på stedet) er rettet mot dataanalytikere som ønsker å programmere med R i SAS for klusteranalyse.

Til slutt av denne opplæringen vil deltakerne kunne:

Bruke klusteranalyse til datagrunnlagt prosjektering
Mestre R-syntaks for klustering-løsninger.
Implementere hierarkisk og ikke-hierarkisk klustering.
Ta dataforvaltning baserte beslutninger for å hjelpe til med forbedring av virksomhetsdrift.

Les mer...

Data og analyse - fra bunnen av

42 Timer

Dataanalyse er et kritisk verktøy i business i dag. Vi vil fokusere på å utvikle praktiske, håndgripelige ferdigheter for dataanalyse. Målet er å hjelpe deltakerne til å gi bevisbaserte svar på spørsmål:

Hvad har skjedd?

bearbeiding og analyse av data
opprettelse av informative datavisualiseringer

Hvad vil skje?

forutsigelse av fremtidige resultater
vurdering av forutsigelser

Hvad bør skje?

omdanning av data til bevisbaserte businessbeslutninger
optimalisering av prosesser

Les mer...

Data Analysis with Python, R, Power Query, and Power BI

21 Timer

Denne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot fagfolk på nybegynnernivå som ønsker å rense og analysere data, lage statistiske anslag og lage innsiktsfulle visualiseringer ved hjelp av disse verktøyene.

Ved slutten av denne opplæringen vil deltakerne kunne:

Forstå det grunnleggende om Python, R, Power Query og Power BI for dataanalyse.
Rengjør og organiser datasett ved hjelp av Python og Power Query.
Utfør statistiske analyser og anslag med R.
Lag profesjonelle dashbord og rapporter med Power BI.
Integrer og analyser data fra flere kilder effektivt.

Les mer...

Dataanalyse med R

21 Timer

R er en populær, open source-miljø for statistisk beregning, dataanalyse og grafikk. Denne kursen gir en innføring i R-programmeringsspråket til studenter. Det dekker språkfundamentet, biblioteker og avanserte konsepter. Avansert dataanalyse og visualisering med sanntidsdata.

Målgruppe

Utviklere / dataanalytikere

Varighet

3 dager

Format

Forelesninger og praksisoppgaver

Les mer...

Ekonometri: Eviews og Risk Simulator

21 Timer

Dette instruktørførte, live-utdanningskurs i Norge (online eller på stedet) er rettet mot enhver som ønsker å lære og mestre grunnleggende prinsipper for ekonometrisk analyse og modellering.

Ved slutten av dette kurset, vil deltakerne kunne:

Lære og forstå grunnleggende ekonometri.
Bruke Eviews og risikosimulatorer.

Les mer...

Prognoser med R

14 Timer

Denne instruktørledede, live-trening (online eller på stedet) er rettet mot mellomnivå dataanalytikere og næringslivsprofesjoner som ønsker å utføre tidsrekkeprognoser og automatisere dataanalyseprosesser ved hjelp av R.

Ved slutten av denne treningen vil deltakerne være i stand til å:

Forstå grunnleggende prinsipper for prognoseteknikker i R.
Bruke eksponentiell glatting og ARIMA-modeller for tidsrekkeanalyse.
Bruke 'forecast' pakken for å generere nøyaktige prognosemodeller.
Automatisere prognoseprosesser for næringsliv og forskningsapplikasjoner.

Les mer...

HR Analytics for offentlige organisasjoner

14 Timer

Denne instruktørledede, live trening (online eller på stedet) er rettet mot HR-profesjonelle som ønsker å bruke analytiske metoder for å forbedre organisasjonens ytelse. Kurset dekker både kvalitative og kvantitative, empiriske og statistiske tilnærminger.

Kursformat

Interaktiv forelesning og diskusjon.
Mange øvelser og praktiske oppgaver.

Tilpasningsmuligheter for kurset

For å be om en tilpasset trening for dette kurset, vennligst kontakt oss for å ordne dette.

Les mer...

Markedsprognoser

14 Timer

Publikum

Dette kurset er laget for analytikere, prognosemakere som ønsker å introdusere eller forbedre prognoser som kan relateres til salgsprognoser, økonomiske prognoser, teknologiprognoser, forsyningskjedestyring og etterspørsels- eller forsyningsprognoser.

Beskrivelse

Dette kurset guider delegatene gjennom en rekke metoder, rammeverk og algoritmer som er nyttige når de skal velge hvordan de skal forutsi fremtiden basert på historiske data.

Den bruker standardverktøy som Microsoft Excel eller noen åpen kildekode-programmer (spesielt R-prosjektet).

Prinsippene som dekkes i dette kurset kan implementeres av hvilken som helst programvare (f.eks. SAS, SPSS, Statistica, MINITAB ...)

Les mer...

Statistisk analyse med SPSS

21 Timer

Denne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot fagfolk på nybegynnernivå til middels nivå som ønsker å utføre statistisk analyse ved hjelp av SPSS for å tolke data nøyaktig, kjøre komplekse statistiske tester og generere meningsfull innsikt.

Ved slutten av denne opplæringen vil deltakerne kunne:

Naviger i SPSS-grensesnittet og administrer datasett effektivt.
Utføre beskrivende og konklusjonelle statistiske analyser.
Gjennomføre t-tester, ANOVA, MANOVA, regresjon og korrelasjonsanalyser.
Bruk ikke-parametriske tester, hovedkomponentanalyse og faktoranalyse for avansert datatolkning.

Les mer...

Introduksjon til datavisualisering med Tidyverse og R

7 Timer

Målgruppe

Kursformat

Ved slutten av denne opplæringen vil deltakerne være i stand til:

I denne instruktørledede, live opplæringen vil deltakerne lære å manipulere og visualisere data ved hjelp av verktøyene som er inkludert i Tidyverse.

Tidyverse er en samling av fleksible R-pakker for rengjøring, bearbeiding, modellering og visualisering av data. Noen av pakkene som er inkludert er: ggplot2, dplyr, tidyr, readr, purrr og tibble.

Nybegynnere i R-språket
Nybegynnere i dataanalyse og datavisualisering

Del forelesning, del diskusjon, øvelser og mye praktisk trening

Utføre dataanalyse og opprette tiltrekkende visualiseringer
Trekke nyttige konklusjoner fra forskjellige datasett med eksempeldata
Filtrere, sortere og summere data for å svare på utforskende spørsmål
Omforme bearbeidet data til informativ linjediagrammer, søylediagrammer, histogramm
Importere og filtrere data fra forskjellige datasøk, inkludert Excel, CSV- og SPSS-filer

Les mer...

Administratoropplæring for Apache Hadoop Treningskurs

Målgruppe:

Goal:

Kursplan

1: HDFS (17%)

2: YARN og MapReduce versjon 2 (MRv2) (17%)

3: Hadoop Klusterplanlegging (16%)

4: Hadoop Klusterinstallasjon og administrasjon (25%)

5: Ressurs Management (10%)

6: Overvåking og loggføring (15%)

Krav

Referanser (3)

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Kommende kurs

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Relaterte kategorier

Denne siden i andre land/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Administratoropplæring for Apache Hadoop Treningskurs

Målgruppe:

Goal:

Kursplan

1: HDFS (17%)

2: YARN og MapReduce versjon 2 (MRv2) (17%)

3: Hadoop Klusterplanlegging (16%)

4: Hadoop Klusterinstallasjon og administrasjon (25%)

5: Ressurs Management (10%)

6: Overvåking og loggføring (15%)

Krav

Referanser (3)

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Kommende kurs

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Administratoropplæring for Apache Hadoop

Relaterte kurs

Avansert R

Algoritmisk handel med Python og R

Programming med Big Data i R

Introductory R (Basic to Intermediate)

R Grunnleggende

Klusteranalyse med R og SAS

Data og analyse - fra bunnen av

Hvad har skjedd?

Hvad vil skje?

Hvad bør skje?

Data Analysis with Python, R, Power Query, and Power BI

Dataanalyse med R

Målgruppe

Varighet

Format

Ekonometri: Eviews og Risk Simulator

Prognoser med R

HR Analytics for offentlige organisasjoner

Markedsprognoser

Publikum

Beskrivelse

Statistisk analyse med SPSS

Introduksjon til datavisualisering med Tidyverse og R

Relaterte kategorier

Hadoop

Statistics

Denne siden i andre land/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites