
Lokal instruktørledet live Hadoop kurs i Norge.
Apache Hadoop Underkategorier
Hadoop Kursplaner
Kursnavn
Varighet
Oversikt
Kursnavn
Varighet
Oversikt
21 timer
Python er et skalbart, fleksibelt og mye brukt programmeringsspråk for datavitenskap og maskinlæring. Spark er en databehandlingsmotor som brukes i spørre, analysere og transformere store data, mens Hadoop er et programvare bibliotek rammeverk for storskala data lagring og behandling.
Denne instruktørledede, live-trening (online eller on-site) er rettet mot utviklere som ønsker å bruke og integrere Spark, Hadoop, og Python for å behandle, analysere og transformere store og komplekse datasett.
Ved slutten av denne treningen vil deltakerne være i stand til å:
-
Sett opp det nødvendige miljøet for å begynne å behandle store data med Spark, Hadoop, og Python.
Forstå funksjonene, kjernekomponentene og arkitekturen til Spark og Hadoop.
Lær hvordan du integrerer Spark, Hadoop, og Python for Big Data Processing.
Utforsk verktøyene i Spark økosystemet (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, og Flume).
Bygg samarbeidende filtrering anbefalingssystemer som likner Netflix, YouTube, Amazon, Spotify, og Google.
Bruk Apache Mahout til å skala maskinlæring algoritmer.
-
Interaktiv forelesning og diskusjon.
Mange øvelser og praksis.
Hands-on implementering i et live-lab miljø.
-
For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
7 timer
This course covers how to use Hive SQL language (AKA: Hive HQL, SQL on Hive, HiveQL) for people who extract data from Hive
14 timer
Datameer is a business intelligence and analytics platform built on Hadoop. It allows end-users to access, explore and correlate large-scale, structured, semi-structured and unstructured data in an easy-to-use fashion.
In this instructor-led, live training, participants will learn how to use Datameer to overcome Hadoop's steep learning curve as they step through the setup and analysis of a series of big data sources.
By the end of this training, participants will be able to:
- Create, curate, and interactively explore an enterprise data lake
- Access business intelligence data warehouses, transactional databases and other analytic stores
- Use a spreadsheet user-interface to design end-to-end data processing pipelines
- Access pre-built functions to explore complex data relationships
- Use drag-and-drop wizards to visualize data and create dashboards
- Use tables, charts, graphs, and maps to analyze query results
- Data analysts
- Part lecture, part discussion, exercises and heavy hands-on practice
21 timer
The course is dedicated to IT specialists that are looking for a solution to store and process large data sets in distributed system environment
Course goal:
Getting knowledge regarding Hadoop cluster administration
35 timer
Publikum: Kurset er beregnet på IT-spesialister som leter etter en løsning for å lagre og behandle store datasett i et distribuert systemmiljø Go : Dyp kunnskap om Hadoop klyngestyring.
28 timer
Audience:
This course is intended to demystify big data/hadoop technology and to show it is not difficult to understand.
28 timer
Apache Hadoop is the most popular framework for processing Big Data on clusters of servers. This course will introduce a developer to various components (HDFS, MapReduce, Pig, Hive and HBase) Hadoop ecosystem.
21 timer
Apache Hadoop er et av de mest populære rammene for behandling av Big Data på klynger av servere. Dette kurset går inn på datahåndtering i HDFS, advanced Pig, Hive og HBase. Disse avanserte programmeringsteknikkene vil være fordelaktige for erfarne Hadoop utviklere. Publikum : utviklere Varighet: tre dager Format: forelesninger (50%) og praktiske laboratorier (50%).
21 timer
This course introduces HBase – a NoSQL store on top of Hadoop. The course is intended for developers who will be using HBase to develop applications, and administrators who will manage HBase clusters.
We will walk a developer through HBase architecture and data modelling and application development on HBase. It will also discuss using MapReduce with HBase, and some administration topics, related to performance optimization. The course is very hands-on with lots of lab exercises.
Duration : 3 days Audience : Developers & Administrators
Duration : 3 days Audience : Developers & Administrators
21 timer
Apache Hadoop er den mest populære rammen for behandling av Big Data på klynger av servere. I dette tre (eventuelt fire dager) kurset vil deltakerne lære om forretningsfordelene og bruke saker for Hadoop og dets økosystem, hvordan planlegge klyngedistribusjon og vekst, hvordan installere, vedlikeholde, overvåke, feilsøke og optimalisere Hadoop . De vil også øve på datalast av klynge, bli kjent med forskjellige Hadoop distribusjoner og øve på å installere og administrere Hadoop økosystemverktøy. Kurset avsluttes med diskusjon om å sikre klynge med Kerberos. “… Materialene var veldig godt forberedt og dekket grundig. Laben var veldig hjelpsom og godt organisert ”
- Andrew Nguyen, hovedintegrasjons DW Engineer, Microsoft Online Advertising Publikum Hadoop administratorer Format Forelesninger og praktiske laboratorier, omtrentlig balanse 60% forelesninger, 40% laboratorier.
- Andrew Nguyen, hovedintegrasjons DW Engineer, Microsoft Online Advertising Publikum Hadoop administratorer Format Forelesninger og praktiske laboratorier, omtrentlig balanse 60% forelesninger, 40% laboratorier.
21 timer
Apache Hadoop is the most popular framework for processing Big Data. Hadoop provides rich and deep analytics capability, and it is making in-roads in to tradional BI analytics world. This course will introduce an analyst to the core components of Hadoop eco system and its analytics
Audience
Business Analysts
Duration
three days
Format
Lectures and hands on labs.
21 timer
Hadoop is the most popular Big Data processing framework.
14 timer
Audience
- Developers
- Lectures, hands-on practice, small tests along the way to gauge understanding
21 timer
Dette kurset er ment for utviklere, arkitekter, dataforskere eller enhver profil som krever tilgang til data enten intensivt eller regelmessig. Kursets hovedfokus er datamanipulering og transformasjon. Blant verktøyene i Hadoop økosystemet inkluderer dette kurset bruk av Pig and Hive begge brukes sterkt for datatransformasjon og -manipulering. Denne opplæringen tar også opp resultatmålinger og ytelsesoptimalisering. Kurset er helt på hånden og blir punktuert av presentasjoner av de teoretiske aspektene.
14 timer
In this instructor-led training in Norge, participants will learn the core components of the Hadoop ecosystem and how these technologies can be used to solve large-scale problems. By learning these foundations, participants will improve their ability to communicate with the developers and implementers of these systems as well as the data scientists and analysts that many IT projects involve.
Audience
- Project Managers wishing to implement Hadoop into their existing development or IT infrastructure
- Project Managers needing to communicate with cross-functional teams that include big data engineers, data scientists and business analysts
14 timer
Apache Samza er en åpen kildekode nær-sanntid, asynkron beregningsramme for strømbehandling. Den bruker Apache Kafka for meldinger, og Apache Hadoop YARN for feiltoleranse, prosessorisolering, sikkerhet og ressursstyring. Denne instruktørledede, liveopplæringen introduserer prinsippene bak meldingssystemer og distribuert strømbehandling, mens de går deltakerne gjennom opprettelsen av et eksempel på Samza-basert prosjekt og jobbutførelse. Ved slutten av denne opplæringen vil deltakerne kunne:
- Bruk Samza for å forenkle koden som er nødvendig for å produsere og konsumere meldinger.
- Kobler fra behandlingen av meldinger fra et program.
- Bruk Samza til å implementere asynkron beregning nær sanntid.
- Bruk strømbehandling for å gi et høyere abstraksjonsnivå over meldingssystemer.
- Utviklere
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
7 timer
Alluxio er et open-source virtuelt distribuert lagringssystem som forener ulike lagringssystemer og gjør det mulig for applikasjoner å samhandle med data ved minnehastighet. Den brukes av selskaper som Intel, Baidu og Alibaba.
I denne instruktørledede, live-trening, vil deltakerne lære å bruke Alluxio til å bringe forskjellige beregningsrammer med lagringssystemer og effektivt administrere multi-petabyte skala data som de går gjennom skapelsen av en applikasjon med Alluxio.
Ved slutten av denne treningen vil deltakerne være i stand til å:
-
Utvikle en søknad med Alluxio
Koble til store datasystemer og applikasjoner samtidig som du beholder et namespace
Effektivt ekstraherer verdi fra store data i ethvert lagringsformat
Bedre arbeidsbelastningseffektivitet
Oppsett og administrere Alluxio uavhengig eller klusteret
-
Data forskere
Utvikler
Systemadministrator
-
Delvis forelesning, delvis diskusjon, øvelser og tung praksis
14 timer
Tigon is an open-source, real-time, low-latency, high-throughput, native YARN, stream processing framework that sits on top of HDFS and HBase for persistence. Tigon applications address use cases such as network intrusion detection and analytics, social media market analysis, location analytics, and real-time recommendations to users.
This instructor-led, live training introduces Tigon's approach to blending real-time and batch processing as it walks participants through the creation a sample application.
By the end of this training, participants will be able to:
- Create powerful, stream processing applications for handling large volumes of data
- Process stream sources such as Twitter and Webserver Logs
- Use Tigon for rapid joining, filtering, and aggregating of streams
- Developers
- Part lecture, part discussion, exercises and heavy hands-on practice
21 timer
Apache NiFi (Hortonworks DataFlow) er en integrert Apache NiFi og enkel hendelsesbehandlingsplattform i sanntid som muliggjør flytting, sporing og automatisering av data mellom systemer. Det er skrevet med flytbasert programmering og gir et nettbasert brukergrensesnitt for å administrere dataflow i sanntid. I denne instruktørledede Apache NiFi (på stedet eller fjernkontrollen) vil deltakerne lære å distribuere og administrere Apache NiFi i et levende laboratoriemiljø. Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Apachi NiFi.
- Kildes, transformer og administrer data fra forskjellige, distribuerte datakilder, inkludert databaser og big data innsjøer.
- Automatiser dataflow.
- Aktiver streaminganalyse.
- Bruk forskjellige fremgangsmåter for inntak av data.
- Transformer Big Data og til forretningsinnsikt.
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
7 timer
Apache NiFi (Hortonworks DataFlow) er en integrert Apache NiFi og enkel hendelsesbehandlingsplattform i sanntid som muliggjør flytting, sporing og automatisering av data mellom systemer. Det er skrevet med flytbasert programmering og gir et nettbasert brukergrensesnitt for å administrere dataflow i sanntid. I denne instruktørledede Apache NiFi vil deltakerne lære grunnleggende grunnlag av Apache NiFi programmering når de utvikler en rekke demo-utvidelser, komponenter og prosessorer som bruker Apache NiFi . Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå NiFis arkitektur og dataflowkonsepter.
- Utvikle utvidelser ved å bruke NiFi og tredjeparts APIer.
- Custom utvikle sin egen Apache Nifi-prosessor.
- Sette inn og behandle sanntidsdata fra forskjellige og uvanlige filformater og datakilder.
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
28 timer
Hadoop er en populær Big Data behandlingsramme. Python er et høyt nivå programmeringsspråk kjent for sin klare syntax og kodelesbarhet.
I denne instruktørledede, live-trening, vil deltakerne lære å jobbe med Hadoop, MapReduce, Pig, og Spark ved hjelp av Python som de går gjennom flere eksempler og bruker tilfeller.
Ved slutten av denne treningen vil deltakerne være i stand til å:
-
Forstå de grunnleggende konseptene bak Hadoop, MapReduce, Pig, og Spark
Bruk Python med Hadoop Distributed File System (HDFS), MapReduce, Pig, og Spark
Bruk Snakebite for å programmatisk få tilgang til HDFS innenfor Python
Bruk mrjob til å skrive MapReduce jobber i Python
Skriv Spark-programmer med Python
Utvid funksjonaliteten til gris ved hjelp av Python UDFs
Forvaltning av MapReduce jobber og Pig scripts ved hjelp av Luigi
-
Utviklere
IT fagfolk
-
Delvis forelesning, delvis diskusjon, øvelser og tung praksis
14 timer
Sqoop is an open source software tool for transfering data between Hadoop and relational databases or mainframes. It can be used to import data from a relational database management system (RDBMS) such as MySQL or Oracle or a mainframe into the Hadoop Distributed File System (HDFS). Thereafter, the data can be transformed in Hadoop MapReduce, and then re-exported back into an RDBMS.
In this instructor-led, live training, participants will learn how to use Sqoop to import data from a traditional relational database to Hadoop storage such HDFS or Hive and vice versa.
By the end of this training, participants will be able to:
- Install and configure Sqoop
- Import data from MySQL to HDFS and Hive
- Import data from HDFS and Hive to MySQL
- System administrators
- Data engineers
- Part lecture, part discussion, exercises and heavy hands-on practice
- To request a customized training for this course, please contact us to arrange.
21 timer
Big data analytics innebærer prosessen med å undersøke store mengder varierte datasett for å avdekke korrelasjoner, skjulte mønstre og annen nyttig innsikt. Helseindustrien har enorme mengder komplekse heterogene medisinske og kliniske data. Å bruke big data-analyse av helsedata gir et stort potensial i å oppnå innsikt for å forbedre leveransen av helsetjenester. Imidlertid gir enorme datasett store utfordringer i analyser og praktiske applikasjoner i et klinisk miljø. I denne instruktørledede liveopplæringen (ekstern) vil deltakerne lære å utføre big data-analyse innen helse når de går gjennom en serie praktiske live-lab-øvelser. Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer verktøy for analyse av big data som Hadoop MapReduce og Spark
- Forstå egenskapene til medisinsk data
- Bruk big data-teknikker for å håndtere medisinske data
- Studer store datasystemer og algoritmer i sammenheng med helseprogrammer
- Utviklere
- Dataforskere
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse.
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
35 timer
Apache Hadoop er et populært databehandlingsramme for å behandle store datasett over mange datamaskiner.
Denne instruktørledede, live-trening (online eller on-site) er rettet mot systemadministratorer som ønsker å lære hvordan å sette opp, implementere og administrere Hadoop kluster innenfor organisasjonen sin.
Ved slutten av denne treningen vil deltakerne være i stand til å:
-
Installere og konfigurere Apache Hadoop.
Forstå de fire hovedkomponentene i Hadoop økosystemet: HDFS, MapReduce, YARN og Hadoop Common.
Bruk Hadoop Distributed File System (HDFS) for å skala en kluster til hundrevis eller tusenvis av noder.
Installer HDFS for å fungere som lagringsmotor for on-premise Spark deployments.
Sett opp Spark for å få tilgang til alternative lagringsløsninger som Amazon S3 og NoSQL databasesystemer som Redis, Elasticsearch, Couchbase, Aerospike, etc.
Utføre administrative oppgaver som å gi, administrere, overvåke og sikre en Apache Hadoop kluster.
-
Interaktiv forelesning og diskusjon.
Mange øvelser og praksis.
Hands-on implementering i et live-lab miljø.
-
For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
21 timer
Cloudera Impala er en åpen kildekode massivt parallel processing (MPP) SQL søkemotor for Apache Hadoop-klynger.Impala gjør det mulig for brukere å sende spørringer med lav latens SQL til data som er lagret i Hadoop Distributed File System og Apache Hbase uten å kreve dataflytting eller transformasjon.PublikumDette kurset er rettet mot analytikere og dataforskere som utfører analyser på data lagret i Hadoop via Business Intelligence eller SQL-verktøy.Etter dette kurset vil delegatene kunne
- Trekk ut meningsfull informasjon fra Hadoop-klynger med Impala. Skriv spesifikke programmer for å legge til rette for Business Intelligence i Impala SQL Dialect. Feilsøk Impala.
21 timer
Apache Ambari er en åpen kildekode-administrasjonsplattform for levering, administrasjon, overvåking og sikring av Apache Hadoop klynger. I denne instruktørledede liveopplæringen vil deltakerne lære styringsverktøyene og praksisene som gis av Ambari for å lykkes med å administrere Hadoop klynger. Ved slutten av denne opplæringen vil deltakerne kunne:
- Sett opp en live Big Data klynge ved bruk av Ambari
- Bruk Ambaris avanserte funksjoner og funksjoner på forskjellige brukssaker
- Legg sømløst til og fjern noder etter behov
- Forbedre ytelsen til en Hadoop klynge gjennom tuning og finjustering
- DevOps
- Systemadministratorer
- DBA
- Hadoop tester
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
21 timer
Hortonworks Data Platform (HDP) er en åpen kildekode-støtteplattform for Apache Hadoop som gir et stabilt grunnlag for å utvikle big data-løsninger på Apache Hadoop økosystemet. Denne instruktørledede, live trening (på stedet eller ekstern) introduserer Hortonworks Data Platform (HDP) og leder deltakerne gjennom distribusjonen av Spark + Hadoop løsningen. Ved slutten av denne opplæringen vil deltakerne kunne:
- Bruk Hortonworks for å pålitelig kjøre Hadoop i stor skala.
- Forene Hadoop sikkerhets-, styrings- og operasjonsevner med Sparks agile analytiske arbeidsflyter.
- Bruk Hortonworks til å undersøke, validere, sertifisere og støtte hver av komponentene i et Spark-prosjekt.
- Behandle forskjellige typer data, inkludert strukturert, ustrukturert, i bevegelse og hvile.
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
Last Updated:
Rådgivning
Helg Apache Hadoop kurs, kveld Hadoop trening, Apache Hadoop boot camp, Hadoop instruktørledet, Helg Hadoop trening, Kveld Apache Hadoop kurs, Hadoop coaching, Hadoop instruktør, Hadoop trener, Hadoop kurs, Apache Hadoop klasser, Apache Hadoop on-site, Apache Hadoop private kurs, Hadoop tomannshånd trening