Apache Spark Opplæringskurs

Apache Spark Opplæringskurs

Local, instructorled live Apache Spark training courses demonstrate through handson practice how Spark fits into the Big Data ecosystem, and how to use Spark for data analysis

Apache Spark training is available as "onsite live training" or "remote live training" Onsite live training can be carried out locally on customer premises in Norge or in NobleProg corporate training centers in Norge Remote live training is carried out by way of an interactive, remote desktop

NobleProg Your Local Training Provider.

Machine Translated

Testimonials

★★★★★
★★★★★

Spark Underkategorier

Apache Spark Kursplaner

Kursnavn
Varighet
Oversikt
Kursnavn
Varighet
Oversikt
21 timer
Python er et skalbart, fleksibelt og mye brukt programmeringsspråk for datavitenskap og maskinlæring. Spark er en databehandlingsmotor som brukes i spørre, analysere og transformere store data, mens Hadoop er et programvare bibliotek rammeverk for storskala data lagring og behandling. Denne instruktørledede, live-trening (online eller on-site) er rettet mot utviklere som ønsker å bruke og integrere Spark, Hadoop, og Python for å behandle, analysere og transformere store og komplekse datasett. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Sett opp det nødvendige miljøet for å begynne å behandle store data med Spark, Hadoop, og Python. Forstå funksjonene, kjernekomponentene og arkitekturen til Spark og Hadoop. Lær hvordan du integrerer Spark, Hadoop, og Python for Big Data Processing. Utforsk verktøyene i Spark økosystemet (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, og Flume). Bygg samarbeidende filtrering anbefalingssystemer som likner Netflix, YouTube, Amazon, Spotify, og Google. Bruk Apache Mahout til å skala maskinlæring algoritmer.
Format av kurset
    Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
    For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
21 timer
In this instructor-led, live training in Norge, participants will learn how to use Python and Spark together to analyze big data as they work on hands-on exercises. By the end of this training, participants will be able to:
  • Learn how to use Spark with Python to analyze Big Data.
  • Work on exercises that mimic real world cases.
  • Use different tools and techniques for big data analysis using PySpark.
21 timer
OBJEKTIV: Dette kurset vil introdusere Apache Spark . Studentene skal lære hvordan Spark passer inn i Big Data økosystemet, og hvordan de kan bruke Spark til dataanalyse. Emnet dekker Spark shell for interaktiv dataanalyse, Spark internals, Spark APIer, Spark SQL , Spark streaming, og maskinlæring og grafX. Audiens: Utviklere / dataanalytikere
21 timer
Hortonworks Data Platform (HDP) er en åpen kildekode-støtteplattform for Apache Hadoop som gir et stabilt grunnlag for å utvikle big data-løsninger på Apache Hadoop økosystemet. Denne instruktørledede, live trening (på stedet eller ekstern) introduserer Hortonworks Data Platform (HDP) og leder deltakerne gjennom distribusjonen av Spark + Hadoop løsningen. Ved slutten av denne opplæringen vil deltakerne kunne:
  • Bruk Hortonworks for å pålitelig kjøre Hadoop i stor skala.
  • Forene Hadoop sikkerhets-, styrings- og operasjonsevner med Sparks agile analytiske arbeidsflyter.
  • Bruk Hortonworks til å undersøke, validere, sertifisere og støtte hver av komponentene i et Spark-prosjekt.
  • Behandle forskjellige typer data, inkludert strukturert, ustrukturert, i bevegelse og hvile.
Kursets format
  • Interaktiv forelesning og diskusjon.
  • Masse øvelser og trening.
  • Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
  • For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
14 timer
Magellan er en åpen kildekode distribuert utføringsmotor for geospatial analyse av store data. Implementert på toppen av Apache Spark, det utvider Spark SQL og gir en relativ abstraksjon for geospatial analyse. Denne instruktørledede, live-trening introduserer konseptene og tilnærminger for implementering av geospatiell analyse og går deltakerne gjennom skapelsen av en forutsigbar analyse applikasjon ved hjelp av Magellan på Spark. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Effektivt spørre, parse og bli med i geospatiale datasett i skala Implementering av geospatiale data i forretningsintelligens og prediktive analytics applikasjoner Bruk rumslig kontekst for å utvide kapasitetene til mobile enheter, sensorer, logger og bærbare enheter
Format av kurset
    Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
    For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
7 timer
Alluxio er et open-source virtuelt distribuert lagringssystem som forener ulike lagringssystemer og gjør det mulig for applikasjoner å samhandle med data ved minnehastighet. Den brukes av selskaper som Intel, Baidu og Alibaba. I denne instruktørledede, live-trening, vil deltakerne lære å bruke Alluxio til å bringe forskjellige beregningsrammer med lagringssystemer og effektivt administrere multi-petabyte skala data som de går gjennom skapelsen av en applikasjon med Alluxio. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Utvikle en søknad med Alluxio Koble til store datasystemer og applikasjoner samtidig som du beholder et namespace Effektivt ekstraherer verdi fra store data i ethvert lagringsformat Bedre arbeidsbelastningseffektivitet Oppsett og administrere Alluxio uavhengig eller klusteret
Publikum
    Data forskere Utvikler Systemadministrator
Format av kurset
    Delvis forelesning, delvis diskusjon, øvelser og tung praksis
7 timer
Spark SQL er Apache Spark modul for arbeid med strukturerte og ustrukturerte data. Spark SQL gir informasjon om strukturen til dataene samt beregningen som blir utført. Denne informasjonen kan brukes til å utføre optimaliseringer. To vanlige bruksområder for Spark SQL er:
- for å utføre SQL spørsmål.
- å lese data fra en eksisterende Hive installasjon. I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å analysere ulike typer datasett ved å bruke Spark SQL . Ved slutten av denne opplæringen vil deltakerne kunne:
  • Installer og konfigurer Spark SQL .
  • Utfør dataanalyse ved å bruke Spark SQL .
  • Forespørselsdatasett i forskjellige formater.
  • Visualiser data og spørreresultater.
Kursets format
  • Interaktiv forelesning og diskusjon.
  • Masse øvelser og trening.
  • Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
  • For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Stream Processing refererer til sanntidsbehandling av "data in motion", det vil si å utføre beregninger på data når de mottas. Slike data blir lest som kontinuerlige strømmer fra datakilder som sensorhendelser, brukeraktivitet på nettstedet, finansielle handler, kredittkortveksler, Stream Processing , etc. Stream Processing kan lese store mengder innkommende data og gi verdifull innsikt nesten øyeblikkelig. I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å sette opp og integrere forskjellige Stream Processing rammer med eksisterende store datalagringssystemer og relaterte programvareapplikasjoner og mikroservices. Ved slutten av denne opplæringen vil deltakerne kunne:
  • Installer og konfigurer forskjellige Streaming Stream Processing rammer, for eksempel Spark Streaming og Kafka Streaming.
  • Forstå og velg de mest passende rammene for jobben.
  • Behandle data kontinuerlig, samtidig og på en post-for-post måte.
  • Integrer Stream Processing med eksisterende databaser, datavarehus, datasjøer, etc.
  • Integrer det mest passende strømbehandlingsbiblioteket med bedriftsapplikasjoner og mikroservices.
Publikum
  • Utviklere
  • Programvarearkitekter
Kursets format
  • Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
Merknader
  • For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Big data analytics innebærer prosessen med å undersøke store mengder varierte datasett for å avdekke korrelasjoner, skjulte mønstre og annen nyttig innsikt. Helseindustrien har enorme mengder komplekse heterogene medisinske og kliniske data. Å bruke big data-analyse av helsedata gir et stort potensial i å oppnå innsikt for å forbedre leveransen av helsetjenester. Imidlertid gir enorme datasett store utfordringer i analyser og praktiske applikasjoner i et klinisk miljø. I denne instruktørledede liveopplæringen (ekstern) vil deltakerne lære å utføre big data-analyse innen helse når de går gjennom en serie praktiske live-lab-øvelser. Ved slutten av denne opplæringen vil deltakerne kunne:
  • Installer og konfigurer verktøy for analyse av big data som Hadoop MapReduce og Spark
  • Forstå egenskapene til medisinsk data
  • Bruk big data-teknikker for å håndtere medisinske data
  • Studer store datasystemer og algoritmer i sammenheng med helseprogrammer
Publikum
  • Utviklere
  • Dataforskere
Kursets format
  • Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse.
Merk
  • For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Apache Spark læringskurve øker sakte i begynnelsen, det krever mye krefter for å komme tilbake. Dette kurset tar sikte på å hoppe gjennom den første tøffe delen. Etter å ha tatt dette kurset vil deltakerne forstå det grunnleggende om Apache Spark , de vil tydelig differensiere RDD fra DataFrame, de vil lære Python og Scala API, de vil forstå eksekutører og oppgaver, etc. I tillegg til å følge beste praksis fokuserer dette kurset sterkt på skyutplassering, Databricks og AWS. Studentene vil også forstå forskjellene mellom AWS EMR og AWS Glue, en av de siste gnisttjenestene til AWS. PUBLIKUM: Data Engineer, DevOps , Data Scientist
21 timer
Scala er en kondensert versjon av Java for storskala funksjonell og objektorientert programmering. Apache Spark Streaming er en utvidet komponent av Spark API for å behandle store datasett som sanntidsstrømmer. Sammen muliggjør Spark Streaming og Scala streaming av big data. Denne instruktørledede liveopplæringen (på stedet eller fjernkontrollen) er rettet mot programvareingeniører som ønsker å streame big data med Spark Streaming og Scala . Ved slutten av denne opplæringen vil deltakerne kunne:
  • Lag Spark-applikasjoner med programmeringsspråket Scala .
  • Bruk gniststrømming for å behandle kontinuerlige datastrømmer.
  • Behandle strømmer av sanntidsdata med Spark Streaming.
Kursets format
  • Interaktiv forelesning og diskusjon.
  • Masse øvelser og trening.
  • Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
  • For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
14 timer
SMACK er en samling av dataplatform programvare, nemlig Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, og Apache Kafka. Ved hjelp av SMACK stack kan brukere lage og skala databehandlingsplattformer. Denne instruktørledede, live-trening (online eller on-site) er rettet mot data forskere som ønsker å bruke SMACK stack til å bygge databehandlingsplattformer for store data løsninger. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Implementere en data pipeline-arkitektur for behandling av store data. Utvikle en klusterinfrastruktur med Apache Mesos og Docker. Analyse data med Spark og Scala. Å håndtere ustrukturerte data med Apache Cassandra.
Format av kurset
    Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
    For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
21 timer
Apache Spark er en analysemotor designet for å distribuere data over en kluster for å behandle den parallelt. Den inneholder moduler for streaming, SQL, maskinlæring og grafisk behandling. Denne instruktørledede, live-trening (online eller på nett) er rettet mot ingeniører som ønsker å implementere Apache Spark system for å behandle svært store mengder data. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Installer og konfigurer Apache Spark. Forstå forskjellen mellom Apache Spark og Hadoop MapReduce og når å bruke hvilken. Snart lese i  og analysere svært store datasett. Integrere Apache Spark med andre maskinlæring verktøy.
Format av kurset
    Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
    For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
21 timer
Apache Spark er en distribuert behandlingsmotor for å analysere svært store datasett. Den kan behandle data i pakker og i sanntid, samt utføre maskinlæring, ad-hoc spørreundersøkelser og grafbehandling. .NET for Apache Spark er en gratis, åpen kildekode og cross-platform big data analytics ramme som støtter applikasjoner skrevet i C# eller F#. Denne instruktørledede, live-trening (online eller on-site) er rettet mot utviklere som ønsker å utføre stor dataanalyse ved hjelp av Apache Spark i sine.NET-applikasjoner. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Installer og konfigurer Apache Spark. Forstå hvordan.NET implementerer Spark APIs slik at de kan nås fra en.NET-applikasjon. Utvikle databehandlingsprogrammer ved hjelp av C# eller F#, i stand til å håndtere datasett hvis størrelse måles i terabiter og pedabiter. Utvikle maskinlæring funksjoner for en.NET-applikasjon ved hjelp av Apache Spark funksjoner. Utfør utforskningsanalyse ved hjelp av SQL spørreundersøkelser på store datasett.
Format av kurset
    Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
    For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
35 timer
Apache Hadoop er et populært databehandlingsramme for å behandle store datasett over mange datamaskiner. Denne instruktørledede, live-trening (online eller on-site) er rettet mot systemadministratorer som ønsker å lære hvordan å sette opp, implementere og administrere Hadoop kluster innenfor organisasjonen sin. Ved slutten av denne treningen vil deltakerne være i stand til å:
    Installere og konfigurere Apache Hadoop. Forstå de fire hovedkomponentene i Hadoop økosystemet: HDFS, MapReduce, YARN og Hadoop Common. Bruk Hadoop Distributed File System (HDFS) for å skala en kluster til hundrevis eller tusenvis av noder.   Installer HDFS for å fungere som lagringsmotor for on-premise Spark deployments. Sett opp Spark for å få tilgang til alternative lagringsløsninger som Amazon S3 og NoSQL databasesystemer som Redis, Elasticsearch, Couchbase, Aerospike, etc. Utføre administrative oppgaver som å gi, administrere, overvåke og sikre en Apache Hadoop kluster.
Format av kurset
    Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
    For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.
14 timer
This instructor-led, live training in Norge (online or onsite) is aimed at data scientists and developers who wish to use Spark NLP, built on top of Apache Spark, to develop, implement, and scale natural language text processing models and pipelines. By the end of this training, participants will be able to:
  • Set up the necessary development environment to start building NLP pipelines with Spark NLP.
  • Understand the features, architecture, and benefits of using Spark NLP.
  • Use the pre-trained models available in Spark NLP to implement text processing.
  • Learn how to build, train, and scale Spark NLP models for production-grade projects.
  • Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
35 timer
MLlib er Sparks maskinlæringsbibliotek. Målet er å gjøre praktisk maskinlæring skalerbar og enkel. Den består av vanlige læringsalgoritmer og verktøy, inkludert klassifisering, regresjon, klynger, samarbeidende filtrering, dimensjonalitetsreduksjon, samt primitiver på lavere nivå og optimaliseringsgrensesnitt på rørledningen. Den deler seg i to pakker:
  • spark.mllib inneholder den originale API-en som er bygget på toppen av RDD-er.
  • spark.ml gir API på høyere nivå bygget oppå DataFrames for konstruksjon av ML-rørledninger.
Publikum Dette kurset er rettet mot ingeniører og utviklere som søker å bruke et innebygd maskinbibliotek for Apache Spark
21 timer
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
28 timer
In this instructor-led, live training in Norge, participants will learn about the technology offerings and implementation approaches for processing graph data. The aim is to identify real-world objects, their characteristics and relationships, then model these relationships and process them as data using a Graph Computing (also known as Graph Analytics) approach. We start with a broad overview and narrow in on specific tools as we step through a series of case studies, hands-on exercises and live deployments. By the end of this training, participants will be able to:
  • Understand how graph data is persisted and traversed.
  • Select the best framework for a given task (from graph databases to batch processing frameworks.)
  • Implement Hadoop, Spark, GraphX and Pregel to carry out graph computing across many machines in parallel.
  • View real-world big data problems in terms of graphs, processes and traversals.

Last Updated:

Kommende Apache Spark Kurs

Helg Spark kurs, kveld Apache Spark trening, Spark boot camp, Apache Spark instruktørledet, Helg Apache Spark trening, Kveld Spark kurs, Apache Spark coaching, Apache Spark instruktør, Apache Spark trener, Apache Spark kurs, Spark klasser, Spark on-site, Spark private kurs, Apache Spark tomannshånd trening

Kursrabatter

Kursrabatter Nyhetsbrev

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Norway!

As a Business Development Manager you will:

  • expand business in Norway
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

This site in other countries/regions