Apache Spark Opplæringskurs

Apache Spark Opplæringskurs

Local, instructorled live Apache Spark training courses demonstrate through handson practice how Spark fits into the Big Data ecosystem, and how to use Spark for data analysis

Apache Spark training is available as "onsite live training" or "remote live training" Onsite live training can be carried out locally on customer premises in Norge or in NobleProg corporate training centers in Norge Remote live training is carried out by way of an interactive, remote desktop

NobleProg Your Local Training Provider.

Machine Translated

Testimonials

★★★★★
★★★★★

Spark Underkategorier

Apache Spark Kursplaner

Kursnavn
Varighet
Oversikt
Kursnavn
Varighet
Oversikt
21 timer
Oversikt
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 timer
Oversikt
Alluxio is an open-source virtual distributed storage system that unifies disparate storage systems and enables applications to interact with data at memory speed. It is used by companies such as Intel, Baidu and Alibaba.

In this instructor-led, live training, participants will learn how to use Alluxio to bridge different computation frameworks with storage systems and efficiently manage multi-petabyte scale data as they step through the creation of an application with Alluxio.

By the end of this training, participants will be able to:

- Develop an application with Alluxio
- Connect big data systems and applications while preserving one namespace
- Efficiently extract value from big data in any storage format
- Improve workload performance
- Deploy and manage Alluxio standalone or clustered

Audience

- Data scientist
- Developer
- System administrator

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 timer
Oversikt
Big data analytics innebærer prosessen med å undersøke store mengder varierte datasett for å avdekke korrelasjoner, skjulte mønstre og annen nyttig innsikt.

Helseindustrien har enorme mengder komplekse heterogene medisinske og kliniske data. Å bruke big data-analyse av helsedata gir et stort potensial i å oppnå innsikt for å forbedre leveransen av helsetjenester. Imidlertid gir enorme datasett store utfordringer i analyser og praktiske applikasjoner i et klinisk miljø.

I denne instruktørledede liveopplæringen (ekstern) vil deltakerne lære å utføre big data-analyse innen helse når de går gjennom en serie praktiske live-lab-øvelser.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Installer og konfigurer verktøy for analyse av big data som Hadoop MapReduce og Spark
- Forstå egenskapene til medisinsk data
- Bruk big data-teknikker for å håndtere medisinske data
- Studer store datasystemer og algoritmer i sammenheng med helseprogrammer

Publikum

- Utviklere
- Dataforskere

Kursets format

- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse.

Merk

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
28 timer
Oversikt
Many real world problems can be described in terms of graphs. For example, the Web graph, the social network graph, the train network graph and the language graph. These graphs tend to be extremely large; processing them requires a specialized set of tools and processes -- these tools and processes can be referred to as Graph Computing (also known as Graph Analytics).

In this instructor-led, live training, participants will learn about the technology offerings and implementation approaches for processing graph data. The aim is to identify real-world objects, their characteristics and relationships, then model these relationships and process them as data using a Graph Computing (also known as Graph Analytics and Distributed Graph Processing) approach. We start with a broad overview and narrow in on specific tools as we step through a series of case studies, hands-on exercises and live deployments.

By the end of this training, participants will be able to:

- Understand how graph data is persisted and traversed.
- Select the best framework for a given task (from graph databases to batch processing frameworks.)
- Implement Hadoop, Spark, GraphX and Pregel to carry out graph computing across many machines in parallel.
- View real-world big data problems in terms of graphs, processes and traversals.

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 timer
Oversikt
Hortonworks Data Platform (HDP) er en åpen kildekode-støtteplattform for Apache Hadoop som gir et stabilt grunnlag for å utvikle big data-løsninger på Apache Hadoop økosystemet.

Denne instruktørledede, live trening (på stedet eller ekstern) introduserer Hortonworks Data Platform (HDP) og leder deltakerne gjennom distribusjonen av Spark + Hadoop løsningen.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Bruk Hortonworks for å pålitelig kjøre Hadoop i stor skala.
- Forene Hadoop sikkerhets-, styrings- og operasjonsevner med Sparks agile analytiske arbeidsflyter.
- Bruk Hortonworks til å undersøke, validere, sertifisere og støtte hver av komponentene i et Spark-prosjekt.
- Behandle forskjellige typer data, inkludert strukturert, ustrukturert, i bevegelse og hvile.

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Oversikt
Stream Processing refererer til sanntidsbehandling av "data in motion", det vil si å utføre beregninger på data når de mottas. Slike data blir lest som kontinuerlige strømmer fra datakilder som sensorhendelser, brukeraktivitet på nettstedet, finansielle handler, kredittkortveksler, Stream Processing , etc. Stream Processing kan lese store mengder innkommende data og gi verdifull innsikt nesten øyeblikkelig.

I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å sette opp og integrere forskjellige Stream Processing rammer med eksisterende store datalagringssystemer og relaterte programvareapplikasjoner og mikroservices.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Installer og konfigurer forskjellige Streaming Stream Processing rammer, for eksempel Spark Streaming og Kafka Streaming.
- Forstå og velg de mest passende rammene for jobben.
- Behandle data kontinuerlig, samtidig og på en post-for-post måte.
- Integrer Stream Processing med eksisterende databaser, datavarehus, datasjøer, etc.
- Integrer det mest passende strømbehandlingsbiblioteket med bedriftsapplikasjoner og mikroservices.

Publikum

- Utviklere
- Programvarearkitekter

Kursets format

- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse

Merknader

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
14 timer
Oversikt
Magellan er en open source distribuert utførelsesmotor for geospatial analytics på big data. Implementert på toppen av Apache Spark , utvider den Spark SQL og gir en relasjonell abstraksjon for geospatial analyse.

Denne instruktørledede liveopplæringen introduserer konsepter og tilnærminger for implementering av geospacial analytics og leder deltakerne gjennom opprettelsen av en prediktiv analyseapplikasjon ved bruk av Magellan on Spark.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Spørsmål, analyser og bli med geospatiale datasett på en effektiv måte
- Implementere geospatiale data i forretningsintelligens og prediktive analyseprogrammer
- Bruk romlig kontekst for å utvide mulighetene til mobile enheter, sensorer, logger og wearables

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Oversikt
Apache Spark is a distributed processing engine for analyzing very large data sets. It can process data in batches and real-time, as well as carry out machine learning, ad-hoc queries, and graph processing. .NET for Apache Spark is a free, open-source, and cross-platform big data analytics framework that supports applications written in C# or F#.

This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.

By the end of this training, participants will be able to:

- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
14 timer
Oversikt
SMACK is a collection of data platform softwares, namely Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, and Apache Kafka. Using the SMACK stack, users can create and scale data processing platforms.

This instructor-led, live training (online or onsite) is aimed at data scientists who wish to use the SMACK stack to build data processing platforms for big data solutions.

By the end of this training, participants will be able to:

- Implement a data pipeline architecture for processing big data.
- Develop a cluster infrastructure with Apache Mesos and Docker.
- Analyze data with Spark and Scala.
- Manage unstructured data with Apache Cassandra.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
21 timer
Oversikt
Apache Spark is an analytics engine designed to distribute data across a cluster in order to process it in parallel. It contains modules for streaming, SQL, machine learning and graph processing.

This instructor-led, live training (online or onsite) is aimed at engineers who wish to deploy Apache Spark system for processing very large amounts of data.

By the end of this training, participants will be able to:

- Install and configure Apache Spark.
- Understand the difference between Apache Spark and Hadoop MapReduce and when to use which.
- Quickly read in and analyze very large data sets.
- Integrate Apache Spark with other machine learning tools.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
21 timer
Oversikt
Apache Spark læringskurve øker sakte i begynnelsen, det krever mye krefter for å komme tilbake. Dette kurset tar sikte på å hoppe gjennom den første tøffe delen. Etter å ha tatt dette kurset vil deltakerne forstå det grunnleggende om Apache Spark , de vil tydelig differensiere RDD fra DataFrame, de vil lære Python og Scala API, de vil forstå eksekutører og oppgaver, etc. I tillegg til å følge beste praksis fokuserer dette kurset sterkt på skyutplassering, Databricks og AWS. Studentene vil også forstå forskjellene mellom AWS EMR og AWS Glue, en av de siste gnisttjenestene til AWS.

PUBLIKUM:

Data Engineer, DevOps , Data Scientist
21 timer
Oversikt
OBJEKTIV:

Dette kurset vil introdusere Apache Spark . Studentene skal lære hvordan Spark passer inn i Big Data økosystemet, og hvordan de kan bruke Spark til dataanalyse. Emnet dekker Spark shell for interaktiv dataanalyse, Spark internals, Spark APIer, Spark SQL , Spark streaming, og maskinlæring og grafX.

Audiens:

Utviklere / dataanalytikere
21 timer
Oversikt
Python er et programmeringsspråk på høyt nivå kjent for sin klare syntaks og kodelesbarhet. Spark er en databehandlingsmotor som brukes til spørring, analyse og transformering av big data. PySpark lar brukere grensesnitt Spark med Python .

I denne instruktørledede liveopplæringen vil deltakerne lære hvordan de bruker Python og Spark sammen for å analysere big data når de jobber med praktiske øvelser.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Lær hvordan du bruker Spark med Python til å analysere Big Data .
- Arbeidet med øvelser som etterligner omstendighetene i den virkelige verden.
- Bruk forskjellige verktøy og teknikker for big data-analyse ved bruk av PySpark .

Kursets format

- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
21 timer
Oversikt
Scala er en kondensert versjon av Java for storskala funksjonell og objektorientert programmering. Apache Spark Streaming er en utvidet komponent av Spark API for å behandle store datasett som sanntidsstrømmer. Sammen muliggjør Spark Streaming og Scala streaming av big data.

Denne instruktørledede liveopplæringen (på stedet eller fjernkontrollen) er rettet mot programvareingeniører som ønsker å streame big data med Spark Streaming og Scala .

Ved slutten av denne opplæringen vil deltakerne kunne:

- Lag Spark-applikasjoner med programmeringsspråket Scala .
- Bruk gniststrømming for å behandle kontinuerlige datastrømmer.
- Behandle strømmer av sanntidsdata med Spark Streaming.

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
7 timer
Oversikt
Spark SQL er Apache Spark modul for arbeid med strukturerte og ustrukturerte data. Spark SQL gir informasjon om strukturen til dataene samt beregningen som blir utført. Denne informasjonen kan brukes til å utføre optimaliseringer. To vanlige bruksområder for Spark SQL er:
- for å utføre SQL spørsmål.
- å lese data fra en eksisterende Hive installasjon.

I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å analysere ulike typer datasett ved å bruke Spark SQL .

Ved slutten av denne opplæringen vil deltakerne kunne:

- Installer og konfigurer Spark SQL .
- Utfør dataanalyse ved å bruke Spark SQL .
- Forespørselsdatasett i forskjellige formater.
- Visualiser data og spørreresultater.

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
35 timer
Oversikt
MLlib er Sparks maskinlæringsbibliotek. Målet er å gjøre praktisk maskinlæring skalerbar og enkel. Den består av vanlige læringsalgoritmer og verktøy, inkludert klassifisering, regresjon, klynger, samarbeidende filtrering, dimensjonalitetsreduksjon, samt primitiver på lavere nivå og optimaliseringsgrensesnitt på rørledningen.

Den deler seg i to pakker:

-

spark.mllib inneholder den originale API-en som er bygget på toppen av RDD-er.

-

spark.ml gir API på høyere nivå bygget oppå DataFrames for konstruksjon av ML-rørledninger.

Publikum

Dette kurset er rettet mot ingeniører og utviklere som søker å bruke et innebygd maskinbibliotek for Apache Spark

Kommende Apache Spark Kurs

Helg Spark kurs, kveld Apache Spark trening, Spark boot camp, Apache Spark instruktørledet, Helg Apache Spark trening, Kveld Spark kurs, Apache Spark coaching, Apache Spark instruktør, Apache Spark trener, Apache Spark kurs, Spark klasser, Spark on-site, Spark private kurs, Apache Spark tomannshånd trening

Kursrabatter

Kursrabatter Nyhetsbrev

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Norway!

As a Business Development Manager you will:

  • expand business in Norway
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

This site in other countries/regions