Python, Spark, and Hadoop for Big Data Treningskurs

Last updated

Kurskode

sparkpythonhadoop

Varighet

21 timer (vanligvis 3 dag inkludert pauser)

Krav

 • Experience with Spark and Hadoop
 • Python programming experience

Audience

 • Data scientists
 • Developers

Oversikt

Python er et skalbart, fleksibelt og mye brukt programmeringsspråk for datavitenskap og maskinlæring. Spark er en databehandlingsmotor som brukes i spørre, analysere og transformere store data, mens Hadoop er et programvare bibliotek rammeverk for storskala data lagring og behandling.

Denne instruktørledede, live-trening (online eller on-site) er rettet mot utviklere som ønsker å bruke og integrere Spark, Hadoop, og Python for å behandle, analysere og transformere store og komplekse datasett.

Ved slutten av denne treningen vil deltakerne være i stand til å:

  Sett opp det nødvendige miljøet for å begynne å behandle store data med Spark, Hadoop, og Python. Forstå funksjonene, kjernekomponentene og arkitekturen til Spark og Hadoop. Lær hvordan du integrerer Spark, Hadoop, og Python for Big Data Processing. Utforsk verktøyene i Spark økosystemet (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, og Flume). Bygg samarbeidende filtrering anbefalingssystemer som likner Netflix, YouTube, Amazon, Spotify, og Google. Bruk Apache Mahout til å skala maskinlæring algoritmer.

Format av kurset

  Interaktiv forelesning og diskusjon. Mange øvelser og praksis. Hands-on implementering i et live-lab miljø.

Kurs tilpassingsalternativer

  For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å arrangere.

Machine Translated

Kursplan

Introduction

 • Overview of Spark and Hadoop features and architecture
 • Understanding big data
 • Python programming basics

Getting Started

 • Setting up Python, Spark, and Hadoop
 • Understanding data structures in Python
 • Understanding PySpark API
 • Understanding HDFS and MapReduce

Integrating Spark and Hadoop with Python

 • Implementing Spark RDD in Python
 • Processing data using MapReduce
 • Creating distributed datasets in HDFS

Machine Learning with Spark MLlib

Processing Big Data with Spark Streaming

Working with Recommender Systems

Working with Kafka, Sqoop, Kafka, and Flume

Apache Mahout with Spark and Hadoop

Troubleshooting

Summary and Next Steps

Testimonials

★★★★★
★★★★★

Related Categories

Relaterte kurs

Kursrabatter

Kursrabatter Nyhetsbrev

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Norway!

As a Business Development Manager you will:

 • expand business in Norway
 • recruit local talent (sales, agents, trainers, consultants)
 • recruit local trainers and consultants

We offer:

 • Artificial Intelligence and Big Data systems to support your local operation
 • high-tech automation
 • continuously upgraded course catalogue and content
 • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

This site in other countries/regions