Kursplan

Introduksjon

    Oversikt over Spark og Hadoop funksjoner og arkitektur Forstå big data Python grunnleggende programmering

Starter

    Sette opp Python, Spark og Hadoop Forstå datastrukturer i Python Forstå PySpark API Forstå HDFS og MapReduce

Integrering av Spark og Hadoop med Python

    Implementering av Spark RDD i Python Behandle data ved hjelp av MapReduce Opprette distribuerte datasett i HDFS

Machine Learning med Spark MLlib

Behandler Big Data med Spark Streaming

Arbeid med Recommender Systems

Jobber med Kafka, Sqoop, Kafka og Flume

Apache Mahout med Spark og Hadoop

Feilsøking

Sammendrag og neste trinn

Krav

  • Erfaring med Spark og Hadoop
  • Python programmeringserfaring

Publikum

  • Dataforskere
  • Utviklere
 21 timer

Antall deltakere



Price per participant

Testimonials (3)

Relaterte kurs

Related Categories