Kursplan

Introduksjon

Forståelse Big Data

Oversikt over Spark

Oversikt over Python

Oversikt over PySpark

    Distribuere data ved hjelp av robuste distribuerte datasett Framework Distribuere beregninger ved å bruke Spark API-operatører

Oppsett Python med Spark

Oppsett PySpark

Bruker Amazon Web Services (AWS) EC2-forekomster for Spark

Oppsett Databricks

Sette opp AWS EMR-klyngen

Lære det grunnleggende om Python programmering

    Komme i gang med Python Bruke Jupyter Notebook Bruke variabler og enkle datatyper Arbeide med lister Bruke if-setninger Bruke brukerinndata Arbeide med while-løkker Implementeringsfunksjoner Arbeide med klasser Arbeide med filer og unntak Arbeide med prosjekter, data og APIer

Lær det grunnleggende om Spark DataFrame

    Komme i gang med Spark DataFrames Implementering av grunnleggende operasjoner med Spark ved å bruke Groupby og aggregerte operasjoner Arbeide med tidsstempler og datoer

Arbeider med en Spark DataFrame-prosjektøvelse

Forståelse Machine Learning med MLlib

Arbeide med MLlib, Spark og Python for maskinlæring

Forstå regresjoner

    Lære lineær regresjonsteori Implementere en regresjonsevalueringskode Arbeide med en prøve på lineær regresjonsøvelse Lære logistisk regresjonsteori Implementere en logistisk regresjonskode Arbeide med en prøve på logistisk regresjonsøvelse

Forståelse Random Forester og beslutningstrær

    Learning Tree Methods Theory Implementing Decision Trees and Random Forest Codes Working on a Sample Random Forest Klassifiseringsøvelse

Arbeid med K-betyr Clustering

    Forstå K-betyr Clustering Theory Implementere en K-betyr Clustering Code Arbeide med en prøve Clustering øvelse

Arbeide med Recommender Systems

Implementering av naturlig språkbehandling

    Forstå Natural Language Processing (NLP) Oversikt over NLP-verktøy som arbeider med en prøve på NLP-øvelse

Streaming med Spark på Python

    Oversikt Streaming med Spark Sample Spark Streaming Øvelse

Sluttkommentarer

Krav

  • Generelle programmeringskunnskaper

Publikum

  • Utviklere
  • IT-fagfolk
  • Dataforskere
  21 timer
 

Antall deltakere


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Testimonials (5)

Relaterte kurs

Related Categories