Kursplan

Introduksjon til Stratio-plattformen

  • Oversikt over Stratios arkitektur og kjerne-moduler
  • Rollen av Rocket og Intelligence i data-livetssyklusen
  • Logge inn og navigere i Stratio-brukergrensesnittet

Arbeid med Rocket-modulen

  • Datainnlesing og opprettelse av pipeline
  • Koble datakilder og konfigurere transformasjoner
  • Bruke PySpark for preprocessing-oppgaver i Rocket

PySpark Essentials for Stratio-brukere

  • PySpark-datatyper og operasjoner
  • Løkkestrukturer: for, while, if/else bruk
  • Skrive tilpassede funksjoner med def og bruke dem

Avansert bruk av Rocket med PySpark

  • Strømmende innlesing og transformasjoner
  • Bruke løkker og funksjoner i batch- og sanntids-scenarier
  • Best praksis for ytelse i PySpark-pipelines

Utforske Intelligence-modulen

  • Oversikt over data-modellering og analysefunksjoner
  • Egenskapsselging, -transformasjon og -utforskning
  • Rolle av PySpark i tilpassede analyser og innsikter

Oppbygge avanserte analysearbeidsflyter

  • Oprette brukerdefinerte funksjoner (UDFs) i Intelligence
  • Bruke betingelser og løkker for data-logikk
  • Bruksområder: segmentering, -aggregering og -prediksjon

Delplassering og samarbeid

  • Lagre, eksportere og gjenbruke arbeidsflyter
  • Samarbeide med andre teammedlemmer i Stratio
  • Vurdere utdata og integrere med nedstrømsverktøy

Oppsummering og neste trinn

Krav

  • Erfaring med Python-programmering
  • Forståelse av dataanalyse eller store data-prosessering konsepter
  • Grunnleggende kunnskap om Apache Spark og distribuert beregning

Målgruppe

  • Dataingeniører som jobber på Stratio-baserte plattformer
  • Analytikere eller utviklere som bruker Rocket- og Intelligence-modulene
  • Tekniske team som overgår til PySpark-arbeidsflyter innenfor Stratio
 14 timer

Antall deltakere


Pris per deltaker

Referanser (4)

Kommende kurs

Relaterte kategorier