Kursplan

Introduksjon til Stratio Platform

  • Oversikt over Stratio-arkitektur og kjernekomponenter
  • Rollen til Rocket og Intelligence i data livssyklus
  • Logge inn og navigere i Stratio UI

Arbeid med Rocket Modulen

  • Data innhenting og opprettelse av pipeline
  • Tilkobling av datakilder og konfigurasjon av transformasjoner
  • Bruk av PySpark for forhåndsbehandling i Rocket

PySpark Essentials for Stratio Users

  • PySpark data struktur og operasjoner
  • Løkkekonsrukt: bruk av for, while, if/else
  • Skrive og bruke egendefinerte funksjoner med def

Avansert bruk av Rocket med PySpark

  • Strømmet innhenting og transformasjoner
  • Bruk av løkker og funksjoner i batch og real-time scenarier
  • Beste praksis for ytelse i PySpark pipelines

Utforskning av Intelligence Modulen

  • Oversikt over data modellering og analysefunksjoner
  • Utvalg, transformasjon og utforskning av funksjoner
  • Rollen til PySpark i tilpassede analyser og innsikt

Bygging av avanserte analysearbeidsflater

  • Opprette brukerdefinerte funksjoner (UDFs) i Intelligence
  • Bruk av betingelser og løkker for data logikk
  • Bruksområder: segmentering, aggregering og prediksjon

Utplassering og Collaboration

  • Lagring, eksportering og gjenbruk av arbeidsflater
  • Samarbeid med andre teammedlemmer i Stratio
  • Gjenomgang av resultat og integrering med nedstrømsverktøy

Oppsummering og neste steg

Krav

  • Erfaring med Python programmering
  • Forståelse for dataanalyse eller store data-behandlingskonsepter
  • Grunnleggende kunnskap om Apache Spark og distribuert beregning

Målgruppe

  • Dataingeniører som arbeider med Stratio-baserte plattformer
  • Analytikere eller utviklere som bruker Rocket og Intelligence-moduler
  • Tekniske team som overgår til PySpark-arbeidsflyter innen Stratio
 14 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories