Kursplan

Introduksjon til Big Data Økosystemer

  • Oversikt over big data teknologier og arkitekturer
  • Batch-behandling vs. sanntidshåndtering
  • Datalagringstrategier for skalerbarhet

Avansert databehandling med Apache Spark

  • Optimering av Spark-jobber for ytelse
  • Avanserte transformasjoner og handlinger
  • Arbeid med strukturerte strømmer

Machine Learning i stor skala

  • Distribuerte modellopplæringsmetoder
  • Hyperparameterjustering på store datamengder
  • Modellimplementering i big data-miljøer

Deep Learning for Big Data

  • Integrering av TensorFlow og PyTorch med Spark
  • Distribuerte dype læringsopplæringsrørledninger
  • Bruksområder innen bilde-, tekst- og tidsrekkeanalyse

Sanntidsanalyser og datastreaming

  • Apache Kafka for strømming av datainnsamling
  • Strømbehandlingsrammeverk
  • Overvåkning og varsling i sanntidssystemer

Data Governance, Sikkerhet og Etikk

  • Personvern og krav til overholdelse
  • Access kontroll og kryptering i big data-systemer
  • Etiske overveielser i stor skala analyse

Integrering av Big Data med Business Intelligence

  • Datavisualisering og instrumentpaneler for big data
  • Kobling av big data-rørledninger til BI-verktøy
  • Driving av forretningsmål med avansert analyse

Oppsummering og Neste Skritt

Krav

  • God forståelse av dataanalyse og statistisk modellering
  • Erfaring med verktøy for dataforbehandling og programmeringsspråk som Python, R, eller Scala
  • Kjennskap med fordelte beregningsrammeverk som Hadoop eller Spark

Målgruppe

  • Dataanalytikere som ønsker å mestre store datasett og prediktiv analyse
  • Seniore analysere som ønsker å designe og implementere avanserte analytiske arbeidsflyter
  • Forsknings- og utviklingsprofesjonelle som fokuserer på innovative datadrevne løsninger
 42 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories