Kursplan

Introduksjon til Google Colab og Apache Spark

  • Oversikt over Google Colab
  • Introduksjon til Apache Spark
  • Oppsett av Spark i Google Colab

Datahåndtering med Apache Spark

  • Arbeid med RDDs og DataFrames
  • Innlasting og håndtering av store datasett
  • Bruk av Spark SQL for å hente ut strukturert data

Avansert analyse med Spark

  • Maskinlæring med Spark MLlib
  • Utføring av realtidsdataanalyse
  • Distribuert regning med Spark

Visualisering og Collaboration i Google Colab

  • Integrering av Colab med populære visualiseringsbiblioteker
  • Samarbeidsbaserte arbeidsflyter med Colab-notatbøker
  • Deling og eksport av resultater

Optimalisering av Big Data-arbeidsflyter

  • Justering av Spark for å oppnå best mulig ytelse
  • Optimalisering av minne- og lagringsbruk
  • Skaleringsarbeidsflyter for store datasett

Big Data i Skyen

  • Integrering av Google Colab med skybaserte verktøy
  • Bruk av skybasert lagring for big data
  • Arbeid med Spark i distribuerte skybaserte miljøer

Saker og beste praksiser

  • Gjennomgang av virkelige big data-applikasjoner
  • Saker med bruk av Apache Spark og Colab
  • Beste praksiser for big data-analyse

Oppsummering og neste trinn

Krav

  • Grunnleggende kunnskap om datascience-konsepter
  • Bekjentskap med Apache Spark
  • Python programmeringsferdigheter

Målgruppe

  • Datascientists
  • Dataingeniører
  • Forskere som arbeider med stort datamengder
 14 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories