Kursplan
Introduksjon til Google Colab og Apache Spark
- Oversikt over Google Colab
- Introduksjon til Apache Spark
- Oppsett av Spark i Google Colab
Datahåndtering med Apache Spark
- Arbeid med RDDs og DataFrames
- Innlasting og håndtering av store datasett
- Bruk av Spark SQL for å hente ut strukturert data
Avansert analyse med Spark
- Maskinlæring med Spark MLlib
- Utføring av realtidsdataanalyse
- Distribuert regning med Spark
Visualisering og Collaboration i Google Colab
- Integrering av Colab med populære visualiseringsbiblioteker
- Samarbeidsbaserte arbeidsflyter med Colab-notatbøker
- Deling og eksport av resultater
Optimalisering av Big Data-arbeidsflyter
- Justering av Spark for å oppnå best mulig ytelse
- Optimalisering av minne- og lagringsbruk
- Skaleringsarbeidsflyter for store datasett
Big Data i Skyen
- Integrering av Google Colab med skybaserte verktøy
- Bruk av skybasert lagring for big data
- Arbeid med Spark i distribuerte skybaserte miljøer
Saker og beste praksiser
- Gjennomgang av virkelige big data-applikasjoner
- Saker med bruk av Apache Spark og Colab
- Beste praksiser for big data-analyse
Oppsummering og neste trinn
Krav
- Grunnleggende kunnskap om datascience-konsepter
- Bekjentskap med Apache Spark
- Python programmeringsferdigheter
Målgruppe
- Datascientists
- Dataingeniører
- Forskere som arbeider med stort datamengder
Referanser (4)
Praktiske eksempler gav oss en ekte opplevelse av hvordan programmet fungerer. gode forklaringer og integrering av teoretiske konsepter og hvordan de henger sammen med praktiske anvendelser.
Ian - Archeoworks Inc.
Kurs - ArcGIS Fundamentals
Maskinoversatt
Alle emner han dekket, inkludert eksempler. Han forklarte også hvordan de er nyttige i vår daglige jobb.
madduri madduri - Boskalis Singapore Pte Ltd
Kurs - QGIS for Geographic Information System
Maskinoversatt
Jeg likte virkelig treningen. Jeg fant alle modulene relevante for problemene jeg prøver å løse på jobb. Integrasjonen av treningen med Jupyter-ark er virkelig imponerende.
Mark Firmin - Environment and Climate Change Canada
Kurs - Python for Geographic Information System (GIS)
Maskinoversatt
Det jeg likte best med treningen var organiseringen og stedet.
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Kurs - ArcGIS for Spatial Analysis
Maskinoversatt