Kursplan

Introduksjon

  Data Science Prosessrollene og -ansvaret til en dataforsker

Forberede utviklingsmiljøet

  Biblioteker, rammer, språk og verktøy Lokal utvikling Samarbeidende nettbasert utvikling

Datainnsamling

  Ulike typer datastrukturerte lokale databaser Databasekoblinger Vanlige formater: xlxs, XML, Json, csv, ...
Ustrukturerte klikk, sensurer, smarttelefoner
 • APIer
 • Internet of Things (IoT)
 • Dokumenter, bilder, videoer, lyder
 • Kasusstudie: Innsamling av store mengder ustrukturert data kontinuerlig
 • DatalagringRelasjonsdatabaser Ikke-relasjonelle databaser Hadoop: Distribuert filsystem (HDFS) Spark: Resilient Distributed Dataset (RDD) Skylagring
 • Dataforberedelse
 • Svelging, utvalg, rensing og transformasjon Sikre datakvalitet - korrekthet, meningsfullhet og sikkerhet Unntaksrapporter

   Languages brukes til forberedelse, prosessering og analyse

  R språk Introduksjon til R Datamanipulering, beregning og grafisk visning

   Python Introduksjon til Python

  Manipulere, behandle, rense og knuse data

   Dataanalyse
  Utforskende analyse Grunnleggende statistikk Utkast til visualiseringer Forstå data
 • Kausalitet
 • Funksjoner og transformasjoner
 • Machine Learning Overvåket vs uovervåket

   Når du skal bruke hvilken modell
  Natural Language Processing (NLP)
 • Data Visualization
 • Beste praksis Velge riktig diagram for riktig data Fargepaller Ta det til neste nivå Dashboards Interaktive visualiseringer
 • Historiefortelling med data
 • Oppsummering og konklusjon
 • Krav

  • En generell forståelse av databasekonsepter
  • En grunnleggende forståelse av statistikk
   35 timer

  Antall deltakere  Price per participant

  Testimonials (1)

  Related Categories