Kursplan

Introduksjon

  • Data Science-prosessen
  • Roller og ansvar for en dataforskningsexpert (Data Scientist)

Forberedelse av Utviklingsmiljøet

  • Biblioteker, rammer, språk og verktøy
  • Lokal utvikling
  • Samarbeidsbasert webutvikling

Datainnsamling

  • Forskjellige typer data
    • Strukturerte
      • Lokale databaser
      • Databasedisposanter (connectors)
      • Vanlige formater: xlxs, XML, Json, csv, ...
    • Ustrukturerte
      • Klikk, sensorer, mobiltelefoner
      • APIs
      • Internett av ting (IoT)
      • Dokumenter, bilder, videoer, lyd
  • Eksempelstudie: Samle inn store mengder ustrukturerte data kontinuerlig

Dataopplagring

  • Relasjonelle databaser
  • Ikke-relasjonelle databaser
  • Hadoop: Distribuert filsystem (HDFS)
  • Spark: Tolerant distribuert datasett (RDD)
  • Skyoppbevaring

Dataforberedelse

  • Innsamling, valg, rengjøring og transformasjon
  • Sikre datakvalitet - nøyaktighet, meningfullhet og sikkerhet
  • Avviksrapporter

Språk brukt for Forberedelse, Behandling og Analyse

  • R-språket
    • Introduksjon til R
    • Datamanipulasjon, beregning og grafisk fremvisning
  • Python
    • Introduksjon til Python
    • Manipulasjon, behandling, rengjøring og analyse av data

Dataanalyse

  • Explorativ analyse
    • Grunnleggende statistikk
    • Utkast til visualiseringer
    • Forstå data
  • Kausalitet
  • Egenskaper og transformasjoner
  • Maskinlæring
    • Supervisert vs. usupervisert
    • Når å bruke hvilket modell
  • Naturlig språkbehandling (NLP)

Datavisualisering

  • Beste praksis
  • Velge riktig diagram for riktig data
  • Fargepaletter
  • Ta det et skritt videre
    • Dashboarder
    • Interaktive visualiseringer
  • Fortelle historier med data

Sammendrag og konklusjon

Krav

  • Generell forståelse av databasemotorer
  • Grunnleggende forståelse av statistikk
 35 timer

Antall deltakere


Pris per deltaker

Referanser (4)

Kommende kurs

Relaterte kategorier