Kursplan

Dag En: Språkfundament

  • Kursintro
  • Om Data Science
    • Definisjon av data science
    • Proses for å utføre data science.
  • Introduksjon til R-språket
  • Variabler og typer
  • Kontrollstrukturer (løkker / betingelser)
  • R Skalare, vektorer og matriser
    • Definisjon av R-vektorer
    • Matriser
  • Strenger og tekstbehandling
    • Karakterdatatyper
    • Fil I/O
  • Lister
  • Funksjoner
    • Introduksjon til funksjoner
    • Lukker (closures)
    • lapply/sapply-funksjoner
  • DataFrames
  • Laboratorieoppgaver til alle seksjoner


Dag To: Mellomnivå R-programmering

  • DataFrames og fil I/O
  • Lesing av data fra filer
  • Forberedelse av data
  • Innbyggede datasett
  • Visualisering
    • Grafikk-pakke
    • plot() / barplot() / hist() / boxplot() / spredningsplott (scatter plot)
    • Varmekart (Heat Map)
    • ggplot2-pakke (qplot(), ggplot())
  • Uforskjellig gjennom Dplyr
  • Laboratorieoppgaver til alle seksjoner


Dag Tre: Avansert programmering med R

  • Statistisk modellering med R
    • Statistiske funksjoner
    • Behandling av NA (mangler)
    • Fordelinger (Binomial, Poisson, Normal)
  • Regresjon
    • Introduksjon til lineære regresjoner
  • Anbefalinger
  • Tekstbehandling (tm-pakke / ordskyer)
  • Klyngeanalyse
    • Introduksjon til klyngeanalyse
    • KMeans
  • Klassifisering
    • Introduksjon til klassifisering
    • Naive Bayes
    • Beslutningstrær
    • Trening ved hjelp av caret-pakken
    • Evaluering av algoritmer
  • R og stordata (Big Data)
    • Koble til databaser med R
    • Stordatas økosystem
  • Laboratorieoppgaver til alle seksjoner

Krav

  • En grunnleggende programmeringstilbakemelding er foretrukket


Oppsett

  • En moderne laptop
  • Siste versjon av R Studio og R-miljøet installert

 21 timer

Antall deltakere


Pris per deltaker

Referanser (7)

Kommende kurs

Relaterte kategorier