Kursplan

Dag én: Grunnleggende språk

  Kursintroduksjon Om Data Science Data Science Definisjonsprosessen Data Science.
Vi introduserer R Language
 • Variabler og typer
 • Kontrollstrukturer (løkker / betingelser)
 • R Scalars, vektorer og matriser som definerer R-vektorer
 • Matriser
 • Datatype for streng- og tekstmanipulering
 • IO filer
 • Lister
 • Funksjoner Introduserer funksjoner
 • Nedleggelser
 • lapply/sapply-funksjoner
 • Datarammer
 • Labs for alle seksjoner
 • Dag to: Middels R Programming
 • DataFrames og fil-I/O Lese data fra filer Dataforberedelse Innebygde datasett Visualisering Grafikk Pakkeplott() / barplot() / hist() / boxplot() / spredningsplott Heat Map ggplot2-pakke (qplot(), ggplot())
 • Utforskning med Dplyr
 • Labs for alle seksjoner
 • Dag tre: Avansert Programming Med R

   Statistisk modellering med R Statistiske funksjoner som håndterer NA-fordelinger (binomial, poisson, normal)
  Regresjon Introduserer lineære regresjoner
 • Anbefalinger
 • Tekstbehandling (tm-pakke / Wordskyer)
 • Clustering Introduksjon til Clustering

   KMeans
  Klassifisering Introduksjon til klassifisering
 • Naiv Bayes
 • Beslutningstrær
 • Trening med caret-pakke
 • Evaluering av algoritmer
 • R og Big Data Kobler R til databaser
 • Big Data Økosystem
 • Labs for alle seksjoner

  Krav

  • Grunnleggende programmeringsbakgrunn foretrekkes

  Oppsett

  • En moderne bærbar PC
  • Siste R studio og R miljø installert
   21 timer

  Antall deltakere  Price per participant

  Testimonials (5)

  Related Categories