Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Introduksjon
- Data Science-prosessen
- Roller og ansvar for en dataforskningsexpert (Data Scientist)
Forberedelse av Utviklingsmiljøet
- Biblioteker, rammer, språk og verktøy
- Lokal utvikling
- Samarbeidsbasert webutvikling
Datainnsamling
-
Forskjellige typer data
-
Strukturerte
- Lokale databaser
- Databasedisposanter (connectors)
- Vanlige formater: xlxs, XML, Json, csv, ...
-
Ustrukturerte
- Klikk, sensorer, mobiltelefoner
- APIs
- Internett av ting (IoT)
- Dokumenter, bilder, videoer, lyd
-
Strukturerte
- Eksempelstudie: Samle inn store mengder ustrukturerte data kontinuerlig
Dataopplagring
- Relasjonelle databaser
- Ikke-relasjonelle databaser
- Hadoop: Distribuert filsystem (HDFS)
- Spark: Tolerant distribuert datasett (RDD)
- Skyoppbevaring
Dataforberedelse
- Innsamling, valg, rengjøring og transformasjon
- Sikre datakvalitet - nøyaktighet, meningfullhet og sikkerhet
- Avviksrapporter
Språk brukt for Forberedelse, Behandling og Analyse
-
R-språket
- Introduksjon til R
- Datamanipulasjon, beregning og grafisk fremvisning
-
Python
- Introduksjon til Python
- Manipulasjon, behandling, rengjøring og analyse av data
Dataanalyse
-
Explorativ analyse
- Grunnleggende statistikk
- Utkast til visualiseringer
- Forstå data
- Kausalitet
- Egenskaper og transformasjoner
-
Maskinlæring
- Supervisert vs. usupervisert
- Når å bruke hvilket modell
- Naturlig språkbehandling (NLP)
Datavisualisering
- Beste praksis
- Velge riktig diagram for riktig data
- Fargepaletter
-
Ta det et skritt videre
- Dashboarder
- Interaktive visualiseringer
- Fortelle historier med data
Sammendrag og konklusjon
Krav
- Generell forståelse av databasemotorer
- Grunnleggende forståelse av statistikk
35 timer
Referanser (1)
Reelt verdslag fra noen i bransjen
Matthew Cerbas - Shield Consulting Solutions, Inc.
Kurs - Grafana
Maskinoversatt