Kursplan

Statistikk & probabilistisk programmering i Julia

Grunnleggende statistikk

  • Statistikk
    • Sammendragende statistikk med statistikkpakken
  • Fordelinger & StatsBase-pakken
    • En-variabel og fler-variabel
    • Momenter
    • Sannsynlighetsfunksjoner
    • Sampling og tilfeldig tallgenerering (RNG)
    • Histogrammer
    • Maksimum sannsynlighetsestimering
    • Produkt, avkorting og sensurerte fordelinger
    • Robust statistikk
    • Korrelasjon & kovarians

DataFrames

(DataFrames-pakken)

  • Data I/O
  • Opprettelse av Data Frames
  • Datatyper, inkludert kategoriske og manglende data
  • Sortering & samling
  • Omgjøring & pivotering av data

Hypotesetesting

(HypothesisTests-pakken)

  • Prinsipp for hypotesetesting
  • Kji-kvadrat test
  • z-test og t-test
  • F-test
  • Fisher-exakt test
  • ANOVA
  • Normalitets tester
  • Kolmogorov-Smirnov test
  • Hotelling's T-test

Regresjon & overlevelseanalyse

(GLM & Survival-pakker)

  • Prinsipp for lineær regresjon og eksponentiell familie
  • Lineær regresjon
  • Generaliserte lineære modeller
    • Logistisk regresjon
    • Poisson-regresjon
    • Gamma-regresjon
    • Andre GLM-modeller
  • Overlevelseanalyse
    • Hendelser
    • Kaplan-Meier
    • Nelson-Aalen
    • Cox Proportional Hazard

Avstander

(Distances-pakken)

  • Hva er en avstand?
  • Euclidisk
  • Cityblock
  • Cosinus
  • Korrelasjon
  • Mahalanobis
  • Hamming
  • MAD
  • RMS
  • Gjennomsnitt kvadratisk avvik

Flervariabel statistikk

(MultivariateStats, Lasso, & Loess-pakker)

  • Ridge-regresjon
  • Lasso-regresjon
  • Loess
  • Lineær diskriminantsanalyse
  • Hovedkomponentanalyse (PCA)
    • Lineær PCA
    • Kernel PCA
    • Probabilistisk PCA
    • Uavhengig CA
  • Hovedkomponentregresjon (PCR)
  • Faktoranalyse
  • Kanonisk korrelasjonsanalyse
  • Flerdimensjonal skalering

Klynging

(Clustering-pakken)

  • K-means
  • K-medoids
  • DBSCAN
  • Hierarkisk klynging
  • Markov Cluster-algoritme
  • Fuzzy C-means klynging

Bayesiansk statistikk & probabilistisk programmering

(Turing-pakken)

  • Markov Chain Monte Carlo
  • Hamiltonian Monte Carlo
  • Gaussiske blandingmodeller
  • Bayesiansk lineær regresjon
  • Bayesiansk eksponentiell familie regresjon
  • Bayesianske neurale nettverk
  • Hidden Markov-modeller
  • Partikkelfiltering
  • Variational Inference

Krav

Dette kurset er ment for personer som allerede har bakgrunn i datavitenskap og statistikk.

 21 Timer

Antall deltakere


Pris per deltaker

Referanser (5)

Kommende kurs

Relaterte kategorier