Kursplan

Introduksjon

Forstå det grunnleggende i heterogen databehandlingsmetodikk

Hvorfor Parallell Computing? Forstå behovet for parallell databehandling

Flerkjerneprosessorer – arkitektur og design

Introduksjon til tråder, grunnleggende tråder og grunnleggende konsepter for parallell Programming

Forstå det grunnleggende i GPU Programvareoptimaliseringsprosesser

OpenMP - En standard for direktivbasert parallell Programming

Hands on / Demonstrasjon av ulike programmer på flerkjernemaskiner

Introduksjon til GPU Databehandling

GPUs for Parallell Computing

GPUer Programming Modell

Hands on / demonstrasjon av ulike programmer på GPU

SDK, verktøysett og installasjon av miljø for GPU

Arbeider med ulike biblioteker

Demonstrasjon av GPU og verktøy med eksempelprogrammer og OpenACC

Forstå CUDA Programming-modellen

Lære CUDA-arkitekturen

Utforske og sette opp CUDA-utviklingsmiljøene

Arbeider med CUDA Runtime API

Forstå CUDA-minnemodellen

Utforsker flere CUDA API-funksjoner

Accessing av globalt minne effektivt i CUDA: Global minneoptimalisering

Optimalisering av dataoverføringer i CUDA ved hjelp av CUDA-strømmer

Bruke delt minne i CUDA

Forstå og bruke atomoperasjoner og instruksjoner i CUDA

Kasusstudie: Grunnleggende digital bildebehandling med CUDA

Arbeide med multi-GPU Programming

Avansert maskinvareprofilering og sampling på NVIDIA / CUDA

Bruker CUDA Dynamic Parallelism API for Dynamic Kernel Launch

Oppsummering og konklusjon

Krav

  • C Programming
  • Linux GCC
 21 timer

Antall deltakere



Price per participant

Testimonials (1)

Relaterte kurs

GPU Programming - OpenCL vs CUDA vs ROCm

28 timer

Related Categories