Kursplan

Introduksjon

Forstå det grunnleggende i heterogen databehandlingsmetodikk

Hvorfor Parallell Computing? Forstå behovet for parallell databehandling

Flerkjerneprosessorer – arkitektur og design

Introduksjon til tråder, grunnleggende tråder og grunnleggende konsepter for parallell Programming

Forstå det grunnleggende i GPU Programvareoptimaliseringsprosesser

OpenMP - En standard for direktivbasert parallell Programming

Hands on / Demonstrasjon av ulike programmer på flerkjernemaskiner

Introduksjon til GPU Databehandling

GPUs for Parallell Computing

GPUer Programming Modell

Hands on / demonstrasjon av ulike programmer på GPU

SDK, verktøysett og installasjon av miljø for GPU

Arbeider med ulike biblioteker

Demonstrasjon av GPU og verktøy med eksempelprogrammer og OpenACC

Forstå CUDA Programming-modellen

Lære CUDA-arkitekturen

Utforske og sette opp CUDA-utviklingsmiljøene

Arbeider med CUDA Runtime API

Forstå CUDA-minnemodellen

Utforsker flere CUDA API-funksjoner

Accessing av globalt minne effektivt i CUDA: Global minneoptimalisering

Optimalisering av dataoverføringer i CUDA ved hjelp av CUDA-strømmer

Bruke delt minne i CUDA

Forstå og bruke atomoperasjoner og instruksjoner i CUDA

Kasusstudie: Grunnleggende digital bildebehandling med CUDA

Arbeide med multi-GPU Programming

Avansert maskinvareprofilering og sampling på NVIDIA / CUDA

Bruker CUDA Dynamic Parallelism API for Dynamic Kernel Launch

Oppsummering og konklusjon

Krav

  • C Programming
  • Linux GCC
  21 timer
 

Antall deltakere


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Relaterte kurs

GPU Programming - OpenCL vs CUDA vs ROCm

  28 timer

Related Categories