Kursplan
Introduksjon
Forstå det grunnleggende i heterogen databehandlingsmetodikk
Hvorfor Parallell Computing? Forstå behovet for parallell databehandling
Flerkjerneprosessorer – arkitektur og design
Introduksjon til tråder, grunnleggende tråder og grunnleggende konsepter for parallell Programming
Forstå det grunnleggende i GPU Programvareoptimaliseringsprosesser
OpenMP - En standard for direktivbasert parallell Programming
Hands on / Demonstrasjon av ulike programmer på flerkjernemaskiner
Introduksjon til GPU Databehandling
GPUs for Parallell Computing
GPUer Programming Modell
Hands on / demonstrasjon av ulike programmer på GPU
SDK, verktøysett og installasjon av miljø for GPU
Arbeider med ulike biblioteker
Demonstrasjon av GPU og verktøy med eksempelprogrammer og OpenACC
Forstå CUDA Programming-modellen
Lære CUDA-arkitekturen
Utforske og sette opp CUDA-utviklingsmiljøene
Arbeider med CUDA Runtime API
Forstå CUDA-minnemodellen
Utforsker flere CUDA API-funksjoner
Accessing av globalt minne effektivt i CUDA: Global minneoptimalisering
Optimalisering av dataoverføringer i CUDA ved hjelp av CUDA-strømmer
Bruke delt minne i CUDA
Forstå og bruke atomoperasjoner og instruksjoner i CUDA
Kasusstudie: Grunnleggende digital bildebehandling med CUDA
Arbeide med multi-GPU Programming
Avansert maskinvareprofilering og sampling på NVIDIA / CUDA
Bruker CUDA Dynamic Parallelism API for Dynamic Kernel Launch
Oppsummering og konklusjon
Krav
- C Programming
- Linux GCC
Testimonials (1)
Trener energi og humor.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Kurs - NVIDIA GPU Programming - Extended
Machine Translated