GPU Programming - OpenCL vs CUDA vs ROCm Treningskurs

GPU-programmering er en teknikk som utnyttes parallellbehandlingskapasiteten til GPU'er for å akselerere programmer som krever høyytelsesberegning, slik som kunstig intelligens, spill, grafikker og vitenskapelig beregning. Det finnes flere rammeverk som gjør GPU-programmering mulig, hver med sine egne fordeler og ulemper. OpenCL er en åpen standard som kan brukes til å programmere CPU'er, GPU'er og andre enheter fra forskjellige leverandører, mens CUDA er spesifikt for NVIDIA GPU'er. ROCm er en plattform som støtter GPU-programmering på AMD GPU'er, og gir også kompatibilitet med CUDA og OpenCL.

Denne instruktør-ledede live-treningen (online eller på stedet) er rettet mot utviklere på begynnernivå til mellomnivå som ønsker å bruke forskjellige rammeverk for GPU-programmering og sammenligne funksjoner, ytelse og kompatibilitet.

Ved slutten av denne treningen vil deltakerne kunne:

Opprette en utviklingsmiljø som inkluderer OpenCL SDK, CUDA Toolkit, ROCm Platform, en enhet som støtter OpenCL, CUDA eller ROCm, og Visual Studio Code.
Skrive et grunnleggende GPU-program som utfører vektoraddisjon ved hjelp av OpenCL, CUDA og ROCm, og sammenligne syntaks, struktur og kjøring av hvert rammeverk.
Bruke de respektive APIene til å spørre om enhetsinformasjon, allokere og deallokere enhetsminne, kopiere data mellom vert og enhet, kjøre kjerner og synkronisere tråder.
Bruke de respektive språkene til å skrive kjerner som kjører på enheten og manipulerer data.
Bruke de respektive inbyggede funksjonene, variablene og bibliotekene for å utføre vanlige oppgaver og operasjoner.
Bruke de respektive minneplassene, som global, lokal, konstant og privat, for å optimalisere datakopieringer og minnetilganger.
Bruke de respektive kjøremodellene til å kontrollere trådene, blokkene og rutenett som definerer parallelismen.
Feilsøke og teste GPU-programmer ved hjelp av verktøy som CodeXL, CUDA-GDB, CUDA-MEMCHECK og NVIDIA Nsight.
Optimalisere GPU-programmer ved hjelp av teknikkene som samlegging, caching, prefetching og profilering.

Kursformat

Interaktiv forelesning og diskusjon.
Mange øvelser og praktiske oppgaver.
Hånds-på-implementering i et live-lab-miljø.

Muligheter for tilpasning av kurs

For å be om en tilpasset treningskurs for dette kurset, vennligst kontakt oss for å avtale.

Oslo

6000 EUR (Online)

6800 EUR (Klasserom)

GPU Programming - OpenCL vs CUDA vs ROCm Treningskurs

Kursplan

Krav

Kommende kurs

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

Relaterte kategorier

Denne siden i andre land/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

GPU Programming - OpenCL vs CUDA vs ROCm Treningskurs

Kursplan

Krav

Kommende kurs

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

GPU Programming - OpenCL vs CUDA vs ROCm

Relaterte kurs

Utvikling av AI-applikasjoner med Huawei Ascend og CANN

Deploying AI Models with CANN og Ascend AI-prosessorer

GPU Programming på Biren AI Acceleratorer

Cambricon MLU Development with BANGPy and Neuware

Introduksjon til CANN for AI-rammeverkutviklere

CANN for Edge AI Deployment

Forståelse av Huaweis AI-regneark: Fra CANN til MindSpore

Optimering av Neural Network Ytelse med CANN SDK

SDK for Ascend og NLP-rørledninger

Bygging av Tilpassede AI-Operatorer med CANN TIK og TVM

Overføre CUDA-applikasjoner til kinesiske GPU-arkitekturer

Performance Optimization on Ascend, Biren, and Cambricon

Relaterte kategorier

GPU

Denne siden i andre land/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites