Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduksjon
- Hva er Large Language Models (LLMs)? LLMs vs tradisjonelle NLP-modeller Oversikt over LLMs funksjoner og arkitektur Utfordringer og begrensninger ved LLMs
Forstå LLM-er
- Livssyklusen til en LLM Hvordan LLM-er fungerer Hovedkomponentene i en LLM: koder, dekoder, oppmerksomhet, innebygging, etc.
Starter
- Sette opp utviklingsmiljøet Installere en LLM som et utviklingsverktøy, f.eks. Google Colab, Hugging Face
Jobber med LLM-er
- Utforske tilgjengelige LLM-alternativer Opprette og bruke en LLM Finjustere en LLM på et tilpasset datasett
Tekstoppsummering
- Forstå oppgaven med tekstoppsummering og dens anvendelser Bruke en LLM for ekstraherende og abstrakt tekstoppsummering Evaluere kvaliteten på de genererte sammendragene ved hjelp av beregninger som ROUGE, BLEU, etc.
Spørsmål svar
- Forstå oppgaven med å besvare spørsmål og dens applikasjoner Bruke en LLM for å besvare spørsmål med åpent domene og lukket domene Evaluere nøyaktigheten til de genererte svarene ved å bruke beregninger som F1, EM, etc.
Tekstgenerering
- Forstå oppgaven med tekstgenerering og dens applikasjoner Bruke en LLM for betinget og ubetinget tekstgenerering Kontrollere stilen, tonen og innholdet til de genererte tekstene ved hjelp av parametere som temperatur, top-k, top-p, etc.
Integrering av LLM-er med andre rammer og plattformer
- Bruke LLM-er med PyTorch eller TensorFlow Bruke LLM-er med Flask eller Streamlit Bruke LLM-er med Google Cloud eller AWS
Feilsøking
- Forstå de vanlige feilene og feilene i LLM-er Bruke TensorBoard til å overvåke og visualisere treningsprosessen. Bruke PyTorch Lightning for å forenkle treningskoden og forbedre ytelsen. Bruke Hugging Face-datasett for å laste og forhåndsbehandle dataene
Sammendrag og neste trinn
Krav
- En forståelse av naturlig språkbehandling og dyp læring Erfaring med Python og PyTorch eller TensorFlow Basic programmeringserfaring
Publikum
- Utviklere NLP-entusiaster Dataforskere
14 timer