Plan Szkolenia

Wprowadzenie

  • Czym są Large Language Models (LLMs)?
  • LLM a tradycyjne modele NLP
  • Przegląd funkcji i architektury LLM
  • Wyzwania i ograniczenia modeli LLM

Zrozumienie modeli LLM

  • Cykl życia modelu LLM
  • Jak działa LLM
  • Główne komponenty LLM: koder, dekoder, uwaga, osadzanie itp.

Pierwsze kroki

  • Konfiguracja środowiska programistycznego
  • Instalowanie LLM jako narzędzia programistycznego, np. Go ogle Colab, Hugging Face

Praca z LLM

  • Eksplorowanie dostępnych opcji LLM
  • Tworzenie i używanie LLM
  • Dostrajanie LLM na niestandardowym zestawie danych

Podsumowanie tekstu

  • Zrozumienie zadania podsumowywania tekstu i jego zastosowań
  • Używanie LLM do ekstrakcyjnego i abstrakcyjnego podsumowywania tekstu
  • Ocena jakości wygenerowanych podsumowań przy użyciu wskaźników takich jak ROUGE, BLEU itp.

Odpowiadanie na pytania

  • Zrozumienie zadania odpowiadania na pytania i jego zastosowań
  • Wykorzystanie LLM do odpowiadania na pytania w domenie otwartej i zamkniętej
  • Ocena dokładności wygenerowanych odpowiedzi przy użyciu wskaźników takich jak F1, EM itp.

Generowanie tekstu

  • Zrozumienie zadania generowania tekstu i jego zastosowań
  • Wykorzystanie LLM do warunkowego i bezwarunkowego generowania tekstu
  • Kontrolowanie stylu, tonu i treści generowanych tekstów przy użyciu parametrów takich jak temperatura, top-k, top-p itp.

Integracja LLM z innymi frameworkami i platformami

  • Używanie LLM z PyTorch lub TensorFlow
  • Używanie LLM z Flask lub Streamlit
  • Używanie LLM z Google Cloud lub AWS

Rozwiązywanie problemów

  • Zrozumienie typowych błędów i usterek w LLM
  • Używanie TensorBoard do monitorowania i wizualizacji procesu uczenia
  • Korzystanie z PyTorch Lightning w celu uproszczenia kodu szkoleniowego i poprawy wydajności
  • Używanie Hugging Face Datasets do ładowania i wstępnego przetwarzania danych

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie przetwarzania języka naturalnego i głębokiego uczenia się
  • Doświadczenie z Python i PyTorch lub TensorFlow
  • Podstawowe doświadczenie w programowaniu

Uczestnicy

  • Programiści
  • Entuzjaści NLP
  • Naukowcy zajmujący się danymi
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie