Plan Szkolenia

Wprowadzenie do Reinforcement Learning

  • Czym jest uczenie ze wzmocnieniem?
  • Kluczowe pojęcia: agent, środowisko, stany, działania i nagrody
  • Wyzwania w uczeniu ze wzmocnieniem

Eksploracja i eksploatacja

  • Równoważenie eksploracji i eksploatacji w modelach RL
  • Strategie eksploracji: epsilon-greedy, softmax i inne

Uczenie Q i głębokie sieci Q (DQN)

  • Wprowadzenie do Q-learningu
  • Wdrażanie sieci DQN przy użyciu TensorFlow
  • Optymalizacja uczenia Q z odtwarzaniem doświadczeń i sieciami docelowymi

Metody oparte na polityce

  • Algorytmy gradientu polityki
  • Algorytm REINFORCE i jego implementacja
  • Metody krytyki aktorów

Praca z OpenAI Gym

  • Konfigurowanie środowisk w OpenAI Gym
  • Symulowanie agentów w dynamicznych środowiskach
  • Ocena wydajności agentów

Zaawansowane techniki Reinforcement Learning

  • Uczenie ze wzmocnieniem wielu agentów
  • Głęboki deterministyczny gradient polityki (DDPG)
  • Proksymalna optymalizacja polityki (PPO)

Wdrażanie modeli Reinforcement Learning

  • Rzeczywiste zastosowania uczenia ze wzmocnieniem
  • Integracja modeli RL w środowiskach produkcyjnych

Podsumowanie i kolejne kroki

Wymagania

  • Doświadczenie w programowaniu Python
  • Podstawowe zrozumienie koncepcji głębokiego uczenia się i uczenia maszynowego
  • Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu ze wzmocnieniem

Uczestnicy

  • Naukowcy zajmujący się danymi
  • Praktycy uczenia maszynowego
  • Badacze sztucznej inteligencji
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie