Plan Szkolenia

Wprowadzenie do Reinforcement Learning

  • Przegląd uczenia ze wzmocnieniem i jego zastosowań
  • Różnice między uczeniem nadzorowanym, nienadzorowanym i uczeniem ze wzmocnieniem
  • Kluczowe pojęcia: agent, środowisko, nagrody i polityka

Procesy decyzyjne Markowa (MDP)

  • Zrozumienie stanów, działań, nagród i przejść między stanami
  • Funkcje wartości i równanie Bellmana
  • Programowanie dynamiczne do rozwiązywania MDP

Podstawowe algorytmy RL

  • Metody tabelaryczne: Q-Learning i SARSA
  • Metody oparte na zasadach: Algorytm REINFORCE
  • Ramy krytyki aktorów i ich zastosowania

Głębokie Reinforcement Learning

  • Wprowadzenie do głębokich sieci Q (DQN)
  • Odtwarzanie doświadczeń i sieci docelowe
  • Gradienty polityki i zaawansowane głębokie metody RL

Struktury i narzędzia RL

  • Wprowadzenie do OpenAI Gym i innych środowisk RL
  • Korzystanie z PyTorch lub TensorFlow do tworzenia modeli RL
  • Szkolenie, testowanie i porównywanie agentów RL

Wyzwania w RL

  • Równoważenie eksploracji i eksploatacji w treningu
  • Radzenie sobie z rzadkimi nagrodami i problemami z przydzielaniem punktów
  • [Mobilność i wyzwania obliczeniowe w RL

Ćwiczenia praktyczne Activiti

  • Implementacja algorytmów Q-Learning i SARSA od podstaw
  • Trenowanie agenta opartego na DQN do grania w prostą grę w OpenAI Gym
  • Dostrajanie modeli RL w celu poprawy wydajności w niestandardowych środowiskach

Podsumowanie i kolejne kroki

Wymagania

  • Dobre zrozumienie zasad i algorytmów uczenia maszynowego
  • Biegłość w programowaniu Python
  • Znajomość sieci neuronowych i frameworków głębokiego uczenia się

Uczestnicy

  • Inżynierowie uczenia maszynowego
  • Specjaliści ds. sztucznej inteligencji
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie