Plan Szkolenia

  1. Wprowadzenie Machine Learning
    • Rodzaje uczenia maszynowego - uczenie nadzorowane i nienadzorowane
    • Od uczenia statystycznego do uczenia maszynowego
    • Przepływ pracy Data Mining:
      • Business zrozumienie
      • Zrozumienie danych
      • Przygotowanie danych
      • Modelowanie
      • Ocena
      • Wdrożenie
    • Algorytmy uczenia maszynowego
    • Wybór odpowiedniego algorytmu do problemu
    • Overfitting i kompromis stronniczości i wariancji w ML
  2. Biblioteki ML i języki programowania
    • Dlaczego warto używać języka programowania?
    • Wybór między R i Python
    • Python crash course
    • Zasoby Python
    • Biblioteki dla uczenia maszynowego Python
    • Notatniki Jupyter i interaktywne kodowanie
  3. Testowanie algorytmów uczenia maszynowego
    • Uogólnianie i nadmierne dopasowanie
    • Unikanie nadmiernego dopasowania
      • Metoda Holdout
      • Walidacja krzyżowa
      • Bootstrapping
    • Ocena prognoz numerycznych
      • Miary dokładności: ME, MSE, RMSE, MAPE
      • Stabilność parametrów i prognoz
    • Ocena algorytmów klasyfikacji
      • Dokładność i związane z nią problemy
      • Macierz pomyłek
      • Problem niezrównoważonych klas
    • Wizualizacja wydajności modelu
      • Krzywa zysku
      • Krzywa ROC
      • Krzywa podnoszenia
    • Wybór modelu
    • Dostrajanie modelu - strategie wyszukiwania siatki
    • Przykłady w Python
  4. Przygotowanie danych
    • Importowanie i przechowywanie danych
    • Zrozumienie danych - podstawowe eksploracje
    • Manipulowanie danymi za pomocą biblioteki pandas
    • Transformacje danych - manipulowanie danymi
    • Analiza eksploracyjna
    • Brakujące obserwacje - wykrywanie i rozwiązania
    • Wartości odstające - wykrywanie i strategie
    • Standaryzacja, normalizacja, binaryzacja
    • Rekodowanie danych jakościowych
    • Przykłady w Python
  5. Klasyfikacja
    • Klasyfikacja binarna i wieloklasowa
    • Klasyfikacja za pomocą funkcji matematycznych
      • Liniowe funkcje dyskryminacyjne
      • Kwadratowe funkcje dyskryminacyjne
    • Regresja logistyczna i podejście oparte na prawdopodobieństwie
    • k-najbliższych sąsiadów
    • Naiwny Bayes
    • Drzewa decyzyjne
      • CART
      • Bagging
      • Random Forests
      • Boosting
      • Xgboost
    • Maszyny wektorów nośnych i jądra
      • Klasyfikator z maksymalnym marginesem
      • Maszyna wektorów nośnych
    • Uczenie zespołowe
    • Przykłady w Python
  6. Regresja i przewidywanie numeryczne
    • Estymacja metodą najmniejszych kwadratów
    • Techniki wyboru zmiennych
    • Regularyzacja i stabilność - L1, L2
    • Nieliniowości i uogólnione metody najmniejszych kwadratów
    • Regresja wielomianowa
    • Splajny regresji
    • Drzewa regresji
    • Przykłady w Python
  7. Uczenie bez nadzoru
    • Klasteryzacja
      • Klasteryzacja oparta na centroidach - k-średnich, k-medoidach, PAM, CLARA
      • Klastrowanie hierarchiczne - Diana, Agnes
      • Klastrowanie oparte na modelu - EM
      • Samoorganizujące się mapy
      • Ewaluacja i ocena klastrów
    • Redukcja wymiarowości
      • Analiza składowych głównych i analiza czynnikowa
      • Dekompozycja wartości pojedynczej
    • Skalowanie wielowymiarowe
    • Przykłady w Python
  8. Eksploracja tekstu
    • Wstępne przetwarzanie danych
    • Model worka słów
    • Stemming i lematyzacja
    • Analiza częstotliwości słów
    • Analiza nastrojów
    • Tworzenie chmur słów
    • Przykłady w Python
  9. Silniki rekomendacji i filtrowanie kolaboracyjne
    • Dane rekomendacji
    • Wspólne filtrowanie oparte na użytkownikach
    • Wspólne filtrowanie oparte na pozycjach
    • Przykłady w Python
  10. Eksploracja wzorców asocjacyjnych
    • Algorytm częstych elementów
    • Analiza koszyka rynkowego
    • Przykłady w Python
  11. Analiza wartości odstających
    • Analiza wartości ekstremalnych
    • Wykrywanie wartości odstających na podstawie odległości
    • Metody oparte na gęstości
    • Wysokowymiarowe wykrywanie wartości odstających
    • Przykłady w Python
  12. Machine Learning studium przypadku
    • Zrozumienie problemu Business
    • Wstępne przetwarzanie danych
    • Wybór i dostrajanie algorytmu
    • Ocena wyników
    • Wdrożenie

Wymagania

Wiedza i świadomość Machine Learning podstaw

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie