Plan Szkolenia

Wprowadzenie

  • Zrozumienie znaczenia przygotowania danych w analityce i uczeniu maszynowym
  • Potok przygotowania danych i jego rola w cyklu życia danych
  • Poznanie typowych wyzwań związanych z surowymi danymi i ich wpływu na analizę

Gromadzenie i pozyskiwanie danych

  • Źródła danych: bazy danych, interfejsy API, arkusze kalkulacyjne, pliki tekstowe i inne
  • Techniki gromadzenia danych i zapewniania jakości danych podczas ich gromadzenia
  • Gromadzenie danych z różnych źródeł

Data Cleaning Techniki

  • Identyfikacja i obsługa brakujących wartości, wartości odstających i niespójności
  • Radzenie sobie z duplikatami i błędami w zbiorze danych
  • Czyszczenie rzeczywistych zestawów danych

Transformacja i standaryzacja danych

  • Techniki normalizacji i standaryzacji danych
  • Obsługa danych kategorycznych: kodowanie, binning i inżynieria cech
  • Przekształcanie surowych danych w użyteczne formaty

Data Integration i agregacja

  • Scalanie i łączenie zestawów danych z różnych źródeł
  • Rozwiązywanie konfliktów danych i dostosowywanie typów danych
  • Techniki agregacji i konsolidacji danych

Data Quality Zapewnienie

  • Metody zapewniania jakości i integralności danych w całym procesie
  • Wdrażanie kontroli jakości i procedur walidacji
  • Studia przypadków i praktyczne zastosowania zapewniania jakości danych

Redukcja wymiarowości i wybór cech

  • Zrozumienie potrzeby redukcji wymiarowości
  • Techniki takie jak PCA, wybór cech i strategie redukcji
  • Wdrażanie technik redukcji wymiarowości

Podsumowanie i kolejne kroki

Wymagania

    Podstawowe zrozumienie koncepcji danych

Uczestnicy

    Analitycy danych Administratorzy Database specjaliści IT
 14 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (3)

Propozycje terminów

Powiązane Kategorie