Plan Szkolenia

Dzień pierwszy: Podstawy języka

  • Wprowadzenie do kursu
  • O Data Science
    • Data Science Definicja
    • Proces wykonywania Data Science.
  • Wprowadzenie R Language
  • Zmienne i typy
  • Struktury kontrolne (pętle / warunki)
  • R Scala rs, wektory i macierze
    • Definiowanie wektorów R
    • Macierze
  • Manipulacja ciągami znaków i tekstem
    • Typ danych znakowych
    • Plik IO
  • Listy
  • Funkcje
    • Wprowadzenie do funkcji
    • Zamknięcia
    • Funkcje lapply/sapply
  • Ramki danych
  • Laboratoria dla wszystkich sekcji

Dzień drugi: średniozaawansowany R Programming

  • DataFrames i File I/O
  • Odczytywanie danych z plików
  • Przygotowanie danych
  • Wbudowane zestawy danych
  • Wizualizacja
    • Pakiet graficzny
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • Mapa cieplna
    • Pakiet ggplot2 (qplot(), ggplot())
  • Eksploracja za pomocą Dplyr
  • Laboratoria dla wszystkich sekcji

Dzień trzeci: Zaawansowane Programming z R

  • Modelowanie statystyczne przy użyciu języka R
    • Funkcje statystyczne
    • Radzenie sobie z NA
    • Rozkłady (dwumianowy, Poissona, normalny)
  • Regresja
    • Wprowadzenie do regresji liniowej
  • Zalecenia
  • Przetwarzanie tekstu (pakiet tm / Wordclouds)
  • Klastrowanie
    • Wprowadzenie do klastrowania
    • KMeans
  • Klasyfikacja
    • Wprowadzenie do klasyfikacji
    • Naiwny Bayes
    • Drzewa decyzyjne
    • Trening przy użyciu pakietu caret
    • Ocena algorytmów
  • R i Big Data
    • Łączenie R z bazami danych
    • Ekosystem Big Data
  • Laboratoria dla wszystkich sekcji

Wymagania

  • Preferowane jest podstawowe doświadczenie w programowaniu

Konfiguracja

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie