Plan Szkolenia

I. Wprowadzenie i zagadnienia wstępne

1. Przegląd

  • Czynienie R bardziej przyjaznym, R i dostępne GUI
  • Rstudio
  • Powiązane oprogramowanie i dokumentacja
  • R i statystyki
  • Interaktywne korzystanie z języka R
  • Sesja wprowadzająca
  • Uzyskiwanie pomocy dotyczącej funkcji i właściwości
  • Polecenia R, wielkość liter itp.
  • Przywoływanie i poprawianie poprzednich poleceń
  • Wykonywanie poleceń z pliku lub przekierowywanie danych wyjściowych do pliku
  • Trwałość danych i usuwanie obiektów
  • [Praktyka programowania w R: Samodzielne skrypty, dobra czytelność, np. ustrukturyzowane skrypty, dokumentacja, markdown
  • Instalowanie pakietów; CRAN i Bioconductor

2. Odczytywanie danych

  • Pliki txt (read.delim)
  • Pliki CSV

3. Proste manipulacje; liczby i wektory + tablice

  • Wektory i przypisanie
  • Arytmetyka wektorowa
  • Generowanie sekwencji regularnych
  • Wektory logiczne
  • Brakujące wartości
  • Wektory znaków
  • Wektory indeksowe; wybieranie i modyfikowanie podzbiorów zbioru danych
    • Tablice
  • Indeksowanie tablic. Podsekcje tablicy
  • Indeksowanie macierzy
  • Funkcja array() + proste operacje na tablicach, np. mnożenie, transpozycja.
  • Inne typy obiektów

4. Listy i ramki danych

  • Listy
  • Konstruowanie i modyfikowanie list
    • Łączenie list
  • Ramki danych
    • Tworzenie ramek danych
    • Praca z ramkami danych
    • Dołączanie dowolnych list
    • Zarządzanie ścieżką wyszukiwania

5. Manipulowanie danymi

  • Wybieranie, podzestawianie obserwacji i zmiennych
  • Filtrowanie, grupowanie
  • Przekodowywanie, transformacje
  • Agregacja, łączenie zestawów danych
  • Tworzenie macierzy partycjonowanych, cbind() i rbind()
  • Funkcja konkatenacji () z tablicami
  • Manipulacja znakami, pakiet stringr
  • Krótkie wprowadzenie do grep i regexpr

6. Więcej na temat odczytu danych

  • Pliki XLS, XLSX
  • pakiety readr i readxl
  • SPSS, SAS, Stata,... i inne formaty danych
  • Eksportowanie danych do txt, csv i innych formatów

6. Grupowanie, pętle i wykonywanie warunkowe

  • Grupowanie wyrażeń
  • Instrukcje sterujące
  • Wykonywanie warunkowe: instrukcje if
  • Wykonywanie powtarzalne: pętle for, repeat i while
  • Wprowadzenie do apply, lapply, sapply, tapply

7. Funkcje

  • Tworzenie funkcji
  • Opcjonalne argumenty i wartości domyślne
  • Zmienna liczba argumentów
  • Zakres i jego konsekwencje

8. Prosta grafika w R

  • Tworzenie wykresu
  • Wykresy gęstości
  • Wykresy punktowe
  • Wykresy słupkowe
  • Wykresy liniowe
  • Wykresy kołowe
  • Wykresy pudełkowe
  • Wykresy punktowe
  • Łączenie wykresów

II. Analiza statystyczna w R

1. Rozkłady prawdopodobieństwa

  • R jako zestaw tabel statystycznych
  • Badanie rozkładu zbioru danych

2. Testowanie hipotez

  • Testy dotyczące średniej populacji
  • Test ilorazu wiarygodności
  • Testy dla jednej i dwóch prób
  • Test Chi-kwadrat Go odness-of-Fit
  • Statystyka Kołmogorowa-Smirnowa dla jednej próby
  • Test Wilcoxona Signed-Rank
  • Test dwóch prób
  • Test sumy rang Wilcoxona
  • Test Manna-Whitneya
  • Test Kołmogorowa-Smirnowa

3. Wielokrotne testowanie hipotez

  • Błąd typu I i FDR
  • Krzywe ROC i AUC
  • Procedury wielokrotnego testowania (BH, Bonferroni itp.)

4. Modele regresji liniowej

  • Ogólne funkcje wyodrębniania informacji o modelu
  • Aktualizacja dopasowanych modeli
  • Uogólnione modele liniowe
    • Rodziny
    • Funkcja glm()
  • Klasyfikacja
    • Regresja logistyczna
    • Liniowa analiza dyskryminacyjna
  • Uczenie się bez nadzoru
    • Analiza składowych głównych
    • Metody grupowania (k-średnich, hierarchiczne grupowanie, k-medoidy)

5. Analiza przeżywalności (pakiet survival)

  • Obiekty przeżycia w r
  • Oszacowanie Kaplana-Meiera, test log-rank, regresja parametryczna
  • Przedziały ufności
  • Analiza danych cenzurowanych (cenzurowanych interwałowo)
  • Modele Coxa PH, stałe zmienne towarzyszące
  • Modele Coxa PH, zmienne zależne od czasu
  • Symulacja: Porównanie modeli (porównanie modeli regresji)

6. Analiza wariancji

  • Jednoczynnikowa ANOVA
  • Dwukierunkowa klasyfikacja ANOVA
  • MANOVA

III. Problemy praktyczne w bioinformatyce

  • Krótkie wprowadzenie do pakietu limma
  • Przebieg analizy danych z mikromacierzy
  • Pobieranie danych z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Przetwarzanie danych (QC, normalizacja, ekspresja różnicowa)
  • Wykres wulkanu
  • Przykłady analizy + mapy cieplne
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie