Plan Szkolenia
I. Wprowadzenie i zagadnienia wstępne
1. Przegląd
- Czynienie R bardziej przyjaznym, R i dostępne GUI
- Rstudio
- Powiązane oprogramowanie i dokumentacja
- R i statystyki
- Interaktywne korzystanie z języka R
- Sesja wprowadzająca
- Uzyskiwanie pomocy dotyczącej funkcji i właściwości
- Polecenia R, wielkość liter itp.
- Przywoływanie i poprawianie poprzednich poleceń
- Wykonywanie poleceń z pliku lub przekierowywanie danych wyjściowych do pliku
- Trwałość danych i usuwanie obiektów
- [Praktyka programowania w R: Samodzielne skrypty, dobra czytelność, np. ustrukturyzowane skrypty, dokumentacja, markdown
- Instalowanie pakietów; CRAN i Bioconductor
2. Odczytywanie danych
- Pliki txt (read.delim)
- Pliki CSV
3. Proste manipulacje; liczby i wektory + tablice
- Wektory i przypisanie
- Arytmetyka wektorowa
- Generowanie sekwencji regularnych
- Wektory logiczne
- Brakujące wartości
- Wektory znaków
- Wektory indeksowe; wybieranie i modyfikowanie podzbiorów zbioru danych
- Tablice
- Indeksowanie tablic. Podsekcje tablicy
- Indeksowanie macierzy
- Funkcja array() + proste operacje na tablicach, np. mnożenie, transpozycja.
- Inne typy obiektów
4. Listy i ramki danych
- Listy
- Konstruowanie i modyfikowanie list
- Łączenie list
- Ramki danych
- Tworzenie ramek danych
- Praca z ramkami danych
- Dołączanie dowolnych list
- Zarządzanie ścieżką wyszukiwania
5. Manipulowanie danymi
- Wybieranie, podzestawianie obserwacji i zmiennych
- Filtrowanie, grupowanie
- Przekodowywanie, transformacje
- Agregacja, łączenie zestawów danych
- Tworzenie macierzy partycjonowanych, cbind() i rbind()
- Funkcja konkatenacji () z tablicami
- Manipulacja znakami, pakiet stringr
- Krótkie wprowadzenie do grep i regexpr
6. Więcej na temat odczytu danych
- Pliki XLS, XLSX
- pakiety readr i readxl
- SPSS, SAS, Stata,... i inne formaty danych
- Eksportowanie danych do txt, csv i innych formatów
6. Grupowanie, pętle i wykonywanie warunkowe
- Grupowanie wyrażeń
- Instrukcje sterujące
- Wykonywanie warunkowe: instrukcje if
- Wykonywanie powtarzalne: pętle for, repeat i while
- Wprowadzenie do apply, lapply, sapply, tapply
7. Funkcje
- Tworzenie funkcji
- Opcjonalne argumenty i wartości domyślne
- Zmienna liczba argumentów
- Zakres i jego konsekwencje
8. Prosta grafika w R
- Tworzenie wykresu
- Wykresy gęstości
- Wykresy punktowe
- Wykresy słupkowe
- Wykresy liniowe
- Wykresy kołowe
- Wykresy pudełkowe
- Wykresy punktowe
- Łączenie wykresów
II. Analiza statystyczna w R
1. Rozkłady prawdopodobieństwa
- R jako zestaw tabel statystycznych
- Badanie rozkładu zbioru danych
2. Testowanie hipotez
- Testy dotyczące średniej populacji
- Test ilorazu wiarygodności
- Testy dla jednej i dwóch prób
- Test Chi-kwadrat Go odness-of-Fit
- Statystyka Kołmogorowa-Smirnowa dla jednej próby
- Test Wilcoxona Signed-Rank
- Test dwóch prób
- Test sumy rang Wilcoxona
- Test Manna-Whitneya
- Test Kołmogorowa-Smirnowa
3. Wielokrotne testowanie hipotez
- Błąd typu I i FDR
- Krzywe ROC i AUC
- Procedury wielokrotnego testowania (BH, Bonferroni itp.)
4. Modele regresji liniowej
- Ogólne funkcje wyodrębniania informacji o modelu
- Aktualizacja dopasowanych modeli
- Uogólnione modele liniowe
- Rodziny
- Funkcja glm()
- Klasyfikacja
- Regresja logistyczna
- Liniowa analiza dyskryminacyjna
- Uczenie się bez nadzoru
- Analiza składowych głównych
- Metody grupowania (k-średnich, hierarchiczne grupowanie, k-medoidy)
5. Analiza przeżywalności (pakiet survival)
- Obiekty przeżycia w r
- Oszacowanie Kaplana-Meiera, test log-rank, regresja parametryczna
- Przedziały ufności
- Analiza danych cenzurowanych (cenzurowanych interwałowo)
- Modele Coxa PH, stałe zmienne towarzyszące
- Modele Coxa PH, zmienne zależne od czasu
- Symulacja: Porównanie modeli (porównanie modeli regresji)
6. Analiza wariancji
- Jednoczynnikowa ANOVA
- Dwukierunkowa klasyfikacja ANOVA
- MANOVA
III. Problemy praktyczne w bioinformatyce
- Krótkie wprowadzenie do pakietu limma
- Przebieg analizy danych z mikromacierzy
- Pobieranie danych z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Przetwarzanie danych (QC, normalizacja, ekspresja różnicowa)
- Wykres wulkanu
- Przykłady analizy + mapy cieplne
Opinie uczestników (5)
jak trener prezentuje swoją wiedzę z tematu, który uczy
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Szkolenie - Data Vault: Building a Scalable Data Warehouse
Przetłumaczone przez sztuczną inteligencję
pozytywna atmosfera na szkoleniu
Piotr Wojciechowski - Centrum Informatyki Resortu Finansow
Szkolenie - Data Mining with Python
Bardzo przydatne, ponieważ pomaga mi zrozumieć, co możemy zrobić z danymi w naszym kontekście. Będzie mi to również pomocne.
Nicolas NEMORIN - Adecco Groupe France
Szkolenie - KNIME Analytics Platform for BI
Przetłumaczone przez sztuczną inteligencję
Czyście cieszyłem się z ćwiczeń na żywo.
Yunfa Zhu - Environmental and Climate Change Canada
Szkolenie - Foundation R
Przetłumaczone przez sztuczną inteligencję
Tempo było właściwe, a luźna atmosfera sprawiała, że kandydaci czuli się swobodnie, zadając pytania.
Rhian Hughes - Public Health Wales NHS Trust
Szkolenie - Introduction to Data Visualization with Tidyverse and R
Przetłumaczone przez sztuczną inteligencję