Data Mining and Analysis - Plan Szkolenia
Cel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Plan Szkolenia
-
Wstępne przetwarzanie danych
- Data Cleaning
- Integracja i transformacja danych
- Redukcja danych
- Dyskretyzacja i generowanie hierarchii pojęć
-
Wnioskowanie statystyczne
- Rozkłady prawdopodobieństwa, zmienne losowe, centralne twierdzenie graniczne
- Pobieranie próbek
- Przedziały ufności
- Wnioskowanie statystyczne
- Testowanie hipotez
-
Wielowymiarowa regresja liniowa
- Specyfikacja
- Wybór podzbioru
- Estymacja
- Walidacja
- Przewidywanie
-
Metody klasyfikacji
- Regresja logistyczna
- Liniowa analiza dyskryminacyjna
- K-najbliżsi sąsiedzi
- Naiwny Bayes
- Porównanie metod klasyfikacji
-
Neural Networks
- Dopasowywanie sieci neuronowych
- Zagadnienia związane z trenowaniem sieci neuronowych
-
Drzewa decyzyjne
- Drzewa regresji
- Drzewa klasyfikacyjne
- Drzewa a modele liniowe
-
Bagging, Random Forest s, Boosting
- Bagging
- Random Forests
- Boosting
-
Maszyny wektorów nośnych i elastyczne rozwiązanie
- Klasyfikator z maksymalnym marginesem
- Klasyfikatory wektorów nośnych
- Maszyny wektorów nośnych
- 2 i więcej klas SVM
- Związek z regresją logistyczną
-
Analiza składowych głównych
-
Klasteryzacja
- Klasteryzacja K-średnich
- Klastrowanie K-średnich
- Klastrowanie hierarchiczne
- Klastrowanie oparte na gęstości
-
Ocena i wybór modelu
- Odchylenie, wariancja i złożoność modelu
- Błąd predykcji w próbce
- Podejście bayesowskie
- Walidacja krzyżowa
- Metody Bootstrap
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining and Analysis - Plan Szkolenia - Booking
Data Mining and Analysis - Plan Szkolenia - Enquiry
Data Mining and Analysis - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (7)
Forma przekazania wiedzy poprzez dokładne wyjaśnienie zagadnienia.
Katarzyna Stanczak - Mowi Poland SA
Szkolenie - Data Mining and Analysis
Bardzo dobrze przekazywana wiedza przez prowadzącego.Brak pytań bez odpowiedzi.
Karolin Papaj - Mowi Poland SA
Szkolenie - Data Mining and Analysis
Otrzymałem korzyść z wsparcia, dzielenia się przykładami z życia oraz odpowiedzi na wszystkie pytania.
Marta Melloch - Amazon Development Center Poland Sp. z o.o.
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Nie mogę pomóc.
Halil polat - Amazon Development Center Poland Sp. z o.o.
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Informacje, które otrzymałem były ciekawe, a najlepsza część była pod koniec, gdy otrzymaliśmy dane od Durex i pracowaliśmy z danymi, z którymi jesteśmy zaznajomieni, a także wykonywaliśmy operacje, aby uzyskać wyniki.
Jessica Chaar
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Trening praktyczny i zdolność trenera do wyjaśniania złożonych tematów w prosty sposób.
youssef chamoun
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
I like the exercises completed.
Nour Assaf
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
Algorithmic Trading with Python and R
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla analityków biznesowych, którzy chcą zautomatyzować handel za pomocą handlu algorytmicznego, Python i R.
Pod koniec tego szkolenia uczestnicy będą mogli
- Stosować algorytmy do szybkiego kupowania i sprzedawania papierów wartościowych w wyspecjalizowanych przyrostach.
- Zmniejszyć koszty związane z handlem przy użyciu handlu algorytmicznego.
- Automatycznie monitorować ceny akcji i zawierać transakcje.
Programming with Big Data in R
21 godzinBig Data to termin odnoszący się do rozwiązań przeznaczonych do przechowywania i przetwarzania dużych zbiorów danych. Opracowane początkowo przez Google rozwiązania Big Data ewoluowały i zainspirowały inne podobne projekty, z których wiele jest dostępnych jako open-source. R jest popularnym językiem programowania w branży finansowej.
Introductory R (Basic to Intermediate)
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla początkujących analityków danych, którzy chcą używać programowania R do manipulowania danymi, przeprowadzania podstawowej analizy danych i tworzenia atrakcyjnych wizualizacji w celu uzyskania wglądu.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zrozumieć podstawy R Programming.
- Zastosować podstawowe procesy nauki o danych.
- Tworzyć wizualne reprezentacje danych.
Cluster Analysis with R and SAS
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla analityków danych, którzy chcą programować z R w SAS do analizy skupień.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Wykorzystanie analizy skupień do eksploracji danych
- Opanowanie składni języka R dla rozwiązań klastrowania.
- Wdrażanie hierarchicznego i niehierarchicznego klastrowania.
- Podejmowanie decyzji opartych na danych w celu usprawnienia operacji biznesowych.
Data and Analytics - from the ground up
42 godzinAnalityka danych jest dziś kluczowym narzędziem w biznesie. Skoncentrujemy się na rozwijaniu umiejętności praktycznej analizy danych. Celem jest pomoc delegatom w udzielaniu opartych na dowodach odpowiedzi na pytania:
Co się stało?
- przetwarzanie i analizowanie danych
- tworzenie informacyjnych wizualizacji danych
Co się stanie?
- Prognozowanie przyszłych wyników
- ocena prognoz
Co powinno się stać?
- przekształcanie danych w decyzje biznesowe oparte na dowodach
- optymalizacja procesów
Sam kurs może być prowadzony jako 6-dniowy kurs stacjonarny lub zdalnie przez okres kilku tygodni, jeśli wolisz. Możemy współpracować z Tobą, aby zapewnić kurs najlepiej odpowiadający Twoim potrzebom.
Data Analysis with Python, R, Power Query, and Power BI
21 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla początkujących profesjonalistów, którzy chcą czyścić i analizować dane, tworzyć prognozy statystyczne i tworzyć wnikliwe wizualizacje za pomocą tych narzędzi.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zrozumieć podstawy Python, R, Power Query i Power BI do analizy danych.
- Czyścić i organizować zbiory danych za pomocą Python i Power Query.
- Wykonywanie analiz statystycznych i prognoz za pomocą R.
- Tworzenie profesjonalnych pulpitów nawigacyjnych i raportów za pomocą Power BI.
- Skutecznie integrować i analizować dane z wielu źródeł.
Data Analytics With R
21 godzinR to bardzo popularne środowisko open source do obliczeń statystycznych, analizy danych i grafiki. Ten kurs wprowadza studentów w język programowania R. Obejmuje podstawy języka, biblioteki i zaawansowane koncepcje. Zaawansowana analiza danych i wykresy z rzeczywistymi danymi.
Odbiorcy
Programiści / analityka danych
Czas trwania
3 dni
Format
Wykłady i ćwiczenia praktyczne
Data Mining z wykorzystaniem R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Mining & Machine Learning with R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Econometrics: Eviews and Risk Simulator
21 godzinTo prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla każdego, kto chce nauczyć się i opanować podstawy analizy ekonometrycznej i modelowania.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Poznanie i zrozumienie podstaw ekonometrii.
- Używaj Eviews i symulatorów ryzyka.
HR Analytics for Public Organisations
14 godzinTo prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) jest skierowane do specjalistów HR, którzy chcą korzystać z metod analitycznych w celu poprawy wyników organizacji. Kurs obejmuje zarówno podejścia jakościowe, jak i ilościowe, empiryczne i statystyczne.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami.
Statistical Analysis using SPSS
21 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średnio zaawansowanych profesjonalistów, którzy chcą przeprowadzić analizę statystyczną przy użyciu SPSS w celu dokładnej interpretacji danych, przeprowadzenia złożonych testów statystycznych i wygenerowania znaczących spostrzeżeń.
Pod koniec tego szkolenia uczestnicy będą mogli
- Poruszać się po interfejsie SPSS i efektywnie zarządzać zestawami danych.
- Przeprowadzać opisowe i wnioskowe analizy statystyczne.
- Przeprowadzać testy t, ANOVA, MANOVA, regresję i analizy korelacji.
- Stosować testy nieparametryczne, analizę składowych głównych i analizę czynnikową w celu zaawansowanej interpretacji danych.
Talent Acquisition Analytics
14 godzinTo prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) jest skierowane do specjalistów HR i specjalistów ds. rekrutacji, którzy chcą korzystać z metod analitycznych w celu poprawy wydajności organizacji. Kurs obejmuje zarówno podejścia jakościowe, jak i ilościowe, empiryczne i statystyczne.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
Opcje dostosowania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami.
Introduction to Data Visualization with Tidyverse and R
7 godzinTidyverse to zbiór wszechstronnych pakietów R do czyszczenia, przetwarzania, modelowania i wizualizacji danych. Niektóre z zawartych pakietów to: ggplot2, dplyr, tidyr, readr, purrr i tibble.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak manipulować danymi i wizualizować je za pomocą narzędzi zawartych w Tidyverse.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Przeprowadzanie analizy danych i tworzenie atrakcyjnych wizualizacji
- Wyciąganie użytecznych wniosków z różnych zestawów przykładowych danych
- Filtrowanie, sortowanie i podsumowywanie danych w celu uzyskania odpowiedzi na pytania eksploracyjne
- Przekształcanie przetworzonych danych w pouczające wykresy liniowe, słupkowe i histogramy
- Importowanie i filtrowanie danych z różnych źródeł danych, w tym plików Excel, CSV i SPSS
Uczestnicy
- Początkujący użytkownicy języka R
- Początkujący w analizie i wizualizacji danych
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna