Data Science with KNIME Analytics Platform - Plan Szkolenia
KNIME Analytics Platform to wiodąca opcja open source dla innowacji opartych na danych, pomagająca odkrywać potencjał ukryty w danych, wydobywać nowe spostrzeżenia lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułom, setkom gotowych do uruchomienia przykładów, szerokiej gamie zintegrowanych narzędzi i najszerszemu dostępnemu wyborowi zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego analityka danych i analityka biznesowego.
Ten kurs dla KNIME Analytics Platform jest idealną okazją dla początkujących, zaawansowanych użytkowników i KNIME ekspertów, aby zapoznać się z KNIME, dowiedzieć się, jak korzystać z niego bardziej efektywnie i jak tworzyć przejrzyste, kompleksowe raporty oparte na KNIME przepływy pracy
Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla specjalistów ds. danych, którzy chcą wykorzystać KNIME do rozwiązywania złożonych potrzeb biznesowych.
Jest skierowany do odbiorców, którzy nie znają programowania i zamierzają korzystać z najnowocześniejszych narzędzi do wdrażania scenariuszy analitycznych
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja KNIME.
- Tworzenie scenariuszy Data Science
- Trenuj, testuj i waliduj modele
- Wdrażanie kompleksowego łańcucha wartości modeli Data Science
Format kursu
- Interaktywny wykład i dyskusja.
- Dużo ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku live-lab.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu lub dowiedzieć się więcej na temat tego programu, skontaktuj się z nami.
Plan Szkolenia
Dzień 1:
Moduł 1: KNIME Platforma analityczna: Przegląd
- Instalacja
- Uruchamianie i dostosowywanie KNIME Analytics Platform
- Węzły, dane i przepływy pracy
- Cykl nauki o danych
Moduł 2: Dane Access
- Odczyt danych z pliku
- Usługi REST Access
Moduł 3: ETL i manipulacja danymi
- Filtrowanie wierszy i kolumn
- Agregatory
- Łączenie i konkatenacja
- Transformacja: Konwersja, zastępowanie, standaryzacja i generowanie nowych funkcji
- Przygotowanie danych do analizy szeregów czasowych
Dzień 2:
Moduł 4: Eksportowanie danych
- Zapis do pliku
- Generowanie raportu
Moduł 5: Data Visualization
- Interaktywna eksploracja wizualna dla wielu zmiennych
- Interaktywna wielowymiarowa eksploracja wizualna
- Zaawansowane funkcje wizualizacji
Moduł 6: Predictive Analytics Korzystanie z KNIME
- Data Mining Podstawowe pojęcia
- Regresja
- Rodzina drzew decyzyjnych
- Ocena modelu
Dzień 3:
Moduł 7: Kontrolowanie przepływu
- Parametryzacja przepływu pracy: Zmienne przepływu
- Ponowne wykonywanie części przepływu pracy: Pętle
- Czyszczenie przepływu pracy
Moduł 8: Praktyczne zastosowanie KNIME Studium przypadku oparte na platformie analitycznej
Wymagania
Zalecane
- Podstawowe zrozumienie sensu danych.
- Doświadczenie w podstawowym przetwarzaniu danych.
Uczestnicy
- analitycy danych
- data scientists
- analitycy biznesowi
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Science with KNIME Analytics Platform - Plan Szkolenia - Booking
Data Science with KNIME Analytics Platform - Plan Szkolenia - Enquiry
Data Science with KNIME Analytics Platform - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (1)
Trener tłumaczył zagadnienia korzystając z problemów pojawiających się w codziennej pracy.
Kamil
Szkolenie - Data Science with KNIME Analytics Platform
Propozycje terminów
Szkolenia Powiązane
Introduction to Data Science and AI using Python
35 godzinJest to 5-dniowe wprowadzenie do Data Science i sztucznej inteligencji (AI).
Kurs obejmuje przykłady i ćwiczenia z wykorzystaniem Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest skierowane do średnio zaawansowanych uczestników, którzy chcą zautomatyzować i zarządzać przepływami pracy uczenia maszynowego, w tym szkoleniem modeli, walidacją i wdrażaniem przy użyciu Apache Airflow.
Pod koniec tego szkolenia uczestnicy będą mogli
- Skonfigurować Apache Airflow do orkiestracji przepływu pracy uczenia maszynowego.
- Zautomatyzować wstępne przetwarzanie danych, szkolenie modeli i zadania walidacji.
- Zintegrować Airflow z platformami i narzędziami uczenia maszynowego.
- Wdrażanie modeli uczenia maszynowego przy użyciu zautomatyzowanych potoków.
- Monitorowanie i optymalizacja przepływów pracy uczenia maszynowego w środowisku produkcyjnym.
Anaconda Ecosystem for Data Scientists
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą korzystać z ekosystemu Anaconda do przechwytywania, zarządzania i wdrażania pakietów i przepływów pracy analizy danych na jednej platformie.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować komponenty i biblioteki Anaconda.
- Zrozumieć podstawowe pojęcia, funkcje i zalety Anaconda.
- Zarządzać pakietami, środowiskami i kanałami za pomocą Anaconda Navigator.
- Używanie pakietów Conda, R i Python do nauki o danych i uczenia maszynowego.
- Poznanie praktycznych przypadków użycia i technik zarządzania wieloma środowiskami danych.
AWS Cloud9 for Data Science
28 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla średnio zaawansowanych analityków danych i analityków, którzy chcą korzystać z AWS Cloud9 w celu usprawnienia przepływów pracy w nauce o danych.
Pod koniec tego szkolenia uczestnicy będą mogli
- Skonfigurować środowisko nauki o danych w AWS Cloud9.
- Przeprowadzać analizę danych przy użyciu Python, R i Jupyter Notebook w Cloud9.
- Zintegrować AWS Cloud9 z usługami danych AWS, takimi jak S3, RDS i Redshift.
- Wykorzystanie AWS Cloud9 do opracowywania i wdrażania modeli uczenia maszynowego.
- Optymalizacja przepływów pracy w chmurze do analizy i przetwarzania danych.
Big Data Business Intelligence for Telecom & Communication Service Providers
35 godzinPrzegląd
Communication Dostawcy usług (CSP) stoją w obliczu presji na redukcję kosztów i maksymalizację średniego przychodu na użytkownika (ARPU), przy jednoczesnym zapewnieniu doskonałego doświadczenia klienta, ale ilość danych wciąż rośnie. Globalny ruch danych w sieciach komórkowych będzie rósł w tempie 78% rocznie (CAGR) do 2016 roku, osiągając 10,8 eksabajtów miesięcznie.
W międzyczasie CSP generują duże ilości danych, w tym rejestry szczegółów połączeń (CDR), dane sieciowe i dane klientów. Firmy, które w pełni wykorzystują te dane, zyskują przewagę konkurencyjną. Według niedawnego badania przeprowadzonego przez The Economist Intelligence Unit, firmy, które wykorzystują podejmowanie decyzji w oparciu o dane, cieszą się 5-6% wzrostem produktywności. Jednak 53% firm wykorzystuje tylko połowę swoich cennych danych, a jedna czwarta respondentów zauważyła, że ogromne ilości przydatnych danych pozostają niewykorzystane. Ilość danych jest tak duża, że ich ręczna analiza jest niemożliwa, a większość starszych systemów oprogramowania nie nadąża, przez co cenne dane są odrzucane lub ignorowane.
Dzięki szybkiemu, skalowalnemu oprogramowaniu Big Data & Analytics&rsquo, dostawcy usług CSP mogą wydobywać wszystkie swoje dane w celu podejmowania lepszych decyzji w krótszym czasie. Różne produkty i techniki Big Data zapewniają kompleksową platformę oprogramowania do gromadzenia, przygotowywania, analizowania i prezentowania wniosków z dużych zbiorów danych. Obszary zastosowań obejmują monitorowanie wydajności sieci, wykrywanie oszustw, wykrywanie rezygnacji klientów i analizę ryzyka kredytowego. Produkty Big Data & Analytics skalują się do obsługi terabajtów danych, ale wdrożenie takich narzędzi wymaga nowego rodzaju systemu baz danych opartego na chmurze, takiego jak Hadoop lub masowego procesora obliczeń równoległych (KPU itp.).
Ten kurs na temat Big Data BI dla Telco obejmuje wszystkie pojawiające się nowe obszary, w które CSP inwestują w celu zwiększenia produktywności i otwarcia nowego strumienia przychodów biznesowych. Kurs zapewni pełny 360-stopniowy przegląd Big Data BI w Telco, dzięki czemu decydenci i menedżerowie będą mieli bardzo szeroki i kompleksowy przegląd możliwości Big Data BI w Telco w celu zwiększenia produktywności i przychodów.
Cele kursu
Głównym celem kursu jest wprowadzenie nowych technik analityki biznesowej Big Data w 4 sektorach Telecom biznesu (marketing / sprzedaż, operacje sieciowe, operacje finansowe i zarządzanie relacjami z klientami). Studenci zostaną zapoznani z następującymi zagadnieniami:
- Wprowadzenie do Big Data - czym są 4V (objętość, szybkość, różnorodność i prawdziwość) w Big Data - generowanie, ekstrakcja i zarządzanie z perspektywy Telco
- Czym różni się analityka Big Data od dotychczasowej analityki danych
- Wewnętrzne uzasadnienie Big Data - perspektywa Telco
- Wprowadzenie do ekosystemu Hadoop - znajomość wszystkich narzędzi Hadoop, takich jak Hive, Pig, SPARC – kiedy i jak są one wykorzystywane do rozwiązywania problemów Big Data
- W jaki sposób Big Data są pozyskiwane do analizy w narzędziach analitycznych - w jaki sposób analiza biznesowa może zmniejszyć ból związany z gromadzeniem i analizą danych dzięki zintegrowanemu podejściu do pulpitu nawigacyjnego Hadoop
- Podstawowe wprowadzenie do analityki Insight, analityki wizualizacyjnej i analityki predykcyjnej dla Telco
- Analityka rezygnacji klientów i Big Data - jak analityka Big Data może zmniejszyć rezygnację klientów i niezadowolenie klientów w Telco - studia przypadków
- Analiza awarii sieci i usług na podstawie metadanych sieciowych i IPDR
- Analiza finansowa - oszustwa, marnotrawstwo i szacowanie ROI na podstawie danych sprzedażowych i operacyjnych
- Problem pozyskiwania klientów - marketing docelowy, segmentacja klientów i sprzedaż krzyżowa na podstawie danych sprzedażowych
- Wprowadzenie i podsumowanie wszystkich produktów analitycznych Big Data i ich miejsca w przestrzeni analitycznej Telco
- Podsumowanie - jak krok po kroku wprowadzić Big Data Business Intelligence w swojej organizacji
Docelowi odbiorcy
- Operacje sieciowe, menedżerowie finansowi, menedżerowie CRM i najlepsi menedżerowie IT w biurze Telco CIO.
- Business Analitycy w Telco
- Menedżerowie/analitycy biura CFO
- Menedżerowie operacyjni
- Menedżerowie QA
Introduction to Google Colab for Data Science
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla początkujących naukowców zajmujących się danymi i specjalistów IT, którzy chcą nauczyć się podstaw nauki o danych przy użyciu Google Colab.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Konfigurować i nawigować Google Colab.
- Pisać i wykonywać podstawowy Python kod.
- Importować i obsługiwać zestawy danych.
- Tworzyć wizualizacje przy użyciu bibliotek Python.
A Practical Introduction to Data Science
35 godzinUczestnicy, którzy ukończą to szkolenie, zdobędą praktyczne, rzeczywiste zrozumienie Data Science i powiązanych z nim technologii, metodologii i narzędzi.
Uczestnicy będą mieli okazję wykorzystać tę wiedzę w praktyce poprzez praktyczne ćwiczenia. Interakcja w grupie i informacje zwrotne od instruktora stanowią ważny element zajęć.
Kurs rozpoczyna się od wprowadzenia do podstawowych pojęć Data Science, a następnie przechodzi do narzędzi i metodologii stosowanych w Data Science.
Uczestnicy
- Deweloperzy
- Analitycy techniczni
- Konsultanci IT
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Uwaga
- Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Kaggle
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą uczyć się i budować swoją karierę w Data Science za pomocą Kaggle.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Dowiedzieć się o nauce o danych i uczeniu maszynowym.
- Poznaj analitykę danych.
- Dowiedzieć się o Kaggle i jak to działa.
KNIME Analytics Platform for BI
21 godzinKNIME Analytics Platform to wiodąca opcja open source dla innowacji opartych na danych, pomagająca odkryć potencjał ukryty w danych, wydobywać nowe spostrzeżenia lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułom, setkom gotowych do uruchomienia przykładów, szerokiej gamie zintegrowanych narzędzi i najszerszemu dostępnemu wyborowi zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego analityka danych i analityka biznesowego.
Ten kurs dla KNIME Analytics Platform to idealna okazja dla początkujących, zaawansowanych użytkowników i ekspertów KNIME, aby zapoznać się z KNIME, dowiedzieć się, jak korzystać z niego bardziej efektywnie i jak tworzyć przejrzyste, kompleksowe raporty oparte na przepływach pracy KNIME
Platforma analityczna KNIME - szkolenie kompleksowe
35 godzinSzkolenie "Platforma analityczna KNIME" oferuje kompleksowy przegląd tej bezpłatnej platformy analizy danych. Program obejmuje wprowadzenie do przetwarzania i analizy danych, instalację i konfigurację KNIME, budowanie workflow, metodologię tworzenia modeli biznesowych i modelowania danych. Kurs również omawia narzędzia zaawansowanej analizy danych, import i eksport workflow, integrację narzędzi, procesy ETL, eksplorację danych, wizualizację, rozszerzenia i integracje z narzędziami takimi jak R, Java, Python, Gephi, Neo4j. Zakończenie obejmuje omówienie raportowania, integracji z BIRT i KNIME WebPortal.
KNIME with Python and R for Machine Learning
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą programować w Python i R dla KNIME.
Pod koniec tego szkolenia uczestnicy będą mogli
- Planować, budować i wdrażać modele uczenia maszynowego w KNIME.
- Podejmować decyzje oparte na danych dla operacji.
- Wdrażać kompleksowe projekty nauki o danych.
Accelerating Python Pandas Workflows with Modin
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać Modin do tworzenia i wdrażania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko, aby rozpocząć opracowywanie Pandas przepływów pracy na dużą skalę z Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Znać różnice między Modin, Dask i Ray.
- Szybsze wykonywanie operacji Pandas za pomocą Modin.
- Wdrożenie całego interfejsu API i funkcji Pandas.
GPU Data Science with NVIDIA RAPIDS
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać RAPIDS do tworzenia GPU przyspieszonych potoków danych, przepływów pracy i wizualizacji, stosując algorytmy uczenia maszynowego, takie jak XGBoost, cuML itp.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko programistyczne do tworzenia modeli danych za pomocą NVIDIA RAPIDS.
- Zrozumieć funkcje, komponenty i zalety RAPIDS.
- Wykorzystać GPU do przyspieszenia kompleksowych potoków danych i analiz.
- Wdrożenie akcelerowanego przez GPU przygotowywania danych i ETL za pomocą cuDF i Apache Arrow.
- Dowiedz się, jak wykonywać zadania uczenia maszynowego za pomocą algorytmów XGBoost i cuML.
- Twórz wizualizacje danych i wykonuj analizę wykresów za pomocą cuXfilter i cuGraph.