Plan Szkolenia

Zaawansowana analiza danych z użyciem Spark

Big Data w chmurze

Studia przypadku i najlepsze praktyki

Przetwarzanie danych z użyciem Apache Spark

Wprowadzenie do Google Colab i Apache Spark

Optymalizacja przepływów pracy Big Data

Podsumowanie i następne kroki

Wizualizacja i Collaboration w Google Colab

  • Integracja Colab z popularnymi bibliotekami wizualizacyjnymi
  • Współpracujące przepływy pracy z notebookami Colab
  • Udostępnianie i eksportowanie wyników
  • Integracja Google Colab z narzędziami chmurowymi
  • Używanie chmurowego przechowywania dla big data
  • Praca z Spark w rozproszonych środowiskach chmurowych
  • Maszynowe uczenie z Spark MLlib
  • Wykonywanie analizy danych w czasie rzeczywistym
  • Rozproszone obliczenia z użyciem Spark
  • Przegląd Google Colab
  • Wprowadzenie do Apache Spark
  • Konfiguracja Spark w Google Colab
  • Przegląd rzeczywistych zastosowań big data
  • Studia przypadku z użyciem Apache Spark i Colab
  • Najlepsze praktyki dla analizy big data
  • Dostrajanie Spark do osiągania lepszej wydajności
  • Optymalizacja użycia pamięci i przestrzeni dyskowej
  • Skalowanie przepływów pracy dla dużych zestawów danych
  • Praca z RDD i DataFrames
  • Ładowanie i przetwarzanie dużych zestawów danych
  • Używanie Spark SQL do zapytania o strukturyzowane dane

Wymagania

Grupa docelowa

  • Podstawowa znajomość pojęć związanych z nauką danych
  • Zapoznanie z Apache Spark
  • Umiejętności programowania Python
  • Specjaliści ds. analizy danych
  • Inżynierowie danych
  • Badacze pracujący z wielkimi danymi
 14 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie