Plan Szkolenia

Wprowadzenie

  • Przegląd Databricks i Apache Spark
  • Zrozumienie architektury Databricks

Pierwsze kroki

  • Konfigurowanie środowiska
  • Konfigurowanie i konfigurowanie Databricks
  • Poruszanie się po interfejsie użytkownika Databricks
  • Tworzenie obszaru roboczego Databricks

Praca z danymi w Databricks

  • Łączenie się ze źródłem danych Apache Spark
  • Zrozumienie podstawowych kolumn i typów danych
  • Zarządzanie systemem plików w Notatnikach

Zarządzanie zadaniami i klastrami

  • Tworzenie i konfigurowanie klastrów
  • Tworzenie zadań przy użyciu Notebook
  • Uruchamianie zadań
  • Przeglądanie zadań i ich szczegółów

Korzystanie z Delta Lake w Databricks

  • Ładowanie danych do Delta Lake
  • Zarządzanie danymi w Delta Lake

Zabezpieczanie Databricks

  • Zarządzanie zabezpieczeniami Databricks
  • Zarządzanie kopiami zapasowymi i odzyskiwaniem

Rozwiązywanie problemów

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowe zrozumienie analityki danych
  • Znajomość Apache Spark

Uczestnicy

  • Inżynierowie danych
  • Naukowcy zajmujący się danymi
  • Programiści
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie