Plan Szkolenia

Przegląd: Big Data

  • Co to jest Big Data
  • Dlaczego Big Data zyskuje na popularności
  • Studia przypadku Big Data
  • Cechy Big Data
  • Rozwiązania do pracy z Big Data.

Hadoop i jego komponenty:

  • Co to jest Hadoop i jakie są jego komponenty.
  • Architektura Hadoop i cechy danych, które może obsługiwać/Przetwarzać.
  • Krótki przegląd historii Hadoop, firm używających go i dlaczego zaczęły go stosować.
  • Szczegółowe omówienie ramki Hadoop i jego komponentów.
  • Co to jest HDFS i czytanie – zapisywanie do rozproszonego systemu plików Hadoop.
  • Jak skonfigurować klastr Hadoop w różnych trybach – Stand-alone/Pseudo/Multi Node cluster.

(To obejmuje skonfigurowanie klastru Hadoop w VirtualBox/KVM/VMware, konfiguracje sieciowe, które należy dokładnie sprawdzić, uruchamianie demonów Hadoop i testowanie klastru).

  • Co to jest ramka Map Reduce i jak działa.
  • Uruchamianie zadań Map Reduce na klastrze Hadoop.
  • Zrozumienie replikacji, lustrzania i świadomości szuflady w kontekście klastrów Hadoop.

Planowanie klastru Hadoop:

  • Jak zaplanować klastr Hadoop.
  • Zrozumienie sprzętu-oprogramowania do zaplanowania klastru Hadoop.
  • Zrozumienie obciążeń i planowanie klastru w celu uniknięcia awarii i optymalnego działania.

Co to jest MapR i dlaczego MapR:

  • Przegląd MapR i jego architektury.
  • Zrozumienie i działanie MapR Control System, MapR Volumes, snapshotów i luster.
  • Planowanie klastru w kontekście MapR.
  • Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
  • Instalacja MapR i wdrażanie klastru.

Konfiguracja i administracja klastru:

  • Zarządzanie usługami, węzłami, snapshotami, lustrzanymi woluminami i zdalnymi klastrami.
  • Zrozumienie i zarządzanie węzłami.
  • Zrozumienie komponentów Hadoop, instalowanie komponentów Hadoop wraz z usługami MapR.
  • Accessowanie danych w klastrze, w tym za pomocą NFS Zarządzanie usługami i węzłami.
  • Zarządzanie danymi za pomocą woluminów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról do węzłów, komisjonowanie/dekomisjonowanie węzłów, administracja klastrami i monitorowanie wydajności, konfigurowanie/analizowanie i monitorowanie metryk w celu monitorowania wydajności, konfigurowanie i administrowanie bezpieczeństwem MapR.
  • Zrozumienie i praca z M7 – natywnym magazynowaniem dla tabel MapR.
  • Konfiguracja i dostrajanie klastru dla optymalnej wydajności.

Aktualizacja klastru i integracja z innymi ustawieniami:

  • Aktualizowanie wersji oprogramowania MapR i typy aktualizacji.
  • Konfigurowanie klastru MapR do dostępu do klastru HDFS.
  • Uruchamianie klastru MapR na Amazon Elastic Mapreduce.

Wszystkie powyższe tematy obejmują demonstracje i sesje praktyczne dla uczących się, aby mieli doświadczenie z technologią.

Wymagania

  • Podstawowa wiedza o Linux FS
  • Podstawowe Java
  • Wiedza o Apache Hadoop (polecane)
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie