Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Przegląd: Big Data
- Co to jest Big Data
- Dlaczego Big Data zyskuje na popularności
- Studia przypadku Big Data
- Cechy Big Data
- Rozwiązania do pracy z Big Data.
Hadoop i jego komponenty:
- Co to jest Hadoop i jakie są jego komponenty.
- Architektura Hadoop i cechy danych, które może obsługiwać/Przetwarzać.
- Krótki przegląd historii Hadoop, firm używających go i dlaczego zaczęły go stosować.
- Szczegółowe omówienie ramki Hadoop i jego komponentów.
- Co to jest HDFS i czytanie – zapisywanie do rozproszonego systemu plików Hadoop.
- Jak skonfigurować klastr Hadoop w różnych trybach – Stand-alone/Pseudo/Multi Node cluster.
(To obejmuje skonfigurowanie klastru Hadoop w VirtualBox/KVM/VMware, konfiguracje sieciowe, które należy dokładnie sprawdzić, uruchamianie demonów Hadoop i testowanie klastru).
- Co to jest ramka Map Reduce i jak działa.
- Uruchamianie zadań Map Reduce na klastrze Hadoop.
- Zrozumienie replikacji, lustrzania i świadomości szuflady w kontekście klastrów Hadoop.
Planowanie klastru Hadoop:
- Jak zaplanować klastr Hadoop.
- Zrozumienie sprzętu-oprogramowania do zaplanowania klastru Hadoop.
- Zrozumienie obciążeń i planowanie klastru w celu uniknięcia awarii i optymalnego działania.
Co to jest MapR i dlaczego MapR:
- Przegląd MapR i jego architektury.
- Zrozumienie i działanie MapR Control System, MapR Volumes, snapshotów i luster.
- Planowanie klastru w kontekście MapR.
- Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
- Instalacja MapR i wdrażanie klastru.
Konfiguracja i administracja klastru:
- Zarządzanie usługami, węzłami, snapshotami, lustrzanymi woluminami i zdalnymi klastrami.
- Zrozumienie i zarządzanie węzłami.
- Zrozumienie komponentów Hadoop, instalowanie komponentów Hadoop wraz z usługami MapR.
- Accessowanie danych w klastrze, w tym za pomocą NFS Zarządzanie usługami i węzłami.
- Zarządzanie danymi za pomocą woluminów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról do węzłów, komisjonowanie/dekomisjonowanie węzłów, administracja klastrami i monitorowanie wydajności, konfigurowanie/analizowanie i monitorowanie metryk w celu monitorowania wydajności, konfigurowanie i administrowanie bezpieczeństwem MapR.
- Zrozumienie i praca z M7 – natywnym magazynowaniem dla tabel MapR.
- Konfiguracja i dostrajanie klastru dla optymalnej wydajności.
Aktualizacja klastru i integracja z innymi ustawieniami:
- Aktualizowanie wersji oprogramowania MapR i typy aktualizacji.
- Konfigurowanie klastru MapR do dostępu do klastru HDFS.
- Uruchamianie klastru MapR na Amazon Elastic Mapreduce.
Wszystkie powyższe tematy obejmują demonstracje i sesje praktyczne dla uczących się, aby mieli doświadczenie z technologią.
Wymagania
- Podstawowa wiedza o Linux FS
- Podstawowe Java
- Wiedza o Apache Hadoop (polecane)
28 godzin
Opinie uczestników (1)
Praktyczne sprawy zostały dobrze wykonane, a także teoria została dobrze przedstawiona przez Ajaya.
Dominik Mazur - Capgemini Polska Sp. z o.o.
Szkolenie - Hadoop Administration on MapR
Przetłumaczone przez sztuczną inteligencję