Plan Szkolenia

  1. Podstawy Big Data
    • Big Data i jego rola w świecie korporacji
    • Fazy rozwoju strategii Big Data w korporacji
    • Wyjaśnij przesłanki leżące u podstaw holistycznego podejścia do Big Data
    • Komponenty potrzebne w Big Data platformie
    • Rozwiązanie do przechowywania dużych ilości danych
    • Granice tradycyjnych technologii
    • Przegląd typów baz danych
    • Cztery wymiary Big Data
  2. Wpływ Big Data na biznes
    • Business znaczenie Big Data
    • Wyzwania związane z wydobywaniem użytecznych danych
    • Integracja Big Data z tradycyjnymi danymi
  3. Technologie przechowywania dużych zbiorów danych
    • Przegląd technologii big data
      • Modele przechowywania danych
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Wybór właściwej technologii Big Data
  4. Przetwarzanie dużych zbiorów danych
    • Łączenie i wyodrębnianie danych z bazy danych
    • Przekształcanie i przygotowanie danych do przetwarzania
    • Używanie Hadoop MapReduce do przetwarzania rozproszonych danych
    • Monitorowanie i wykonywanie Hadoop zadań MapReduce
    • Hadoop elementy składowe rozproszonego systemu plików
    • Mapreduce i Yarn
    • Obsługa danych przesyłanych strumieniowo za pomocą platformy Spark
  5. Narzędzia i technologie analizy dużych zbiorów danych
    • Programming Hadoop z językiem łaciny świni
    • Wysyłanie zapytań do dużych zbiorów danych za pomocą Hive
    • Wydobywanie danych za pomocą Mahout
    • Narzędzia do wizualizacji i raportowania
  6. Big data w biznesie
    • Zarządzanie i ustalanie Big Data potrzeb
    • Business znaczenie Big Data
    • Wybór odpowiednich narzędzi Big Data do problemu

Koncepcje hurtowni danych

  • Co to jest Data Ware House?
  • Różnica między OLTP a obudową Data Ware
  • Pozyskiwanie danych
  • Ekstrakcja danych
  • Transformacja danych.
  • Ładowanie danych
  • Data Marty
  • Dane zależne i niezależne Mart
  • Projekt bazy danych

Koncepcje testowania ETL:

  • Wstęp.
  • Cykl życia oprogramowania.
  • Metodyki testowania.
  • Proces przepływu pracy podczas testowania ETL.
  • Obowiązki testowania ETL na etapie danych.

Podstawy Big Data

  • Big Data i jego rola w świecie korporacji
  • Fazy rozwoju strategii Big Data w korporacji
  • Wyjaśnij przesłanki leżące u podstaw holistycznego podejścia do Big Data
  • Komponenty potrzebne w Big Data platformie
  • Rozwiązanie do przechowywania dużych ilości danych
  • Granice tradycyjnych technologii
  • Przegląd typów baz danych

NoSQL Database s

Hadoop

Mapa Zmniejsz

Apache Spark

Wymagania

Delegaci powinni mieć świadomość i pewne doświadczenie w zakresie narzędzi do przechowywania danych oraz świadomość obsługi dużych zbiorów danych.

 14 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie