Storage Training

Storage Training
Kontakt | Standorte

 Sie sind hier: Home >> Workshops >> Amazon Web Services >> AW490 Building Batch Data Analytics Solutions on AWS

Finden:
Workshops 
  Noon2noon 
  Acronis 
  Automic (UC4) 
  AWS 
  Backup & Recovery 
  Brocade 
  Cloud 
  Commvault 
  Datenbanken 
  DevOps 
  ESET Security Solutions 
  Fujitsu 
  Governance, Risk & Compliance  
  Hochverfügbarkeit 
  Industrie 4.0 
  Künstliche Intelligenz 
  Linux/Unix 
  Microsoft 
  NetApp 
  NetApp für Partner 
  Netzwerke 
  SAP 
  Security & Datenschutz 
  Softwareentwicklung 
  Storage Solutions 
  Veeam 
  Virtualisierung 
  Web-Seminare 
  Zertifizierungen 

Training: AWS - Cloud

AW490 Building Batch Data Analytics Solutions on AWS

 

Kursbeschreibung (description):
In dem Kurs „Building Batch Data Analytics Solutions on AWS” erhalten die Teilnehmer einen Einblick in die Verwendung von Amazon EMR in Verbindung mit Open Source Projekten und lernen verschiedene Komponenten kennen.
Zielgruppe (target group):
  • Data Engineers
  • Architekten und Operators, die Datenanalyse-Pipelines aufbauen und verwalten

Voraussetzungen (requirements):
Um an dem Kurs „Building Batch Data Analytics Solutions on AWS“ bei qSkills teilnehmen zu können, sollten Sie folgende AWS Trainings besucht haben:
Zusätzlich sollten die Teilnehmer folgende Voraussetzungen erfüllen:
Mindestens 1 Jahr Erfahrung im Umgang mit Open-Source-Daten-Frameworks wie Apache Spark oder Apache Hadoop.
Ziele (objectives):
  • Data Warehouse, Data Lakes und moderne Datenarchitekturen vergleichen
  • Batch-Datenanalyselösung entwerfen und implementieren
  • Geeignete Techniken für Komprimierung und Optimierung der Datenspeicherung einsetzen
  • Passende Instanz- und Knotenpunkte, Cluster, automatische Skalierung und Netzwerktopologie für einen Anwendungsfall
  • Auswirkungen der Datenspeicherung und -verarbeitung auf Analyse- und Visualisierungsmechanismen
  • Sichern der Daten im Ruhezustand und während der Übertragung
  • Mit Hilfe von Analyse-Workloads Probleme erkennen und beheben
  • Best Practices für das Kostenmanagement

Preis und Dauer (price and duration):
Dauer (duration): 1 Tag
Preis (price): 750,- Euro zzgl. MwSt.

Eine Druckansicht dieses Workshops finden Sie hier.
Termine (dates):
Termine auf Anfrage.
Falls Sie einen Terminwunsch für diesen Workshop haben, werden wir dies gerne für Sie prüfen!
Inhalte (agenda):
  • Das eintägige Training „Building Batch Data Analytics Solutions on AWS“ vermittelt die Erstellung von Batch-Datenanalyselösungen unter Verwendung von Amazon EMR. Dabei handelt es sich um einen verwalteten Apache Spark und Apache Hadoop-Service der Enterprise-Klasse.

    Die Teilnehmer lernen Amazon EMR in Open Source Projekte wie Hive, Hue oder HBase zu integrieren und mit AWS-Services wie AWS Glue und AWS Lake Formation zu kombinieren. Darüber hinaus werden verschiedene Komponenten der Datensammlung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung in Verbindung mit Spark und Hadoop vorgestellt. Der Einsatz von EMR Notebooks für Analyse und Machine Learning sowie Best-Practices zu den Themen Sicherheit, Leistung und Kostenmanagement runden den Kurs ab.

    Dieser Kurs setzt sich aus einer Präsentation, Übungen und interaktiven Demos zusammen, um das Erlernte praktisch anzuwenden.

    Die Kursunterlagen (E-Book) sind in englischer Sprache, die Kurssprache ist deutsch.



  • Modul A: Überblick über Datenanalyse und die Datenpipeline
  • Modul 1: Einführung in Amazon EMR
    • Verwendung von Amazon EMR in Analyselösungen
    • Architektur von Amazon EMR-Clustern
    • Interaktive Demo 1: Starten eines Amazon EMR-Clusters
    • Strategien zur Kostenverwaltung

  • Module 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung
    • Speicheroptimierung mit Amazon EMR
    • Techniken zur Datenübernahme

  • Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR
    • Anwendungsfälle für Apache Spark auf Amazon EMR
    • Warum Apache Spark auf Amazon EMR
    • Spark-Konzepte
    • Interaktive Demo 2: Interaktive Analytik mit Apache Spark auf Amazon EMR
    • Transformation, Verarbeitung und Analyse
    • Verwendung von Notebooks mit Amazon EMR
    • Übungslabor 1: Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR

  • Modul 4: Verarbeiten und Analysieren von Batch-Daten mit Amazon EMR und Hive
    • Verwendung von Amazon EMR mit Hive zur Verarbeitung von Stapeldaten
    • Transformation, Verarbeitung und Analyse
    • Practice Lab 2: Batch-Datenverarbeitung mit Amazon EMR und Hive
    • Einführung in HBase auf Amazon EMR

  • Modul 5: Serverlose Datenverarbeitung
    • Serverlose Datenverarbeitung, -transformation und -analytik
    • Verwendung von AWS Glue mit Amazon EMR-Arbeitslasten
    • Praxisübung 3: Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions

  • Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern
    • Sichern von EMR-Clustern
    • Interaktive Demo 3: Verschlüsselung von Daten im Ruhezustand in Amazon EMR
    • Überwachung und Fehlersuche bei EMR-Clustern
    • Demo: Überprüfung des Verlaufs von Apache Spark-Clustern
    • Überwachung und Fehlerbehebung von Amazon EMR-Clustern

  • Modul 7: Entwerfen von Batch-Datenanalyselösungen
    • Anwendungsfälle der Batch-Datenanalyse
    • Aktivität: Entwerfen eines Arbeitsablaufs für die Batch-Datenanalyse

  • Modul B: Entwickeln moderner Datenarchitekturen auf AWS
    • Moderne Datenarchitekturen