Cursusaanbod

Introductie:

  • Apache Spark in Hadoop Ecosysteem
  • Korte intro voor python, scala

Basis (theorie):

  • Architectuur
  • RDD
  • Transformatie en acties
  • Fase, taak, afhankelijkheden

Met behulp van Databricks omgeving begrijp je de basis (hands-on workshop):

  • Oefeningen met behulp van RDD API
  • Basisfuncties voor actie en transformatie
  • PairRDD
  • Verbinden
  • Strategieën voor caching
  • Oefeningen met behulp van de DataFrame-API
  • VonkSQL
  • DataFrame: selecteren, filteren, groeperen, sorteren
  • UDF (door de gebruiker gedefinieerde functie)
  • Kijken naar DataSet API
  • Streaming

Met behulp van AWS-omgeving inzicht in de implementatie (hands-on workshop):

  • Basisprincipes van AWS-lijm
  • Begrijp de verschillen tussen AWS EMR en AWS Glue
  • Voorbeeldtaken in beide omgevingen
  • Begrijp de voor- en nadelen

Extra:

  • Inleiding tot Apache Airflow orkestratie

Vereisten

Programmeervaardigheden (bij voorkeur Python, Scala)

SQL basis

 21 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

  • Pre-cursusgesprek met uw trainer
  • Aanpassing van de leerervaring om uw doelen te bereiken -
    • Op maat gemaakte overzichten
    • Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
  • Training gepland op een datum naar keuze
  • Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen


OPENBARE TRAINING

Kijk op onze public courses

Reviews (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën