Cursusaanbod
Introductie:
- Apache Spark in Hadoop Ecosysteem
- Korte intro voor python, scala
Basis (theorie):
- Architectuur
- RDD
- Transformatie en acties
- Fase, taak, afhankelijkheden
Met behulp van Databricks omgeving begrijp je de basis (hands-on workshop):
- Oefeningen met behulp van RDD API
- Basisfuncties voor actie en transformatie
- PairRDD
- Verbinden
- Strategieën voor caching
- Oefeningen met behulp van de DataFrame-API
- VonkSQL
- DataFrame: selecteren, filteren, groeperen, sorteren
- UDF (door de gebruiker gedefinieerde functie)
- Kijken naar DataSet API
- Streaming
Met behulp van AWS-omgeving inzicht in de implementatie (hands-on workshop):
- Basisprincipes van AWS-lijm
- Begrijp de verschillen tussen AWS EMR en AWS Glue
- Voorbeeldtaken in beide omgevingen
- Begrijp de voor- en nadelen
Extra:
- Inleiding tot Apache Airflow orkestratie
Vereisten
Programmeervaardigheden (bij voorkeur Python, Scala)
SQL basis
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Cursus - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Cursus - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift