Cursusaanbod
Introductie
Begrijpen Big Data
Overzicht van Spark
Overzicht van Python
Overzicht van PySpark
- Gegevens distribueren met behulp van een veerkrachtig framework voor gedistribueerde datasets
- Berekeningen distribueren met behulp van Spark API-operators
Instellen Python met Spark
Instellen PySpark
Amazon Web Services (AWS) EC2-instanties gebruiken voor Spark
Instellen Databricks
Opzetten van het AWS EMR cluster
De basis leren van Python Programming
- Aan de slag met Python
- Het Jupyter-notebook gebruiken
- Variabelen en eenvoudige gegevenstypen gebruiken
- Werken met lijsten
- if-instructies gebruiken
- Gebruikersinvoer gebruiken
- Werken met while Loops
- Functies implementeren
- Werken met klassen
- Werken met bestanden en uitzonderingen
- Werken met projecten, gegevens en API's
De basisprincipes van Spark DataFrame leren
- Aan de slag met Spark DataFrames
- Basisbewerkingen implementeren met Spark
- Groupby- en aggregatiebewerkingen gebruiken
- Werken met tijdstempels en datums
Werken aan een Spark DataFrame-projectoefening
Begrijpen Machine Learning met MLlib
Werken met MLlib, Spark en Python voor Machine Learning
Regressies begrijpen
- Lineaire regressietheorie leren
- Implementatie van een Regressie Evaluatie Code
- Werken aan een voorbeeld van lineaire regressieoefening
- Logistische regressietheorie leren
- Implementeren van een logistieke regressiecode
- Werken aan een voorbeeld van logistische regressieoefening
Inzicht in Random Forests en beslissingsbomen
- Leerboom Methoden Theorie
- Uitvoeringsbesluitbomen en Random Forest codes
- Werken aan een steekproef Random Forest classificatieoefening
Werken met K-betekent Clusteren
- Inzicht in K-means Clustering Theorie
- Implementeren van een K-means Clustering Code
- Werken aan een voorbeeld van een clusteroefening
Werken met aanbevelingssystemen
Implementatie van natuurlijke taalverwerking
- Begrijpen Natural Language Processing (NLP)
- Overzicht van NLP Tools
- Werken aan een voorbeeld van NLP-oefening
Streamen met Spark aan Python
- Overzicht Streamen met Spark
- Voorbeeld Spark Streaming Oefening
Slotwoord
Vereisten
- Algemene programmeervaardigheden
Audiëntie
- Ontwikkelaars
- IT-professionals
- Datawetenschappers
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (6)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Cursus - Python and Spark for Big Data (PySpark)
The course was about a series of very complex related topics & Pablo has in-depth expertise of each of them. Sometimes nuances were lost in communication and/or due to time pressures and possibly expectations were not quite met due to this. Also there were some UHG/Azure Databricks setup issues however Pablo / UHG resolved these quickly once they became apparent - this to me showed a high level of understanding and professionalism between UHG & Pablo,
Michael Monks - Tech NorthWest Skillnet
Cursus - Python and Spark for Big Data (PySpark)
Individual attention.
ARCHANA ANILKUMAR - PPL
Cursus - Python and Spark for Big Data (PySpark)
Hands on Training..
Abraham Thomas - PPL
Cursus - Python and Spark for Big Data (PySpark)
The lessons were taught in a Jupyter notebook. The topics were structured with a logical sequence and naturally helped develop the session from the easier parts to the more complex. I'm already an advanced user of Python with background in Machine Learning, so found the course easier to follow than, possibly, some of my classmates that took the training course. I appreciate that some of the most elementary concepts were skipped and that he focused on the most substantial matters.
Angela DeLaMora - ADT, LLC
Cursus - Python and Spark for Big Data (PySpark)
practice tasks