Deze boeken voor Data Engineers liggen bij Juvo zéker onder de kerstboom

Freelance opdracht

Data is de dag van vandaag belangrijker dan ooit. Data engineering biedt dan ook veel carrière kansen en een competitief, aantrekkelijk loon. Deze industrie heeft een geweldige reputatie die zich de komende jaren zal blijven uitbreiden. Maar onthoud altijd: de sleutel tot succes ligt in het bijblijven met de laatste technische ontwikkelingen.

Uiteindelijk moet je jezelf onderscheiden van de massa en waar mogelijk een voorsprong nemen op anderen. Er zijn veel mogelijkheden om je opleiding voort te zetten om zo alle nodige vaardigheden te verwerven. Een van de beste manieren om bij te blijven volgens onze experts? Boeken lezen.
De vraag “Welke boeken moet je prioriteit geven om verder te komen in Data Engineering?” is moeilijk te beantwoorden. De Data Engineering experts van Juvo geven je graag hun go-to lijstje mee om je op weg te helpen.

Data engineering with Python

Data engineering with Python

Dit boek biedt een grondig inzicht in data modeling methoden en pipelines. Het eerste deel van dit boek introduceert de basis van data engineering. Daarna leer je over de frameworks en infrastructuur die nodig zijn om data pipelines te bouwen voor het verwerken van grote datasets.

Je leert hoe je gegevens transformeert, opschoont en analyseert om er het maximale uit te halen. Tegen het einde van het boek zal je ontdekken hoe je data pipelines bouwt en omgaat met enorme datasets van verschillende niveaus aan complexiteit. Ook zal je leren hoe je architecturen opbouwt waarop je data pipelines inzet aan de hand van voorbeelden uit de praktijk.

De belangrijkste concepten zijn:

  • ETL-pipelines
  • Gegevensverwerking en gegevens opschoning
  • Het bouwen van robuuste pipelines in Python
  • Fundamentele en elementaire Python data engineering concepten

Koop het boek hier.

The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling

The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling

Dit boek van Ralph Kimball is aanzienlijk verbeterd sinds de oorspronkelijke editie, die velen kennis liet maken met het idee van dimensioneel modelleren. De derde editie is de go-to gids voor het maken van snelle dimensionale databases die geoptimaliseerd zijn voor query’s.

Belangrijke concepten zijn onder andere:

  • Gedetailleerde analyse van ETL systemen en design
  • Adviezen over het ontwerp van dimensies en feitentabellen
  • Richtlijnen voor het werken met stakeholders aan ontwerpen

Koop het boek hier.

Spark: The Definitive Guide: Big Data Processing Made Simple

Spark: The Definitive Guide: Big Data Processing Made Simple

Apache Spark is een krachtig platform voor Big Data toepassingen. Dit boek biedt diverse uitstekende voorbeelden en een uitgebreide uitleg over de architectuur van Spark. 

Python, Scala en Spark SQL worden gebruikt in de codevoorbeelden van het boek, alsook in de bijbehorende notebooks.

Koop het boek hier

Data Science for Dummies

Data Science for Dummies

Dit boek richt zich op business cases. Het beschrijft big data, data science en data engineering en hoe deze gebieden op elkaar inspelen om een enorme meerwaarde te creëren. Dit boek bevat alle kennis die je nodig hebt om een nieuw project of carrière te starten.

Na het lezen van dit boek ben je bekend met de fundamenten van big data en data engineering. Het behandelt ook big data frameworks zoals Hadoop, MapReduce, Spark, MPP-systemen en NoSQL.

Koop het boek hier.

97 Things Every Data Engineer Should Know: Collective Wisdom from the Experts 1st Edition

97 Things Every Data Engineer Should Know: Collective Wisdom from the Experts 1st Edition

97 Things is een actueel en relevant boek (uitgebracht in juni 2021) dat artikelen en interviews bevat met data engineers van prestigieuze bedrijven, waaronder Google, LinkedIn, Twitter en Microsoft. Het boek brengt je op de hoogte van de meest recente best practices in data engineering en staat boordevol nuttig advies.

Naast de technische kant van de materie bevat het ook een overvloed aan nuttig advies: “Hoe begin je een carrière als data engineer?”.

Krachtige concepten zijn onder meer:

  • Carrièrebegeleiding voor data engineers
  • Best practices die topbedrijven hanteren.
  • Meest recente methoden voor metadata
  • Advies over het voorbereiden, opslaan en verwerken van gegevens.

“Een uitstekende bron voor loopbaanbegeleiding voor data engineers.”

Koop het boek hier.

Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

De voordelen van dit boek? De omvang en de toepasbaarheid in de praktijk. Het is een van de meest grondige boeken over data engineering (een belangrijke reden waarom het meer dan 2.900 5-sterren recensies heeft op Amazon). 

Betrouwbaarheid, schaalbaarheid en onderhoudsvriendelijkheid zijn de drie pijlers waarrond Kleppmanns boek is opgebouwd. Het doel is het je makkelijker te maken en te begrijpen hoe deze drie categorieën samenhangen met gegevensarchitectuur.

Het is een alles-in-één handleiding voor solution design, wat erg behulpzaam is voor job interviews. Je ontwikkeld woordenschat die nodig is om voor- en nadelen van verschillende oplossingen te bespreken. Zo bepaal je welke technologie het meest geschikt is voor een bepaald bedrijfsprobleem. 

De belangrijkste ideeën zijn:

  • Fundamentele data engineering concepten (verwerking, codering, structuren, data modellen, etc.)
  • Data engineering theorie uitgelegd in eenvoudige termen
  • Advies en bedenkingen voor praktisch design
  • “Under the hood” case studies uit de echte wereld

Dit is het beste theorieboek dat je kan vinden, en het is perfect voor data engineers op alle ervaringsniveaus.

Koop het boek hier.

Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract critical insights

Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract critical insights

Data engineers begrijpen dat slechte gegevens verkeerde resultaten opleveren. Als jouw modellen niet worden gevoed met schone, betrouwbare gegevens, kun je niet verwachten dat je project succesvol zal zijn. Met dit Python-boek leer je hoe je gegevens efficiënt opschoont, een onmisbare skill voor data engineers.

Dit boek staat vol met baanbrekende inzichten en methoden voor het opschonen van data. Leer Python om outliers op te sporen, gegevens te analyseren op onregelmatigheden, om te gaan met ontbrekende waarden en nog veel meer.

De belangrijkste ideeën zijn:

  • Gegevensverwerking met Python
  • Moderne technieken voor het opschonen van data
  • Engineering/pipeline concepten voor Python
  • Technieken en tips voor data exploratie

Ongetwijfeld de beste bron om te leren over Python data cleansing.

Koop het boek hier.

Machine Learning Engineering

Machine Learning Engineering

Dit boek over data engineering is de standaard referentie voor machine learning engineering sinds het uitkwam in 2020. Burkov behandelt alle grondslagen als je geïnteresseerd bent in Machine Learning engineer posities of je machine learning vaardigheden (verder) wilt ontwikkelen.

Er zijn inzichten en diepgaande besprekingen van ML-fundamenten die verder gaan dan alleen een inside-the-box blik op algoritmen.

Kernbegrippen zijn onder meer:

  • Verwerking van gegevens op schaal
  • ML engineering prototyping
  • Advies en tips voor productbeheer en -ontwerp
  • Reliability engineering how-to

Het beste boek voor data engineers of data scientists die geïnteresseerd zijn om als Machine Learning engineer aan de slag te gaan.

Koop het boek hier.

Visueel leren over data 

Ben jij geen boekenworm? Juvo biedt webinars aan waarin je alles leert over de laatste trends in data engineering. Wij organiseren webinars voor elk niveau. 

Bekijk hier onze webinars

Jouw data snel winstgevend maken? 

Geen tijd om je te verdiepen in de wereld van data engineering? Onze data experts hebben al de kennis en vaardigheden om alles uit jouw data te halen.
Benieuwd wat er allemaal mogelijk is met jouw data? En hoe je die nog beter inzet om je doelen te behalen? Kortom, hoe jouw data meer winst oplevert? 

We vertellen je er graag alles over. 

Contacteer ons