Що почитати Data Engineer

17 Серпня 2023

Завжди підтримуємо тебе в літературних пошуках, тож не можемо не порадити якісні фахові посібники! Якщо ти цікавишся інженерією даних, прагнеш зазирнути під капот відомих додатків і дослідити їхню архітектуру — переглядай нашу добірку і поповнюй лист бажань крутою літературою. А ще — надсилай добірку друзям! Тепер вони матимуть аж п’ять ідей тобі на подарунок ;)

Fundamentals of Data Engineering: Plan and Build Robust Data Systems by Joe Reis and Matt Housley 

Ця книга розкаже тобі:

  • про ландшафт інженерії даних;
  • як ігнорувати маркетинговий хайп при виборі технологій, архітектури та процесів роботи з даними;
  • як використовувати data engineering lifecycle для проєктування та побудови надійної архітектури.

У книги чудові відгуки відповідно до рейтингу Amazon Best Sellers Rank: #1 in Cloud Computing (Books),  #2 in Data Processing, #3 in Data Modeling & Design (Books), тож дуже радимо!

Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems by Martin Kleppmann

Якщо шукаєш фундаментальну працю про перфоманс, скейлабіліті й інструменти Data — ця книга для тебе! 

Знову ж таки, згідно з рейтингом Amazon Best Sellers Rank, книга визнана найкращою в номінаціях:

  #1 in Data Modeling & Design (Books)

  #1 in MySQL Guides

  #1 in Desktop Database Books

Spark: The Definitive Guide: Big Data Processing Made Simple by Bill Chambers, Matei Zaharia 

Мастхев-посібник для тих, хто прагне зануритися в Apache Spark.

Автори зібрали усе: від основних операцій API Spark до сценаріїв використання MLlib і масштабованої бібліотеки машинного навчання Spark.

Data Engineering With Python by Paul Crickard 

Хоча книга видана у 2020 році, вона не втратила актуальності. У практичній частині автор звертає увагу на створення конвеєра даних. 

Опрацювавши матеріал, ти не лише отримаєш чітке уявлення про методи моделювання, а й зможеш впевнено будувати конвеєри для відстеження даних, перевірки якості та внесення необхідних змін у продакшн.

Звертаємо увагу, книга ще й на пітоні — скарб!

The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling by Ralph Kimball 

І найсмачніше наостанок! 

Найавторитетніший автор Data-галузі у цій книзі зібрав бібліотеку оновлених методів розмірного моделювання — найповнішу колекцію за всю історію! Крім цього, посібник містить додаткові розділи про методи ETL та нові й розширені бізнес-матриці. Знахідка!