Telegram Web Link
Записи конференции Smart Data 2021 на Youtube

Материалы конференции

Apache Airflow, DWH как продукт, Каталог и озеро данных на базе MongoDB, ClickHouse, MLOps, Self-service BI, Apache Spark

☮️
Появилась интеграция между Airbyte и Clickhouse 🥳
https://clickhouse.com/docs/integrations/airbyte-and-clickhouse

#airbyte #clickhouse
Practical Python Data Wrangling and Data Quality (en).epub
5.4 MB
Practical Python: Data Wrangling and Data Quality

1. Introduction to Data Wrangling and Data Quality
2. Introduction to Python
3. Understanding Data Quality
4. Working with File-Based and Feed-Based Data in Python
5. Accessing Web-Based Data
6. Assessing Data Quality
7. Cleaning, Transforming, and Augmenting Data
8. Structuring and Refactoring Your Code
9. Introduction to Data Analysis
10. Presenting Your Data
11. Beyond Python

https://github.com/PracticalPythonDataWranglingAndQuality/data_wrangling_exercises - This repo contains draft coding exercises for the early-release version of the book Practical Python: Data Wrangling and Data Quality to be published by O'Reilly Media in 2021.
Forwarded from Data Coffee
В новом выпуске подкаста мы обсудили нового главу всея твиттера (а пропустить мы это не могли) и то, что теперь можно легально (правда, пока только в США) скрейпить данные и обучать свои нейроболталки (чтобы потом сделать стартап и войти в сотню самых интересных Big Data компаний).

Помимо дел бизнеса, обсудили современную хирургию, несовременный шутер и неожиданную объединяющую ведущих любовь к дирижаблям.

Все это в новом свежем новостном эпизоде подкаста Data Coffee🎙

#datacoffee #data #podcast #данные #подкаст

https://anchor.fm/data-coffee/episodes/46-S2E4----Mute--Twitter----etc-e1hrnkf
Forwarded from Инжиниринг Данных (Dmitry)
Сегодня по расписанию будет - Python Environments and Best Practices
- Using the command line and command line applications
- How to set up projects using virtual environments
- Sharing code via git and GitHub
- Using IDE features for debugging, refactoring, and navigating Python code

В приложении презентация, ссылка на git, и reference document.
Data_Quality_Fundamentals_Barr_Moses_Lior_Gavish_Molly_Vorwerck.epub
1.4 MB
Data Quality Fundamentals

2022 O'Reilly Media, Inc.

- Build more trustworthy and reliable data pipelines
- Write scripts to make data checks and identify broken pipelines with data observability
- Program your own data quality monitors from scratch
- Develop and lead data quality initiatives at your company
- Generate a dashboard to highlight your company's key data assets
- Automate data lineage graphs across your data ecosystem
- Build anomaly detectors for your critical data assets
2025/02/24 22:10:09
Back to Top
HTML Embed Code: