Telegram Web Link
Data Engineering: ETL, ELT, Data Pipeline, Data Warehouse, Data Lakes, Data Marts

https://ivan-shamaev.ru/data-engineering-etl-pipeline-data-warehouse-datalake/
Data Learn - это открытый ресурс на русском языке
- Getting Started with Analytics (Data) Engineering
- Getting Started with Machine Learning and Data Science (ML-101)
- Поиск работы для аналитических специальностей в России и за рубежом

https://github.com/Data-Learn/data-engineering
Зимняя стажировка в Институте бизнес-аналитики: заявки принимаются до 10 декабря

Это практика в полевых условиях. Без воды и гипотетических задач. Только реальные проекты и знания, которые понадобятся аналитикам в работе.

- Работа с данными: такими, которые обычно бывают у заказчика.
- Решение задач бизнеса с помощью визуализации данных.
- Работа с заказчиками, которые сами не знают, чего хотят.

Выстраивание коммуникации и презентация своего проекта.

Кандидаты получают тестовое задание, а ориентировочно 15 декабря проведут первое занятие для всех, кто прошел тестовый отбор.
Подробнее о стажировке можно узнать по ссылке 👇
https://bit.ly/2ZTEENU
Симпатичная идея как мерять полезность дашбордов/отдельных вкладок в аналитических приложениях (подсмотрел в яндекс-метрике)
Не всегда можно увидеть где-то нормальный финансовый дашборд, а тем более поделиться цифрами без замазывания)
Ну да ладно, своим можно делиться.

Так вот, я пользуюсь Google AdSense дашбордом, который сочетает в себе в одном месте всю необходимую информацию для понимания как трендов, так и текущих доходов по сайтам. Он мне нравится, поэтому решил поделиться.

Очень нравится верхняя плашечка с KPI, где сравниваются разные периоды:
- Текущий месяц к месяцу годом ранее (с учетом прошедших дней, т.е. можно оценить доход по сравнению с предыдущим годом).
- Текущие 28 дней с предыдущими 28 днями - понимаешь, как растет/падает/не меняется доход (скользящий период).
- Сравнение текущих 7 дней с предыдущими 7 днями (скользящий период).
- Ну и динамика в разбивке по показателям эффективности - сравнение трендов текущих 3 месяцев с предыдущими - видимо 90 дней текущих с предыдущими сравниваются).
Forwarded from Varlamov News
Microsoft приостанавливает продажи товаров и предоставление услуг в России.
Немножко мыслей про open-source Apache Superset
Из моего небольшого опыта работы с этим BI могу дать следующую обратную связь:
- Довольно зрелая система с хорошим набором фич.
- Многое описано в официальной доке, либо на github в отдельных реквестах. Но без технического бекграунда будет ОЧЕНЬ сложно.
- Это простая рисовалка графиков без ETL и модели данных внутри. Инструмент хорошо применим только для 1 готового датасета (прямая таблица, не схема звезда и уж подавно не снежинка). Поэтому могу смело утверждать, что построить сложные приложения, как например, в Qlik Sense или Power BI точно не выйдет. Либо придется костылять, придумывать технические приемы. Что в принципе возможно.
- В Apache Superset можно добавлять custom plugins, но этот процесс ОЧЕНЬ трудоемкий и состоит из множества этапов, которые придется освоить (docker, npm, react, js, typescript).
- Чтобы заменить Power BI или Qlik Sense этим инструментом, придется развернуть целый зоопарк других инструментов для data management & data delivery.
- В команде желательно иметь devops, который бы помог все это поднять и настроить.
- Довольно хорошо развивается, т.к. под крылом Apache.
- Вероятно из-за санкций получит большее распространение в России, что приведет к появлению большего числа доступных визуализаций и фич (правда вопрос насколько сообщество разработчиков будет в свои ряды принимать российских контрибьютеров после текущих событий).
- В отличие от Enterprise решений - можно добавить в функционал свою фичу (любую) и возможно даже отправить MR.
- Любые найденные баги - ваша головная боль.

#superset
Fundamentals_of_Data_Engineering_Third_Early_Release_by_Joe_Reis.pdf
6.3 MB
Fundamentals of Data Engineering (Third Early Release) by Joe Reis Matt Housley 2022.pdf
2025/02/24 12:20:04
Back to Top
HTML Embed Code: