Python 🐍 Work With Data 647

Data lineage is the process of tracking data and its modifications throughout its lifecycle. Discover its use cases, technique, and how to implement it.

737 views17:04

Python 🐍 Work With Data

https://github.com/mlflow/mlflow/

GitHub

GitHub - mlflow/mlflow: The open source developer platform to build AI/LLM applications and models with confidence. Enhance your…

The open source developer platform to build AI/LLM applications and models with confidence. Enhance your AI applications with end-to-end tracking, observability, and evaluations, all in one integra...

705 views06:35

Python 🐍 Work With Data

Luxoft Tableau Style Guide

byAlex Barakov

https://public.tableau.com/app/profile/alexandr.barakov/viz/LuxoftTableauStyleGuide6/Hello

Tableau Public

Luxoft Tableau Style Guide

Hi Creator!
This is our #Luxoft Tableau Corporate #styleguide - the collection of our strict rules and our general thoughts about how we see good #design should look like.

👍1

748 views09:52

Python 🐍 Work With Data

Forwarded from karpov.courses

Начинающие аналитики часто сталкиваются со стандартными ошибками в построении пути до файла в Pandas. Чтобы вам было легче разобраться, мы записали видео с разбором основных способов построения пути на примере курса «Аналитик данных».

YouTube

Построение пути до файла в Pandas | karpov.courses

675 views12:23

Python 🐍 Work With Data

Примеры drawio диаграмм https://github.com/jgraph/drawio-diagrams/

GitHub

GitHub - jgraph/drawio-diagrams: Diagrams for draw.io

Diagrams for draw.io. Contribute to jgraph/drawio-diagrams development by creating an account on GitHub.

654 views11:45

Python 🐍 Work With Data

Рубрика "бла бла бла"

K8S vs Docker

Что может случиться, если в компании принимается решение об единообразной платформе развертывании контейнерных приложений? Например, в компании на высшем уровне договорились развертывать все контейнерные приложения для всех подразделений только на kubernetes. В таком случае будьте готовы, что это решение повлияет на развитии внутренних сервисов компании негативным образом.

Почему? Мощности подразделения DevOps могут быть ограничены, а работать с K8S могут быть подготовлены не все сотрудники. Призыв "А ну-ка изучите kubernetes" у многих может вызывать отторжение, хотя бы потому, что в свободное от работы время учить не хочется дополнительный инструмент, а в рабочее время - аврал и надо бежать делать другие задачи. Лично у меня еще срабатывает желание подтянуть Docker, а не идти еще учить k8s, который еще и сложнее на порядок.

Лучшим на мой взгляд решением является принятие единой технологической платформы только для критически важной инфраструктуры (в т.ч. сервисов, приносящих деньги). А для других подразделений можно предоставить выбор k8s или docker. При этом тем, кто выбрал docker оказывать необходимую поддержку (возможно даже нанять отдельного devops инженера с хорошими знаниями docker).

Такое решение поспособствует развитию локальных экспертиз отдельных команд, плюс развитие внутренних продуктов компании только ускорится. Не каждый сотрудник, изучив Docker готов пойти изучать еще и kubernetes.

---

Как это может повлиять на отдел аналитики? Например, сейчас я бы хотел развернуть в компании Apache Airflow, Apache NiFi и DataHub Project, но все это придется поднимать на kubernetes. Дополнительным условием является поднятие сразу двух сред prod и stage. Т.к. datahub еще состоит из множества сервисов, то связываться с ним devops не захотят. Какой результат? Правильно - никакой. Фактически внутри ИТ приняты договоренности, которые препятствуют развитию инструментария для работы с данными.

Да, можно выпросить Linux машину и все поставить самостоятельно сбоку. Но тогда возникает ситуация, при которой вроде договорились использовать k8s, а все равно сбоку отпочковываются сервисы на Docker. Плюс машины Linux админят разработчики, что не безопасно.

---

Резюмируя, хочу сказать следующее: прежде чем вводить ограничения внутри компании, подумайте стоит ли их распространять повсеместно. В ином случае наймите достаточное количество DevOps инженеров, которые бы делали бы все необходимые работы по k8s.

619 viewsedited 06:43

Python 🐍 Work With Data

Как собеседовать работодателя? / Хабр
https://habr.com/ru/post/470227/

Хабр

Как собеседовать работодателя?

У программистов обычно принято обсуждать собеседования с точки зрения (около)технических вопросов, которые им задает интервьювер. Надо ли писать код на доске? Надо ли жонглировать бинарными...

795 views10:14

Python 🐍 Work With Data

Why Lakehouse over Data warehouse

https://medium.com/@abraham.pabbathi/why-lakehouse-over-data-warehouse-121cfc3e24ea

Medium

Why Lakehouse over Data warehouse

Intro

615 viewsedited 15:42

Python 🐍 Work With Data

620 views17:15

Python 🐍 Work With Data

SimpleMDE - Markdown Editor

A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing for beginners and experts alike. Features built-in autosaving and spell checking.

https://github.com/sparksuite/simplemde-markdown-editor

GitHub

GitHub - sparksuite/simplemde-markdown-editor: A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing…

A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing for beginners and experts alike. Features built-in autosaving and spell checking. - sparksuite/simplemde-markdown-...

👍1

661 viewsedited 11:26

Python 🐍 Work With Data

atoti is a free Python BI analytics platform for Quants, Data Analysts, Data Scientists & Business Users to collaborate better, analyze faster and translate their data into business KPIs.

https://github.com/atoti/atoti

GitHub

GitHub - atoti/atoti: atoti issue tracking

atoti issue tracking. Contribute to atoti/atoti development by creating an account on GitHub.

757 views13:12

Python 🐍 Work With Data

Forwarded from LEFT JOIN

📌 Диаграммы в Python ↩️

Это, конечно, дело вкуса и привычки, кому-то больше нравится создавать визуализации вручную. Но я, например, люблю решать с помощью кода любые задачи, которые таким способом можно решить (например, верстка статей или презентаций с помощью latex – улет, по крайней мере с точки зрения визуальной составляющей результата, про сам язык, конечно, этого не скажешь!).

Так вот, новый пакет diagrams для Python (который работает на базе graphviz) позволяет нарисовать архитектуру облачной системы в коде Python. Изначально, пакет был создан для создания прототипа новой или уже существующей системной архитектуры без каких-либо инструментов проектирования. В настоящее время Diagrams поддерживает такие инструменты как AWS, Azure, GCP, Kubernetes, Alibaba Cloud, Oracle Cloud, а также локальные узлы, SaaS и основные платформы и языки программирования.
На сайте примеры диаграмм, которые созданы с помощью этого пакета, как вам?

GitHub

GitHub - mingrammer/diagrams: :art: Diagram as Code for prototyping cloud system architectures

:art: Diagram as Code for prototyping cloud system architectures - mingrammer/diagrams

👍2

716 views08:35

Python 🐍 Work With Data

10 Python Mistakes That Tell You’re a Nooby | by Frank Andrade | Geek Culture | Medium
https://medium.com/geekculture/10-python-mistakes-that-tell-youre-a-nooby-359487f22c97

Medium

10 Python Mistakes That Tell You’re a Nooby

#1. Using import *

639 views05:27

Python 🐍 Work With Data

Forwarded from Data Engineering / Инженерия данных / Data Engineer / DWH

Complete Data Engineer’s Vocabulary | by Kovid Rathee | Towards Data Science
https://towardsdatascience.com/complete-data-engineers-vocabulary-87967e374fad

Medium

Complete Data Engineer’s Vocabulary

Concepts that data engineers must know in 10 words or less

622 views11:39

Python 🐍 Work With Data

The 40 Best JavaScript Libraries and Frameworks for 2022
https://kinsta.com/blog/javascript-libraries/

Kinsta®

The 40 Best JavaScript Libraries and Frameworks

Explore our hand-picked list of the best JavaScript libraries and frameworks. You'll also learn their features, benefits, and top use cases.

590 views04:58

Python 🐍 Work With Data

Pandas_in_7_Days_Utilize_Python_to_Manipulate_Data,_Conduct_Scientific.pdf

6.1 MB

Pandas in 7 Days: Utilize Python to Manipulate Data, Conduct Scientific Computing, Time Series Analysis (eng)

Table of Contents
1. Pandas, the Python library
2. Setting up a Data Analysis Environment
3. Day 1 - Data Structures in Pandas library
4. Day 2 - Working within a DataFrame, Basic Functionalities
5. Day 3 - Working within a DataFrame, Advanced Functionalities
6. Day 4 - Working with two or more DataFrames
7. Day 5 - Working with data sources and real-word datasets
8. Day 6 - Troubleshooting Challenges wit Real Datasets
9. Day 7 - Data Visualization and Reporting
10. Conclusion – Moving Beyond

693 views07:59

Python 🐍 Work With Data

Time_Series_Analysis_with_Python_Cookbook_Practical_recipes_for.pdf

38.7 MB

Time Series Analysis with Python Cookbook: Practical recipes for exploratory data analysis, data preparation, forecasting, and model evaluation
2022

🏷 Getting Started with Time Series Analysis
🏷 Reading Time Series Data from Files
🏷 Reading Time Series Data from Databases
🏷 Persisting Time Series Data to Files
🏷 Persisting Time Series Data to Databases
🏷 Working with Date and Time in Python
🏷 Handling Missing Data
🏷 Outlier Detection Using Statistical Methods
🏷 Exploratory Data Analysis and Diagnosis
🏷 Building Univariate Time Series Models Using Statistical Methods
🏷 Additional Statistical Modeling Techniques for Time Series
🏷 Forecasting Using Supervised Machine Learning
🏷 Deep Learning for Time Series Forecasting
🏷 Outlier Detection Using Unsupervised Machine Learning
🏷 Advanced Techniques for Complex Time Series

👍1

736 viewsedited 08:00

Python 🐍 Work With Data

GitHub - Zeutschler/tinyolap: TinyOlap is a light-weight, in-process, in-memory, multi-dimensional, model-first OLAP engine for planning, budgeting, reporting, analysis and many other numerical purposes, written in plain Python.
https://github.com/Zeutschler/tinyolap

GitHub

GitHub - Zeutschler/tinyolap: TinyOlap is a light-weight, in-process, in-memory, multi-dimensional, model-first OLAP engine for…

TinyOlap is a light-weight, in-process, in-memory, multi-dimensional, model-first OLAP engine for planning, budgeting, reporting, analysis and many other numerical purposes, written in plain Python...

708 views09:31

Python 🐍 Work With Data

Apache Superset Alternatives - Python Data Visualization | LibHunt
https://python.libhunt.com/caravel-alternatives

Libhunt

Apache Superset Alternatives - Python Data Visualization | LibHunt

Apache Superset is a Data Visualization and Data Exploration Platform [Moved to: https://github.com/apache/superset]. Tags: Data Visualization, BI, Business Intelligence, Dashboards, Analytics.

861 views09:58

Python 🐍 Work With Data

https://youtu.be/dFCJysbOJ8c

YouTube

Анатолий Карпов - A/B-тестирование: как сделать так, чтобы оно заработало

Совсем скоро Матемаркетинг-22, 17-18 ноября
Подробности: https://matemarketing.ru/
Программа: https://clck.ru/y6jEV
Купить билет: https://matemarketing.ru/

A/B-тесты - главный двигатель развития продукта. В крупных компаниях ежедневно проводятся сотни экспериментов…

964 views05:46

2025/10/21 09:28:55
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>