Luxoft Tableau Style Guide
byAlex Barakov
https://public.tableau.com/app/profile/alexandr.barakov/viz/LuxoftTableauStyleGuide6/Hello
byAlex Barakov
https://public.tableau.com/app/profile/alexandr.barakov/viz/LuxoftTableauStyleGuide6/Hello
Tableau Public
Luxoft Tableau Style Guide
Hi Creator!
This is our #Luxoft Tableau Corporate #styleguide - the collection of our strict rules and our general thoughts about how we see good #design should look like.
This is our #Luxoft Tableau Corporate #styleguide - the collection of our strict rules and our general thoughts about how we see good #design should look like.
Forwarded from karpov.courses
Начинающие аналитики часто сталкиваются со стандартными ошибками в построении пути до файла в Pandas. Чтобы вам было легче разобраться, мы записали видео с разбором основных способов построения пути на примере курса «Аналитик данных».
YouTube
Построение пути до файла в Pandas | karpov.courses
Начинающие аналитики часто сталкиваются со стандартными ошибками в построении пути до файла в Pandas. Чтобы вам было легче разобраться, мы записали видео с разбором основных способов построения пути на примере курса «Аналитик данных».
Учитесь Data Science…
Учитесь Data Science…
Рубрика "бла бла бла"
K8S vs Docker
Что может случиться, если в компании принимается решение об единообразной платформе развертывании контейнерных приложений? Например, в компании на высшем уровне договорились развертывать все контейнерные приложения для всех подразделений только на kubernetes. В таком случае будьте готовы, что это решение повлияет на развитии внутренних сервисов компании негативным образом.
Почему? Мощности подразделения DevOps могут быть ограничены, а работать с K8S могут быть подготовлены не все сотрудники. Призыв "А ну-ка изучите kubernetes" у многих может вызывать отторжение, хотя бы потому, что в свободное от работы время учить не хочется дополнительный инструмент, а в рабочее время - аврал и надо бежать делать другие задачи. Лично у меня еще срабатывает желание подтянуть Docker, а не идти еще учить k8s, который еще и сложнее на порядок.
Лучшим на мой взгляд решением является принятие единой технологической платформы только для критически важной инфраструктуры (в т.ч. сервисов, приносящих деньги). А для других подразделений можно предоставить выбор k8s или docker. При этом тем, кто выбрал docker оказывать необходимую поддержку (возможно даже нанять отдельного devops инженера с хорошими знаниями docker).
Такое решение поспособствует развитию локальных экспертиз отдельных команд, плюс развитие внутренних продуктов компании только ускорится. Не каждый сотрудник, изучив Docker готов пойти изучать еще и kubernetes.
---
Как это может повлиять на отдел аналитики? Например, сейчас я бы хотел развернуть в компании Apache Airflow, Apache NiFi и DataHub Project, но все это придется поднимать на kubernetes. Дополнительным условием является поднятие сразу двух сред prod и stage. Т.к. datahub еще состоит из множества сервисов, то связываться с ним devops не захотят. Какой результат? Правильно - никакой. Фактически внутри ИТ приняты договоренности, которые препятствуют развитию инструментария для работы с данными.
Да, можно выпросить Linux машину и все поставить самостоятельно сбоку. Но тогда возникает ситуация, при которой вроде договорились использовать k8s, а все равно сбоку отпочковываются сервисы на Docker. Плюс машины Linux админят разработчики, что не безопасно.
---
Резюмируя, хочу сказать следующее: прежде чем вводить ограничения внутри компании, подумайте стоит ли их распространять повсеместно. В ином случае наймите достаточное количество DevOps инженеров, которые бы делали бы все необходимые работы по k8s.
K8S vs Docker
Что может случиться, если в компании принимается решение об единообразной платформе развертывании контейнерных приложений? Например, в компании на высшем уровне договорились развертывать все контейнерные приложения для всех подразделений только на kubernetes. В таком случае будьте готовы, что это решение повлияет на развитии внутренних сервисов компании негативным образом.
Почему? Мощности подразделения DevOps могут быть ограничены, а работать с K8S могут быть подготовлены не все сотрудники. Призыв "А ну-ка изучите kubernetes" у многих может вызывать отторжение, хотя бы потому, что в свободное от работы время учить не хочется дополнительный инструмент, а в рабочее время - аврал и надо бежать делать другие задачи. Лично у меня еще срабатывает желание подтянуть Docker, а не идти еще учить k8s, который еще и сложнее на порядок.
Лучшим на мой взгляд решением является принятие единой технологической платформы только для критически важной инфраструктуры (в т.ч. сервисов, приносящих деньги). А для других подразделений можно предоставить выбор k8s или docker. При этом тем, кто выбрал docker оказывать необходимую поддержку (возможно даже нанять отдельного devops инженера с хорошими знаниями docker).
Такое решение поспособствует развитию локальных экспертиз отдельных команд, плюс развитие внутренних продуктов компании только ускорится. Не каждый сотрудник, изучив Docker готов пойти изучать еще и kubernetes.
---
Как это может повлиять на отдел аналитики? Например, сейчас я бы хотел развернуть в компании Apache Airflow, Apache NiFi и DataHub Project, но все это придется поднимать на kubernetes. Дополнительным условием является поднятие сразу двух сред prod и stage. Т.к. datahub еще состоит из множества сервисов, то связываться с ним devops не захотят. Какой результат? Правильно - никакой. Фактически внутри ИТ приняты договоренности, которые препятствуют развитию инструментария для работы с данными.
Да, можно выпросить Linux машину и все поставить самостоятельно сбоку. Но тогда возникает ситуация, при которой вроде договорились использовать k8s, а все равно сбоку отпочковываются сервисы на Docker. Плюс машины Linux админят разработчики, что не безопасно.
---
Резюмируя, хочу сказать следующее: прежде чем вводить ограничения внутри компании, подумайте стоит ли их распространять повсеместно. В ином случае наймите достаточное количество DevOps инженеров, которые бы делали бы все необходимые работы по k8s.
Why Lakehouse over Data warehouse
https://medium.com/@abraham.pabbathi/why-lakehouse-over-data-warehouse-121cfc3e24ea
https://medium.com/@abraham.pabbathi/why-lakehouse-over-data-warehouse-121cfc3e24ea
Medium
Why Lakehouse over Data warehouse
Intro
SimpleMDE - Markdown Editor
A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing for beginners and experts alike. Features built-in autosaving and spell checking.
https://github.com/sparksuite/simplemde-markdown-editor
A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing for beginners and experts alike. Features built-in autosaving and spell checking.
https://github.com/sparksuite/simplemde-markdown-editor
GitHub
GitHub - sparksuite/simplemde-markdown-editor: A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing…
A simple, beautiful, and embeddable JavaScript Markdown editor. Delightful editing for beginners and experts alike. Features built-in autosaving and spell checking. - sparksuite/simplemde-markdown-...
atoti is a free Python BI analytics platform for Quants, Data Analysts, Data Scientists & Business Users to collaborate better, analyze faster and translate their data into business KPIs.
https://github.com/atoti/atoti
https://github.com/atoti/atoti
GitHub
GitHub - atoti/atoti: atoti issue tracking
atoti issue tracking. Contribute to atoti/atoti development by creating an account on GitHub.
Forwarded from LEFT JOIN
📌 Диаграммы в Python ↩️
Это, конечно, дело вкуса и привычки, кому-то больше нравится создавать визуализации вручную. Но я, например, люблю решать с помощью кода любые задачи, которые таким способом можно решить (например, верстка статей или презентаций с помощью latex – улет, по крайней мере с точки зрения визуальной составляющей результата, про сам язык, конечно, этого не скажешь!).
Так вот, новый пакет diagrams для Python (который работает на базе
На сайте примеры диаграмм, которые созданы с помощью этого пакета, как вам?
Это, конечно, дело вкуса и привычки, кому-то больше нравится создавать визуализации вручную. Но я, например, люблю решать с помощью кода любые задачи, которые таким способом можно решить (например, верстка статей или презентаций с помощью latex – улет, по крайней мере с точки зрения визуальной составляющей результата, про сам язык, конечно, этого не скажешь!).
Так вот, новый пакет diagrams для Python (который работает на базе
graphviz
) позволяет нарисовать архитектуру облачной системы в коде Python. Изначально, пакет был создан для создания прототипа новой или уже существующей системной архитектуры без каких-либо инструментов проектирования. В настоящее время Diagrams поддерживает такие инструменты как AWS, Azure, GCP, Kubernetes, Alibaba Cloud, Oracle Cloud, а также локальные узлы, SaaS и основные платформы и языки программирования.На сайте примеры диаграмм, которые созданы с помощью этого пакета, как вам?
GitHub
GitHub - mingrammer/diagrams: :art: Diagram as Code for prototyping cloud system architectures
:art: Diagram as Code for prototyping cloud system architectures - mingrammer/diagrams
10 Python Mistakes That Tell You’re a Nooby | by Frank Andrade | Geek Culture | Medium
https://medium.com/geekculture/10-python-mistakes-that-tell-youre-a-nooby-359487f22c97
https://medium.com/geekculture/10-python-mistakes-that-tell-youre-a-nooby-359487f22c97
Medium
10 Python Mistakes That Tell You’re a Nooby
#1. Using import *
Forwarded from Data Engineering / Инженерия данных / Data Engineer / DWH
Complete Data Engineer’s Vocabulary | by Kovid Rathee | Towards Data Science
https://towardsdatascience.com/complete-data-engineers-vocabulary-87967e374fad
https://towardsdatascience.com/complete-data-engineers-vocabulary-87967e374fad
Medium
Complete Data Engineer’s Vocabulary
Concepts that data engineers must know in 10 words or less
Pandas_in_7_Days_Utilize_Python_to_Manipulate_Data,_Conduct_Scientific.pdf
6.1 MB
Pandas in 7 Days: Utilize Python to Manipulate Data, Conduct Scientific Computing, Time Series Analysis (eng)
Table of Contents
1. Pandas, the Python library
2. Setting up a Data Analysis Environment
3. Day 1 - Data Structures in Pandas library
4. Day 2 - Working within a DataFrame, Basic Functionalities
5. Day 3 - Working within a DataFrame, Advanced Functionalities
6. Day 4 - Working with two or more DataFrames
7. Day 5 - Working with data sources and real-word datasets
8. Day 6 - Troubleshooting Challenges wit Real Datasets
9. Day 7 - Data Visualization and Reporting
10. Conclusion – Moving Beyond
Table of Contents
1. Pandas, the Python library
2. Setting up a Data Analysis Environment
3. Day 1 - Data Structures in Pandas library
4. Day 2 - Working within a DataFrame, Basic Functionalities
5. Day 3 - Working within a DataFrame, Advanced Functionalities
6. Day 4 - Working with two or more DataFrames
7. Day 5 - Working with data sources and real-word datasets
8. Day 6 - Troubleshooting Challenges wit Real Datasets
9. Day 7 - Data Visualization and Reporting
10. Conclusion – Moving Beyond
Time_Series_Analysis_with_Python_Cookbook_Practical_recipes_for.pdf
38.7 MB
Time Series Analysis with Python Cookbook: Practical recipes for exploratory data analysis, data preparation, forecasting, and model evaluation
2022
🏷 Getting Started with Time Series Analysis
🏷 Reading Time Series Data from Files
🏷 Reading Time Series Data from Databases
🏷 Persisting Time Series Data to Files
🏷 Persisting Time Series Data to Databases
🏷 Working with Date and Time in Python
🏷 Handling Missing Data
🏷 Outlier Detection Using Statistical Methods
🏷 Exploratory Data Analysis and Diagnosis
🏷 Building Univariate Time Series Models Using Statistical Methods
🏷 Additional Statistical Modeling Techniques for Time Series
🏷 Forecasting Using Supervised Machine Learning
🏷 Deep Learning for Time Series Forecasting
🏷 Outlier Detection Using Unsupervised Machine Learning
🏷 Advanced Techniques for Complex Time Series
2022
🏷 Getting Started with Time Series Analysis
🏷 Reading Time Series Data from Files
🏷 Reading Time Series Data from Databases
🏷 Persisting Time Series Data to Files
🏷 Persisting Time Series Data to Databases
🏷 Working with Date and Time in Python
🏷 Handling Missing Data
🏷 Outlier Detection Using Statistical Methods
🏷 Exploratory Data Analysis and Diagnosis
🏷 Building Univariate Time Series Models Using Statistical Methods
🏷 Additional Statistical Modeling Techniques for Time Series
🏷 Forecasting Using Supervised Machine Learning
🏷 Deep Learning for Time Series Forecasting
🏷 Outlier Detection Using Unsupervised Machine Learning
🏷 Advanced Techniques for Complex Time Series
GitHub - Zeutschler/tinyolap: TinyOlap is a light-weight, in-process, in-memory, multi-dimensional, model-first OLAP engine for planning, budgeting, reporting, analysis and many other numerical purposes, written in plain Python.
https://github.com/Zeutschler/tinyolap
https://github.com/Zeutschler/tinyolap
GitHub
GitHub - Zeutschler/tinyolap: TinyOlap is a light-weight, in-process, in-memory, multi-dimensional, model-first OLAP engine for…
TinyOlap is a light-weight, in-process, in-memory, multi-dimensional, model-first OLAP engine for planning, budgeting, reporting, analysis and many other numerical purposes, written in plain Python...
Apache Superset Alternatives - Python Data Visualization | LibHunt
https://python.libhunt.com/caravel-alternatives
https://python.libhunt.com/caravel-alternatives
Libhunt
Apache Superset Alternatives - Python Data Visualization | LibHunt
Apache Superset is a Data Visualization and Data Exploration Platform [Moved to: https://github.com/apache/superset]. Tags: Data Visualization, BI, Business Intelligence, Dashboards, Analytics.