Telegram Web Link
🧮🏭 Индустриальная математика: когда ∫f(x)dx равно миллиардам

Индустриальная математика предлагает эффективные решения для самых сложных проблем реального мира. В нашей статье мы рассмотрим сущность индустриальной математики, ее краткую историю и современные тренды, а также обсудим, кому подходит эта профессия.

🔗 Статья
Вакансии «Библиотеки программиста» — ждем вас в команде!

Мы постоянно растем и развиваемся, поэтому создали отдельную страницу, на которой будут размещены наши актуальные вакансии. Сейчас мы ищем:
👉авторов в наше медиа proglib.io
👉контент-менеджеров для ведения телеграм-каналов

Подробности тут

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Ждем ваших откликов 👾
Что такое JAX?

JAX — это фреймворк для вычислений и исследований в области машинного обучения. Он предоставляет API, совместимое с NumPy, и поддерживает автоматическое дифференцирование, векторизацию, параллелизацию и компиляцию в реальном времени для GPU/TPU. JAX ориентирован на скорость и производительность и подходит для обучения больших моделей, требующих мощных ускорителей.

🔗 Ссылка на документацию JAX

#программирование
🧪 Байесовское A/B-тестирование vs частотное: преимущества, недостатки и способ реализации на Python

A/B-тестирование — это метод сравнения двух версий чего-либо для определения, какая из них работает лучше.

В новой статье разберёмся, в каких случаях лучше применять частотный подход, а в каких — байесовский, и напишем продвинутый байесовский тест на Python без использования специальных A/B-библиотек.

👉 Читать статью
Для чего нужен Apache Airflow?

Apache Airflow — это инструмент для создания, планирования и управления сложными пайплайнами данных. Он особенно полезен в ситуациях, когда необходимо автоматизировать процессы обработки данных, включающие выполнение большого количества задач в определённой последовательности или параллельно.

Вот задачи, которые решает Apache Airflow:

▪️Позволяет запускать пайплайны по расписанию. Это может быть как простое расписание (например, ежедневное выполнение), так и сложное, например, запуск во второй вторник каждого месяца.

▪️Помогает организовать выполнение задач в правильном порядке. Например, если нужно сначала загрузить данные с нескольких источников, а затем выполнить их обработку, Airflow позволяет настроить последовательное или параллельное выполнение задач.

▪️Предоставляет интерфейс для мониторинга выполнения пайплайнов, где можно видеть историю выполнения задач, анализировать логи и производительность, а также повторно запускать задачи при необходимости.

Кроме того, Apache Airflow поддерживает интеграцию с различными внешними сервисами (например, базами данных).

#данные
🐍📈 Бэктест на Python: оцениваем торговую стратегию

Бэктестинг — это метод, который используется в трейдинге и инвестировании для оценки эффективности торговой стратегии (или инвестиционного подхода) с помощью исторических рыночных данных.

Проще говоря, это процесс проверки того, как стратегия работала бы в прошлом, если бы её применяли к реальным данным.

👉 В новой статье разбираемся, как реализовать бэктестинг на Python
В чем разница между вероятностью и правдоподобием?

▪️В случае с вероятностью мы оцениваем вероятность наступления определённого события, исходя из фиксированного параметра, который мы считаем известным. Например, если мы предполагаем, что монета честная, мы принимаем вероятность выпадения орла за 0.5.

Таким образом, вероятность позволяет оценить, каковы шансы каждого из возможных исходов при многократных испытаниях.

▪️Правдоподобие — это оценка того, насколько хорошо наблюдаемые данные соответствуют гипотезе или параметрам модели. В этом случае данные зафиксированы, и мы пытаемся определить, при каком значении параметра правдоподобие (вероятность появления таких данных) будет максимальным. Например, если при подбрасывании монеты 10 раз выпало 7 орлов, мы можем вычислить, какая вероятность выпадения орла (не обязательно 0.5) лучше всего объясняет полученные данные.

#теория_вероятностей
Для каких алгоритмов машинного обучения не нужно масштабирование признаков?

Для некоторых алгоритмов машинного обучения необязательно проводить масштабирование признаков, поскольку они не зависят от расстояний или линейных комбинаций признаков.

К таким алгоритмам относятся:

▪️дерево решений;
▪️случайный лес (так как строится над деревьями решений);
▪️градиентный бустинг над деревьями решений;
▪️наивный байесовский классификатор (так как его основная идея заключается в вычислении условных вероятностей для каждого признака и класса на основе данных).

#машинное_обучение
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Как с помощью линейной модели понять, от каких признаков можно сразу избавиться?

Есть несколько способов:

▪️Посмотреть на коэффициенты при признаках
Они показывают, насколько сильно каждый признак влияет на целевую переменную. Если коэффициент признака близок к нулю, это может означать, что данный признак мало влияет на прогноз, и его можно исключить.

▪️Использовать регуляризацию
L1-регуляризация (Lasso) может обнулять коэффициенты некоторых признаков, что прямо указывает на их малую значимость.

▪️Проверить значимости признаков
Методы статистического тестирования (например, t-тест для каждого признака) могут показать, являются ли коэффициенты значимыми. Если какой-то признак незначим, его вклад в предсказание минимален, и его можно исключить из модели.

#машинное_обучение
🤖 6 основных алгоритмов машинного обучения: руководство для начинающих

В новой статье мы расскажем о шести основных алгоритмах машинного обучения и их практическом применении в различных отраслях.

Вот алгоритмы, которые мы рассмотрим:

🔹линейная регрессия;
🔹SVM;
🔹дерево решений;
🔹случайный лес;
🔹наивный байес;
🔹логистическая регрессия.

🔗 Читать статью
👆Небольшая памятка по основным алгоритмам машинного обучения и их гиперпараметрам👆

▪️Линейная регрессия
Параметр регуляризации (например, альфа для Ridge/Lasso регрессии).

▪️Логистическая регрессия
Параметр C (обратная сила регуляризации), штраф (L1, L2).

▪️Дерево решений
Глубина дерева (Max_depth), минимальное количество образцов для разделения (min_samples_split), минимальное количество образцов на лист (min_samples_leaf), критерий разделения (criterion).

▪️K-Nearest Neighbors (KNN)
Количество соседей (n_neighbors), веса (weights), метрика (metric).

▪️Support Vector Machines (SVM)
Параметр C, ядро (kernel), гамма (gamma), степень (для полиномиального ядра).
👾 -35% на хардкорный курс по вышмату

На курсе вы получите все необходимые знания для старта карьеры в DS или аналитике – https://proglib.io/w/b10d5805

19 490 рублей 29 990 рублей

Что еще вас ждет на курсе:

▪️ Полугодовая программа от преподавателей ВМК МГУ;

▪️ 150 практических заданий и 47 видеолекций;

▪️ Бессрочный доступ ко всем материалам курса;

▪️ Развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы.

🌚 Переходите на сайт, читайте подробности и заходите на обучение по самым выгодным условиям – https://proglib.io/w/b10d5805
Please open Telegram to view this post
VIEW IN TELEGRAM
🐍🔍 7 малоизвестных возможностей стандартной библиотеки Python

Стандартная библиотека Python — это кладезь возможностей. Мы представляем семь недооценённых модулей, которые помогут вам улучшить организацию данных, оптимизировать производительность и упростить распространение ваших программ.

🔗 Читать обо всём в статье
2024/09/29 20:24:26
Back to Top
HTML Embed Code: