bootg.com »
United States »
Библиотека собеса по Data Science | вопросы с собеседований » Telegram Web
Как мы можем узнать, какие функции более важны для модели дерева решений?
Часто мы хотим найти такое разделение, которое минимизирует сумму примесей узлов. Критерий примеси является параметром деревьев решений. Популярными методами измерения примеси являются примесь Джини и энтропия, описывающая прирост информации.
Часто мы хотим найти такое разделение, которое минимизирует сумму примесей узлов. Критерий примеси является параметром деревьев решений. Популярными методами измерения примеси являются примесь Джини и энтропия, описывающая прирост информации.
👍3😱1😢1
Знаете ли вы какие-либо способы получения вложений слов?
TF-IDF
GloVe
BERT
TF-IDF
GloVe
BERT
👍1
Что такое объединение в CNN? Зачем нам это нужно?
Объединение — это метод понижения разрешения карты объектов. Это позволяет слоям, которые получают относительно неискаженные версии входных данных, изучать низкоуровневые функции, такие как линии, в то время как более глубокие слои модели могут изучать более абстрактные функции, такие как текстура.
Объединение — это метод понижения разрешения карты объектов. Это позволяет слоям, которые получают относительно неискаженные версии входных данных, изучать низкоуровневые функции, такие как линии, в то время как более глубокие слои модели могут изучать более абстрактные функции, такие как текстура.
🤔3👍1
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
👍1
Что происходит, когда в наших данных есть коррелированные фичи?
В случайном лесу, поскольку случайный лес выбирает некоторые объекты для построения каждого дерева, вероятность выбора информации, содержащейся в коррелированных объектах, в два раза выше, чем любая другая информация, содержащаяся в других объектах.
В общем, когда вы добавляете коррелированные функции, это означает, что они линейно содержат одну и ту же информацию, и, следовательно, это снижает надежность вашей модели. Каждый раз, когда вы тренируете свою модель, она может выбирать ту или иную функцию, чтобы «выполнить одну и ту же работу», т. е. объяснить некоторую дисперсию, уменьшить энтропию и т. д.
В случайном лесу, поскольку случайный лес выбирает некоторые объекты для построения каждого дерева, вероятность выбора информации, содержащейся в коррелированных объектах, в два раза выше, чем любая другая информация, содержащаяся в других объектах.
В общем, когда вы добавляете коррелированные функции, это означает, что они линейно содержат одну и ту же информацию, и, следовательно, это снижает надежность вашей модели. Каждый раз, когда вы тренируете свою модель, она может выбирать ту или иную функцию, чтобы «выполнить одну и ту же работу», т. е. объяснить некоторую дисперсию, уменьшить энтропию и т. д.
👍4
Что такое временной ряд?
Временной ряд — это набор наблюдений, упорядоченных во времени, обычно собираемых через равные промежутки времени.
Временной ряд — это набор наблюдений, упорядоченных во времени, обычно собираемых через равные промежутки времени.
Когда вы выберете K-средние, а когда DBScan?
DBScan более устойчив к шуму.
DBScan лучше подходит, когда количество кластеров трудно угадать.
K-means имеет меньшую сложность, т. е. будет намного быстрее, особенно при большем количестве точек.
DBScan более устойчив к шуму.
DBScan лучше подходит, когда количество кластеров трудно угадать.
K-means имеет меньшую сложность, т. е. будет намного быстрее, особенно при большем количестве точек.
👍1
Что такое ансамбль методов?
Ансамбль методов — это использование нескольких алгоритмов с целью получения более высокой эффективности прогнозирования, чем можно было бы получить, используя эти алгоритмы отдельно.
Ансамбль методов — это использование нескольких алгоритмов с целью получения более высокой эффективности прогнозирования, чем можно было бы получить, используя эти алгоритмы отдельно.
👍1
Курсы для тех, кто хочет получить новые скиллы или перейти в другую компанию на грейд выше
🔥Начните с демо-доступа или бесплатных вебинаров с преподавателем
🔹 Математика для Data Science
Самый хардкорный курс по вышмату! Идеален для тех, кто переходит в DS.
🔹 Алгоритмы и структуры данных
Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.
🔹 Базовые модели ML и приложения
Познакомит с основными моделями машинного обучения, заложите основу для дальнейшего изучения более сложных нейронных сетей
🔹Архитектуры и шаблоны
проектирования
Освойте основные паттерны проектирования и прокачайте навыки построения архитектуры программного обеспечения
Приятного обучения и ваш промокод на скидку 30% до 25 октября – MIDDLE
🔥Начните с демо-доступа или бесплатных вебинаров с преподавателем
🔹 Математика для Data Science
Самый хардкорный курс по вышмату! Идеален для тех, кто переходит в DS.
🔹 Алгоритмы и структуры данных
Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.
🔹 Базовые модели ML и приложения
Познакомит с основными моделями машинного обучения, заложите основу для дальнейшего изучения более сложных нейронных сетей
🔹Архитектуры и шаблоны
проектирования
Освойте основные паттерны проектирования и прокачайте навыки построения архитектуры программного обеспечения
Приятного обучения и ваш промокод на скидку 30% до 25 октября – MIDDLE
👍1
В чём разница между машинным обучением и глубоким обучением?
Машинное обучение позволяет обучать компьютерную систему без её фактического программирования. А глубокое обучение — это подвид машинного обучения, который основан на аналогии нейронных сетей человеческого мозга. Это похоже на то, как наш мозг работает для решения проблем: чтобы найти ответ, он пропускает запросы через различные иерархии концепций и связанных вопросов.
Машинное обучение позволяет обучать компьютерную систему без её фактического программирования. А глубокое обучение — это подвид машинного обучения, который основан на аналогии нейронных сетей человеческого мозга. Это похоже на то, как наш мозг работает для решения проблем: чтобы найти ответ, он пропускает запросы через различные иерархии концепций и связанных вопросов.
👍5
Назовите несколько фреймворков для глубокого обучения
Pytorch.
TensorFlow.
Microsoft Cognitive Toolkit.
Keras.
Caffe.
Chainer.
Pytorch.
TensorFlow.
Microsoft Cognitive Toolkit.
Keras.
Caffe.
Chainer.
👍5❤1
Объясните алгоритм машинного обучения SVM.
SVM, или машина опорных векторов, представляет собой алгоритм обучения с учителем, который может использоваться для классификации и регрессии. Он стремится построить модель в n-мерном пространстве, где каждая функция соответствует определенной координате. SVM использует гиперплоскости для разделения различных классов на основе выбранной функции ядра.
SVM, или машина опорных векторов, представляет собой алгоритм обучения с учителем, который может использоваться для классификации и регрессии. Он стремится построить модель в n-мерном пространстве, где каждая функция соответствует определенной координате. SVM использует гиперплоскости для разделения различных классов на основе выбранной функции ядра.
❤3👍1
У вас есть набор данных, который содержит информацию о времени, когда пользователи кликают на рекламу. Как можно использовать эти данные для оптимизации рекламных кампаний?
Существует множество возможностей использования этих данных для оптимизации рекламных кампаний. Один из подходов заключается в создании модели, которая анализирует данные и прогнозирует, когда пользователи наиболее вероятно будут нажимать на рекламу. Это позволит оптимизировать размещение рекламы, например, увеличивать ставки в те моменты, когда вероятность клика выше. Другой способ — использование данных для сегментации пользователей на группы в зависимости от их вероятности клика на рекламу. Это позволит создавать более персонализированные и целевые рекламные сообщения для каждой группы пользователей.
#вопросы_с_собеседований
Существует множество возможностей использования этих данных для оптимизации рекламных кампаний. Один из подходов заключается в создании модели, которая анализирует данные и прогнозирует, когда пользователи наиболее вероятно будут нажимать на рекламу. Это позволит оптимизировать размещение рекламы, например, увеличивать ставки в те моменты, когда вероятность клика выше. Другой способ — использование данных для сегментации пользователей на группы в зависимости от их вероятности клика на рекламу. Это позволит создавать более персонализированные и целевые рекламные сообщения для каждой группы пользователей.
#вопросы_с_собеседований
❤6
🧑💻 Статьи для IT: как объяснять и распространять значимые идеи
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
👍3
Что такое Random Forest?
Random Forest, или случайный лес, — это один из немногих универсальных алгоритмов обучения, который способен выполнять задачи классификации, регрессии и кластеризации.
Случайный лес состоит из большого количества отдельных деревьев решений, которые по сути являются ансамблем методов. Каждое дерево в случайном лесу возвращает прогноз класса, и класс с наибольшим количеством голосов становится прогнозом леса.
Random Forest, или случайный лес, — это один из немногих универсальных алгоритмов обучения, который способен выполнять задачи классификации, регрессии и кластеризации.
Случайный лес состоит из большого количества отдельных деревьев решений, которые по сути являются ансамблем методов. Каждое дерево в случайном лесу возвращает прогноз класса, и класс с наибольшим количеством голосов становится прогнозом леса.
👍6
В чем отличие между искусственным интеллектом, машинным обучением и Data Science?
Термин "Искусственный интеллект" (ИИ) охватывает широкий спектр приложений, начиная от робототехники и заканчивая анализом текста. Он объединяет как бизнес-аспекты, так и технические аспекты. Машинное обучение, в свою очередь, является подмножеством ИИ и фокусируется на узком круге задач, выполняя в основном техническую роль. Data Science (наука о данных) не является подмножеством машинного обучения, но использует его для анализа данных и предсказания будущих событий. Главным образом, Data Science ориентирована на бизнес-приложения.
Термин "Искусственный интеллект" (ИИ) охватывает широкий спектр приложений, начиная от робототехники и заканчивая анализом текста. Он объединяет как бизнес-аспекты, так и технические аспекты. Машинное обучение, в свою очередь, является подмножеством ИИ и фокусируется на узком круге задач, выполняя в основном техническую роль. Data Science (наука о данных) не является подмножеством машинного обучения, но использует его для анализа данных и предсказания будущих событий. Главным образом, Data Science ориентирована на бизнес-приложения.
Для чего нужен Scrapy?
Scrapy — это фреймворк для извлечения данных из веб-сайтов. Он используется для автоматического сбора структурированных данных из веб-страниц, таких как цены товаров, информация о продуктах, контактные данные и многое другое.
Этот код создает веб-паука, который извлекает цены товаров с сайта example.com. Он использует CSS-селекторы для поиска элементов страницы, содержащих информацию о продуктах, и извлекает их название и цену.
Scrapy — это фреймворк для извлечения данных из веб-сайтов. Он используется для автоматического сбора структурированных данных из веб-страниц, таких как цены товаров, информация о продуктах, контактные данные и многое другое.
Этот код создает веб-паука, который извлекает цены товаров с сайта example.com. Он использует CSS-селекторы для поиска элементов страницы, содержащих информацию о продуктах, и извлекает их название и цену.
💯1
Как выбрать, какие аугментации использовать?
Дополнения действительно зависят от типа выходных классов и функций, которые вы хотите, чтобы ваша модель изучила. Например. Если в вашем наборе данных в основном есть правильно освещенные изображения и вы хотите, чтобы ваша модель прогнозировала и плохо освещенные изображения, вы можете применить сдвиг каналов к своим данным и включить полученные изображения в свой набор данных для получения лучших результатов.
Дополнения действительно зависят от типа выходных классов и функций, которые вы хотите, чтобы ваша модель изучила. Например. Если в вашем наборе данных в основном есть правильно освещенные изображения и вы хотите, чтобы ваша модель прогнозировала и плохо освещенные изображения, вы можете применить сдвиг каналов к своим данным и включить полученные изображения в свой набор данных для получения лучших результатов.
Что такое рекомендательные системы?
Рекомендательные системы — это подкласс информационных фильтров, которые используются для прогнозирования предпочтений или оценок, которые пользователь может выставить продукту. Эти системы нашли широкое применение в различных областях, таких как фильмы, новости, статьи, товары, музыка и другие.
Рекомендательные системы — это подкласс информационных фильтров, которые используются для прогнозирования предпочтений или оценок, которые пользователь может выставить продукту. Эти системы нашли широкое применение в различных областях, таких как фильмы, новости, статьи, товары, музыка и другие.
Вам предоставлен набор данных, содержащий информацию о том, когда пользователи нажимают на рекламу. Как бы вы использовали эти данные для оптимизации рекламных кампаний?
Существует множество методов, которые позволяют использовать эти данные для оптимизации рекламных кампаний. Один из подходов заключается в создании модели на основе этих данных, которая способна предсказывать, когда пользователи с большей вероятностью будут нажимать на рекламу. Другой подход заключается в использовании данных для разделения пользователей на группы в зависимости от их вероятности клика на рекламу.
Существует множество методов, которые позволяют использовать эти данные для оптимизации рекламных кампаний. Один из подходов заключается в создании модели на основе этих данных, которая способна предсказывать, когда пользователи с большей вероятностью будут нажимать на рекламу. Другой подход заключается в использовании данных для разделения пользователей на группы в зависимости от их вероятности клика на рекламу.