Библиотека собеса по Data Science | вопросы с собеседований 17

Библиотека собеса по Data Science | вопросы с собеседований

Channel created

13:51

Библиотека собеса по Data Science | вопросы с собеседований

Что такое ансамбль методов?

Ансамбль методов — это использование нескольких алгоритмов с целью получения более высокой эффективности прогнозирования, чем можно было бы получить, используя эти алгоритмы отдельно.

👍6⚡1

1.01K views18:52

Библиотека собеса по Data Science | вопросы с собеседований

Что такое Random Forest?

Random Forest, или случайный лес, — это один из немногих универсальных алгоритмов обучения, который способен выполнять задачи классификации, регрессии и кластеризации.

Случайный лес состоит из большого количества отдельных деревьев решений, которые по сути являются ансамблем методов. Каждое дерево в случайном лесу возвращает прогноз класса, и класс с наибольшим количеством голосов становится прогнозом леса.

🔥6👍2⚡1

1.02K views07:25

Библиотека собеса по Data Science | вопросы с собеседований

Для чего нужен Scrapy?

Scrapy — это фреймворк для извлечения данных из веб-сайтов. Он используется для автоматического сбора структурированных данных из веб-страниц, таких как цены товаров, информация о продуктах, контактные данные и многое другое.

Этот код создает веб-паука, который извлекает цены товаров с сайта example.com. Он использует CSS-селекторы для поиска элементов страницы, содержащих информацию о продуктах, и извлекает их название и цену.

❤4👍3⚡1

1.02K views07:13

Библиотека собеса по Data Science | вопросы с собеседований

Запустится ли этот код на Python 3? Если да, то что он выведет?

sys.allow_boolean_assignment разрешает создавать переменные с именами, зарезервированными под идентификаторы типа bool. Поэтому этот код запустится и выведет "True is False".

Эта настройка введена в известном первоапрельском коммите, который до сих пор остался в коде интерпретатора. Если кандидат об этом знает, можно с уверенностью сказать, что он общается в должных профессиональных кругах и любят углубляться в детали.

👍7❤2⚡1

885 views12:48

Библиотека собеса по Data Science | вопросы с собеседований

Расскажите про какую-нибудь полезную библиотеку с машинным обучением, которую вы недавно использовали.

Для сравнения двух лиц на фото в Python можно использовать библиотеку face_recognition. В этом примере мы сначала загружаем изображения лиц и находим лица на изображениях с помощью функции face_locations().

Затем мы кодируем найденные лица с помощью функции face_encodings() и сравниваем их между собой с помощью функции compare_faces(). Результат сравнения — список булевых значений (True или False), которые сообщают, совпадают ли два лица на фото.

👍7⚡1

927 views07:16

Библиотека собеса по Data Science | вопросы с собеседований

Приведите пример библиотеки для создания графиков

Leather используется для создания графиков. В отличие от ряда подобных библиотек, Leather способна взаимодействовать с широким разнообразием данных и выводить их через векторную графику.

В примере используются следующие функции:
leather.Chart() — создает график с заданным заголовком.
chart.add_dots() — добавляет точки на график. Также в ней можно указать функцию для определения цвета точек.
chart.to_svg() — позволяет сохранить график в формате .svg в указанный файл.

На втором изображении представлен результат работы программы.

👍4⚡1🔥1

999 views07:16

Библиотека собеса по Data Science | вопросы с собеседований

Объясните, как работает функция map

Она возвращает объект (итератор), который перебирает значения, применяя функцию к каждому элементу. В случае необходимости объект можно преобразовать в список:

def add_three(x):
return x + 3
li = [1,2,3]
list(map(add_three, li))
#=> [4, 5, 6]

Здесь к каждому элементу в списке мы добавляем число 3.

👍7

1.03K views07:15

Библиотека собеса по Data Science | вопросы с собеседований

Как работает умножение списка?

Посмотрим на результат умножения списка [1,2,3] на 2:
[1,2,3] * 2
#=> [1, 2, 3, 1, 2, 3]

Содержание списка [1,2,3] повторяется дважды.

👍4

998 views07:17

Библиотека собеса по Data Science | вопросы с собеседований

Предложите библиотеку для прогнозирования временных рядов.

PyFlux — это библиотека для прогнозирования временных рядов. Она предоставляет удобный интерфейс для работы с моделями временных рядов, такими как анализ авторегрессии (AR), интегрированной скользящей средней (ARIMA), авторегрессии скользящего среднего (ARMA) и др.

В этом примере создается искусственный временной ряд и на его основе модель ARMA обучается для прогнозирования следующих 10 значений этого ряда.

👍10

1.17K views12:07

Библиотека собеса по Data Science | вопросы с собеседований

Какая разница между словарями и JSON?

Dict (словарь) — это тип данных Python, представляющий собой набор индексированных, но неупорядоченных пар ключ-значение.

JSON — просто строка, которая следует заданному формату и предназначена для передачи данных.

👍2

1.18K views07:18

Библиотека собеса по Data Science | вопросы с собеседований

В чем разница между append и extend?

append добавляет значения в список, а extend добавляет в список значения из другого списка:
a = [1,2,3]
b = [1,2,3]

a.append(6)
print(a)
#=> [1, 2, 3, 6]

b.extend([4,5])
print(b)
#=> [1, 2, 3, 4, 5]

👍4👏2

1.17K views07:12

Библиотека собеса по Data Science | вопросы с собеседований

Как вернуть двоичный код целого числа?

Используйте функцию bin():
bin(5)
#=> '0b101'

👍2

1.11K views07:18

Библиотека собеса по Data Science | вопросы с собеседований

Что такое градиентный спуск? Как это работает?

Градиентный спуск — это алгоритм, который использует концепцию исчисления градиента, чтобы попытаться достичь локальных или глобальных минимумов. Он работает, беря отрицательное значение градиента в точке заданной функции и многократно обновляет эту точку, используя вычисленный отрицательный градиент, пока алгоритм не достигнет локального или глобального минимума, что приведет к тому, что будущие итерации алгоритма будут возвращать значения, которые равны или слишком близки к текущей точке. Он широко используется в приложениях машинного обучения.

👍6👎3❤1

1.25K views07:20

2025/10/25 16:38:00
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>