Статьи / Закладки / Профиль maximw / Хабр

Maxim W @maximw

backend developer

Профиль Публикации 4Комментарии 1.8KЗакладки 590

Picard 9 дек 2020 в 16:52

Как бы я изучал Data Science, если бы начал пару лет назад, или Руководство по эффективному изучению науки о данных

5 мин

30K

Алгоритмы*Математика*Блог компании SkillfactoryКарьера в IT-индустрииData Engineering*

Перевод

Когда я только начал своё путешествие к науке о данных, я потратил много времени на то, чтобы понять, с чего начать, что я должен узнать в первую очередь и какие ресурсы должен использовать. За последние два года я узнал несколько вещей, о которых хотел знать раньше, например о том, стоит ли сначала сосредоточиться на программировании или статистике, какие ресурсы я должен использовать для изучения новых навыков, как я должен подходить к изучению этих навыков и так далее. Таким образом, эта статья написана, чтобы дать направления и идеи для тех, кто изучает Data Science.

Приятного чтения!

+35

wileyfoxy 6 дек 2020 в 00:49

Хотите стать «учёным по данным»? Тогда не начинайте с машинного обучения

4 мин

9.4K

Машинное обучение*Искусственный интеллект

Из песочницы

Перевод

Самое большое заблуждение начинающих data scientist'ов, или что лучше стоит делать вместо изучения машинного обучения.

Razoomnick 27 ноя 2020 в 05:51

Как мы сделали автоматический подбор похожих товаров

7 мин

5.8K

Веб-разработка*Алгоритмы*Разработка под e-commerce*Управление e-commerce*Развитие стартапа

В прошлых статьях я рассказывал, как мы научились сопоставлять товары из разных источников и заполнять карточку товара — характеристики, изображения, описание. А когда цены поставщиков, цены конкурентов и характеристики товара известны, логичным продолжением стал поиск информации об аналогах или просто похожих по своим свойствам товарах.

Использовать это можно разными способами, например, показать покупателю несколько похожих позиций на карточке товара, возможно, какая-то ему приглянется больше. Если чего-то нет в наличии, список похожих товаров в наличии тоже будет не лишним. Второй вариант — дать эту информацию сотрудникам колл-центра, чтобы они могли быстрее (или в принципе могли) предлагать аналоги, если запрашиваемого товара нет в наличии, или аналог лучше подходит под пожелания клиента.

Как определить, что товары похожи? Можно сравнить характеристики, чем больше совпало, тем более похожи товары. Но это не работает так просто, к сожалению. На практике оказывается, что, как правило, почти не бывает товаров, где заполнены все характеристики. 80% — хороший результат. Во-вторых, какие-то характеристики важнее, чем другие. Например, телевизор с диагональю в 65 дюймов совершенно не похож на телевизор с диагональю 22 дюйма, хотя у обоих по 2 USB-порта. Или, другой пример, металлический корпус и алюминиевый корпус гораздо ближе друг к другу, чем к пластику, хотя это три разных значения.

Начнем сначала

Что делаем

Целевая аудитория

Metasploit

Чеклист проектов по машинному обучению

Советы по отделению отвлекающих факторов от полезных сведений