Search
Write a publication
Pull to refresh
18
0
Павел @PDudukin

Data Science Lead

Send message

Добрый день!

Да, вы отчасти правы, такая логика действительно имеет место. В частности, у нас она используется лишь в одном месте - в блоке популярных фермеров. Но, к слову, эти фермеры в блоке все равно перемешиваются с действительно популярными фермерами на платформе, полученными с помощью рекомендаций.

Во всех остальных местах платформы в качестве рекомендаций по рейтингам используется ровно та логика, что описана в статье.

На текущий момент на площадке "Свое Родное" размещено порядка 40000 товаров, а на "Свое Фермерство" - почти 1200000 товаров. Так как финально обучаем модель на всем датасете, то количество товаров и есть размер датасета.

Добрый день! Периодически набираем, конечно. Вакансии аналитиков данных/исследователей данных обычно публикуем в ODS-сообществе в Slack. Но можно и просто связаться со мной - рассмотрим.

Да, просто поиск по словарю точных вхождений, все верно. Технически, просто CountVectorizer. Более сложные вещи оставили на разбор нейросетке.
Добрый день!

Отвечу: специально не стали вставлять в статью много примеров, так как каждый может придумать для себя их сколько угодно. В статье упоминается один пример — про «не суй свое рыло» vs «продам свиное рыло». Про арбуз — это просто картинка про то, как верхнеуровнево работает BERT.

Приведу здесь еще несколько примеров:

  • «Засорять почву» vs «Засирать урожай»
  • «Продаю козла» vs «Ах ты козел»
  • «Имею в наличии отличный хрен» vs «Ну и хрень этот товар»

и еще много-много других :)

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity

Specialization

Data Scientist, ML Engineer
Lead
Git
SQL
Python
PostgreSQL
Machine learning