Как стать автором
Обновить
38
0
Евгений @smirnovevgeny

Head of ML Laboratory & Chief Data Scientist

Отправить сообщение
  1. Найти новость в публичном пространстве.

  2. Сделать официальный запрос в банк в письменном виде.

  1. Убедитесь, что ваш банк получает такие данные.

  2. Воспользуетесь веб-сайтом или позвоните в колл-центр.

На категорию товара литраж и жирность никак не влияют, а сокращение алфавита положительно влияет на устойчивость к переобучению.

" Для решения задачи команда использовала самообучающийся вероятностный алгоритм, который эффективно находит подходящие пары транзакция-чек." https://www.digitalleague.ru/project/sistema-matchinga-chekov-dlya-nacional-noj-sistemy-platezhnyh-kart
Новость по теме - https://mironline.ru/press-center/press-releases/18-12-2018-takskom-i-bank-tsentr-invest-podklyuchilis-k-servisu-nspk-po-privyazk/

Согласия в вашем банке скорее всего предоставляются/отзываются в рамках интерфейса мобильного приложения.

Как клиенту, мне удобно просматривать историю покупок в приложении. Зачем нужно банкам расскажу в следующей статье. Согласия должны предоставляться/отключаться в рамках мобильного приложения.

Действительно в ОФД должно поступать больше данных, чем в оригинале чека, но в соревновании эти данные не были доступны) Безусловно банки ищут выгоду и для себя. Банки могут сделать и сервисы для клиентов: автоматический возврат налога, детализированный пирог трат в мобильном приложении или даже поиск лучших предложений в ближайших магазинах.

Нужно разработать модель машинного обучения, которая будет по входным данным, например, "Молоко Домик.в деревне 3.2% 0.5л пл/б БЗМЖ/Россия выбирать к какой из 90 заранее заданных категорий относится товарная позиция, например, "Молочные продукты". Предварительно до обучения алгоритма люди размечают набор примеров для каждой из категории. Модель обучается на основе размеченных примеров, а затем применяется на примерах, которые ранее не видела. Качество оценивают по специально отложенным размеченным примерам, на которых модель не обучалась.

Детектировались оба кусочка: розовый прямоугольник + белая подпись (видно часть надписи - "..сочек 100%") и черный прямоугольник + красная подпись

По этой задаче было всего два открытых решения, лучшее в полезных ссылках, второе — https://github.com/SlayZar/alpha_task_2. Дополнительно добавил ссылку на презентации победителей.
1. У организаторов время было не в «попугаях», что давало возможность построить правильную валидацию. Участникам соревнования же не было известно за какой период собрана выборка.
2. Организаторы переписали LightFM под себя, в частности модифицировали WARP Loss
3. Организаторы использовали top400 элементов контена от модели первого уровня для обучения модели второго уровня, в этом решении использовался топ200
4. Организаторы использовали LambdaRank
5. У организаторов зашла фича — число аттрибутов у фильма
6. У организаторов не заходили вектора пользователей из LightFM
Часть информации была подчерпнута из статьи, остальная часть из общения с devpony

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Зарегистрирован
Активность

Специализация

Руководитель Лаборатории машинного обучения
Lead
Machine learning
Deep Learning
Natural language processing
Neural networks