Евгений @smirnovevgeny
Head of ML Laboratory & Chief Data Scientist
Информация
- В рейтинге
- Не участвует
- Откуда
- Москва, Москва и Московская обл., Россия
- Работает в
- Зарегистрирован
- Активность
Специализация
Руководитель Лаборатории машинного обучения
Lead
Machine learning
Deep Learning
Natural language processing
Neural networks
Найти новость в публичном пространстве.
Сделать официальный запрос в банк в письменном виде.
Убедитесь, что ваш банк получает такие данные.
Воспользуетесь веб-сайтом или позвоните в колл-центр.
На категорию товара литраж и жирность никак не влияют, а сокращение алфавита положительно влияет на устойчивость к переобучению.
" Для решения задачи команда использовала самообучающийся вероятностный алгоритм, который эффективно находит подходящие пары транзакция-чек." https://www.digitalleague.ru/project/sistema-matchinga-chekov-dlya-nacional-noj-sistemy-platezhnyh-kart
Новость по теме - https://mironline.ru/press-center/press-releases/18-12-2018-takskom-i-bank-tsentr-invest-podklyuchilis-k-servisu-nspk-po-privyazk/
Согласия в вашем банке скорее всего предоставляются/отзываются в рамках интерфейса мобильного приложения.
Как клиенту, мне удобно просматривать историю покупок в приложении. Зачем нужно банкам расскажу в следующей статье. Согласия должны предоставляться/отключаться в рамках мобильного приложения.
Действительно в ОФД должно поступать больше данных, чем в оригинале чека, но в соревновании эти данные не были доступны) Безусловно банки ищут выгоду и для себя. Банки могут сделать и сервисы для клиентов: автоматический возврат налога, детализированный пирог трат в мобильном приложении или даже поиск лучших предложений в ближайших магазинах.
Нужно разработать модель машинного обучения, которая будет по входным данным, например, "Молоко Домик.в деревне 3.2% 0.5л пл/б БЗМЖ/Россия выбирать к какой из 90 заранее заданных категорий относится товарная позиция, например, "Молочные продукты". Предварительно до обучения алгоритма люди размечают набор примеров для каждой из категории. Модель обучается на основе размеченных примеров, а затем применяется на примерах, которые ранее не видела. Качество оценивают по специально отложенным размеченным примерам, на которых модель не обучалась.
Детектировались оба кусочка: розовый прямоугольник + белая подпись (видно часть надписи - "..сочек 100%") и черный прямоугольник + красная подпись
2. Организаторы переписали LightFM под себя, в частности модифицировали WARP Loss
3. Организаторы использовали top400 элементов контена от модели первого уровня для обучения модели второго уровня, в этом решении использовался топ200
4. Организаторы использовали LambdaRank
5. У организаторов зашла фича — число аттрибутов у фильма
6. У организаторов не заходили вектора пользователей из LightFM
Часть информации была подчерпнута из статьи, остальная часть из общения с devpony