Блог компании Инфосистемы Джет

RAIF-Challenge 2017: онлайн-чемпионат по искусственному интеллекту. Применяем ML/AI на практике

В то время как с помощью искусственного интеллекта IBM Watson лучше докторов диагностирует рак, MasterCard и PayPal — отсекают мошеннические операции, а беспилотная техника начала летать наравне с «пилотной», российский бизнес отказывается верить в «великую силу» машинного обучения и искусственного интеллекта. Внедрения успешны, но единичны. Чтобы исправить ситуацию и на практике показать компаниям все возможности подобных технологий, «Инфосистемы Джет» со своими партнерами «М.Видео», «АльфаCтрахование» и банком «УРАЛСИБ» проводят онлайн-чемпионат по ML/AI — RAIF-Challenge 2017 в рамках форума RAIF (Russian Artificial Intelligence Forum). Чемпионат пройдет с 20 сентября по 25 октября.

«Это дорого», «вряд ли это работает», «это какая-то непонятная магия» — вот типичные высказывания российских компаний в адрес технологий машинного обучения и искусственного интеллекта. Отсутствие публичных кейсов «подливает масла в огонь». Тем временем лондонские полицейские с помощью искусственного интеллекта ищут распространителей наркотиков в Instagram по кодовым словам и хэштегам.
Зачем ML/AI бизнесу?
Технологии ML/AI позволяют решить огромный пласт бизнес-задач на базе уже накопленных компанией данных: от оптимизации себестоимости конкретного бизнес-процесса до создания новой услуги. Возможные варианты применения в той или иной отрасли можно перечислять долго, вот лишь некоторые из них:
  • в финансовом секторе — оценка заемщика, оценка рисков кредитования или вложения в финансовые рынки, персонифицированные предложения и т.п.
  • в промышленности/ТЭКе ML/AI часто идут рука об руку с IoT при разработках новых товаров, отслеживании качества и т.п.
  • в ритейле — снижение затрат на обслуживание клиентов (роботы для автоматических ответов и перенаправления клиента) и персонифицированные предложения
  • в медицине — справочники для помощи врачам, анализ фото и данных для оценки рисков при разработке лекарств
  • в интернет-компаниях — фильтрация пользовательского контента, предоставление сервисов и т.д.
Для кого RAIF-Challenge 2017?
Принять участие в Чемпионате могут эксперты в сфере Data Science и талантливые молодые специалисты, студенты или выпускники технических вузов и представители IT-стартапов. Словом, все, кто связывает свое профессиональное развитие с технологиями ML/AI и хочет достичь новых карьерных вершин в этом направлении.
Основные составляющие Чемпионата:
• работа с реальными данными крупных российских компаний
• отраслевое разнообразие и возможность выбора от 1 до 3 номинаций:

1) AI в банках
2) AI в ритейле
3) AI в страховании

• свобода в определении бизнес-задачи и ее решении — организатор не ставит жестких ограничений
• опытные наставники, они же члены Экспертного жюри
• денежное вознаграждение 350 000 рублей для каждой из трех команд-победителей
• возможность дальнейшей реализации своих наработок в реальных проектах для крупного бизнеса
Три команды-победителя, представившие лучшие решения, получат по 350 000 рублей каждая и возможность реализовать свои идеи у партнеров RAIF в виде пилотных проектов
Что в заданиях Чемпионата?
Партнеры RAIF-Challenge 2017 обозначили приоритетные направления, в которых они видят потенциал для внедрения технологий (подробнее — на сайте Чемпионата). Но строгих ограничений нет. Ключевая задача участников — создать аналитическую модель на базе технологий ML/AI, которая позволит представителю отрасли увеличить прибыль или снизить издержки.
Владимир Молодых
директор по разработке и внедрению ПО компании «Инфосистемы Джет»
«В Чемпионате по искусственному интеллекту участникам предоставляется, в первую очередь, шанс громко заявить о себе на рынке. И, конечно, получить реальные контракты, продемонстрировав на практике полезность данных технологий для крупного бизнеса. Мы решили не делать жестких ограничений в постановке задач перед участниками. Главный критерий оценки — польза для отрасли в целом и для конкретного бизнеса»
Вот примеры задач Чемпионата
Банк накапливает информацию об активности клиентов и регулярно проводит мероприятия по привлечению новых и удержанию действующих клиентов. Участникам конкурса предлагается сфокусироваться на второй задаче: удержании действующих клиентов, а именно, на борьбе с оттоком. На основании данных о клиентах, их договорах, картах и активности необходимо:

  1. Вывести определение оттока.
  2. Построить математическую модель, которая будет предсказывать вероятность оттока клиентов, а также предложить методы борьбы с этим явлением с точки зрения бизнеса.

Рентабельность ОСАГО как вида страховой деятельности сегодня сокращается — в том числе из-за роста мошенничества. Для борьбы с ним служба безопасности «АльфаСтрахования» старается выявлять и расследовать подозрительные убытки на стадии урегулирования. При этом специалисты компании тратят немало времени на проверку проблемных случаев, которые не являются мошенническими. В рамках конкурса нужно создать аналитическую модель, которая позволит на основе имеющихся данных о текущих страховых случаях определять вероятность мошенничества.
Онлайн-торговля выступает драйвером рынка электроники и бытовой техники. В этих условиях важно сделать покупательский путь в интернете максимально удобным. Одним из показателей эффективной работы сайта является растущая конверсия, т.е увеличение количества посетителей, перешедших в статус покупателей. Эту задачу и предлагается решить участникам Чемпионата. Это могут быть модели, которые описывают потенциал посетителя к покупке или выявляют группы клиентов, требующие определенной реакции со стороны интернет-помощника. Другие варианты связаны с построением алгоритма интерактивных товарных рекомендаций либо с выявлением проблемных (тупиковых) путей покупателя на сайте.
Каждая из команд-разработчиков (до трех человек) сможет принять участие в одной, двух или всех трех отраслевых секциях. Результатом их конкурсных работ должны будут стать конкретные предложения для бизнеса — например, по созданию новой услуги на базе имеющихся данных, по оптимизации себестоимости определенного бизнес-процесса компании, по снижению убытков или получению сверхприбыли. В частности, это могут быть способы выявления недобросовестных владельцев страховок, варианты увеличения конверсии на сайте, прогнозирование оттока депозитов в банке, решения для привлечения новых и удержания существующих клиентов и т.д.
Напомним: три команды-победителя, представившие лучшие решения, получат по 350 000 рублей каждая и возможность реализовать свои идеи у партнеров RAIF в виде пилотных проектов.
«Инфосистемы Джет» — крупный системный интегратор в сфере информационных технологий, на рынке с 1991 года. Входит в ТОП-20 ИТ-компаний страны. Основные направления деятельности: бизнес-решения и программные разработки, ИТ- и телекомунникационная инфраструктура, информационная безопасноcть, ИТ-аутсорсинг и техническая поддержка, управление комплексными проектами и др. Компания реализует проекты в области ML и AI.


Путь участника
Ознакомиться с условиями конкурса
Выбрать номинацию:
• AI в банках;
• AI в ритейле;
• AI в страховании.
Подать заявку
Отправить презентацию с решением организаторам до 25 октября 2017 г.
Выбор 3 команд-победителей
7 ноября — выступление команд-победителей на RAIF
RAIF-Challenge 2017
Дней
Часов
Минут
Секунд
Комментарии 24
    +2
    Бла бла бла…
    беспилотная техника начала летать наравне с «пилотной»
    Неправда. Зачем пилоты в боингах до сих пор сидят если беспилотной технике не нужна зарплата пилотов?
      +3
      Парковать самолет, взлетать, нести ответственность.
        0
        Это правда. Человек только следит за системой во время полета и в определенных аэропортах НЕ берет управления на себя(есть там уровни обеспечения аэропорта)
          0
          Когда без пилотов, в туман днем, ночью и без JPS и радиосигналов «беспилотная техника» начнет сама взлетать, лететь и приземляться, приэтом общаясь с диспетчером голосом на естественном языке, а иногда и вообще, принимать решения в полной изоляции от внешних коммуникаций, например посадка на воду с визуальной ориентацией, тогда я бы назвал «наравне». И то, мне неизвестно сколько еще я упустил положительных дополнительных условий которые может делать человек но не «беспилотная техника».
        +1
        коллеги, подскажите, а что это за RAIF? а то про него в интернете ничего нет
        +1
        Данные то как скачать? Пароль требует)
          0
          -
            0
            Пароль: raif_challenge. На сайте он указан.
          +1

          Не очень понятно, зачем в статье такое пафосное начало. В середине ожидается экшн, аттракцион невиданной щедрости или что-то в таком роде. А к концу как обычно — сэкономить бы десятки лямов за 350к, да ещё и выбрать из десятков решений и идей можно. А ведь такие призовые и честное лицо может учредить… Немасштабно!

            0
            По 350 тыс. рублей каждой команде победительнице, а также возможность реализовать проект совместно с партнёрами и заработать гораздо больше — вполне щедрое вознаграждение для такого мероприятия.
              +2
              Ну согласитесь, что после начала «везде машинное обучение, машины едут сами, рак лечится, ля-ля-ля, но в России почему-то бизнес побаивается» ожидаешь услышать что-то вроде «но мы решили показать своим примером, что пора перестать бояться, и предлагаем миллион (вставьте любую красивую цифру) победителям...», а не «ну и мы, собственно говоря, решили осторожно прощупать почву хакатоном».

              Без претензий — конкурс как конкурс, народ будет участвовать, и решений накатят прилично, но ситуация не изменится, если вот так делать. В том же чате ML Boot Camp реакции на конкурс не было… Поэтому меня такое амбициозное вступление и покоробило.
              А теперь вот еще «щедрое вознаграждение» — да, было бы щедрым, если бы это был двухдневный хакатон. Когда за сумму месячной зарплаты (плюс минус) этот самый месяц трудится сотня человек — это никак щедростью не назовешь. Чтобы не было недопониманий — и kaggle тоже не щедрость, потому как там и вовсе мировой топ дата-саентистов тусуется, организатор получает гарантированно state-of-the-art решения. Однако рейтингом там вполне можно похвалиться потенциальному работодателю, и опыт интересный.
            +4
            Критериии оценки решений какие-то странные и субъективные. Обычно же вводится некая метрика. У кого число лучше — тот и молодец.
            А тут — «эффектность презентации», «изящность реализации алгоритма;». Художественная гимнастика какая-то
              0
              Оценки жюри всегда носят субъективный характер. Даже спортсмен, формально выполнивший упражнение быстрее/выше/сильнее, может получить меньший балл за чистоту исполнения, к примеру. К тому же в RAIF предложены не обычные задачи, на которые нужно дать конкретный ответ. Это конкурс идей, а не олимпиада по физике.
              +1
              Организатор оставляет за собой право использовать по своему усмотрению, без получения
              разрешения со стороны Участников Чемпионата и без выплаты им вознаграждения любые
              идеи, концепции, принципы, методы, процессы, системы, способы, решения технических,
              организационных или иных задач (не являющиеся в соответствии со статьей 1259
              Гражданского кодекса Российской Федерации объектами авторского права), созданные
              такими Участниками в процессе участия в Чемпионате.

              Чет расхотелось учавствовать…
                0
                Это стандартные условия практически любых конкурсов и хакатонов. При этом Организатор предлагает командам в случае заинтересованности партнеров сделать у них пилотный проект. Если вам не нравятся условия Чемпионата – вы, естественно, можете по своему усмотрению принять решение об участии. Со стороны Организатора лишь скажем, что такой пункт в договоре – скорее некая условность, причем привычная для многих конкурсов. Как крупный системный интегратор, мы не собираемся портить свою репутацию, крадя у людей их идеи :)
                  +2
                  Нет и нет.
                  «Стандартные условия» могут включать в себя как объективную метрику (F1 или любую другую, в зависимости от задачи), так и требования предоставить права на идеи/код только для призёров.
                  Перед запуском этого конкурса хотя бы на kaggle.com смотрели? Или хотя бы читали про эту площадку на хабре? :)
                    0
                    Согласно пункту 5 статьи 1259 Гражданского кодекса РФ «авторские права не распространяются на идеи, концепции, принципы, методы, процессы, системы, способы, решения технических, организационных или иных задач, открытия, факты, языки программирования, геологическую информацию о недрах». Поэтому указанные условия Положения о чемпионате соответствуют законодательству РФ.

                    Что касается прав на коды программ, то они защищаются так же, как и произведения литературы (пункт 1 статьи 1259 Гражданского кодекса РФ). Автору произведения принадлежат исключительные и другие права в соответствии со статьей 1255 Гражданского кодекса РФ.

                    Таким образом, никто права авторов себе не присваивает, авторы и после чемпионата продолжают владеть всеми правами на созданный ими в рамках чемпионата результат (решение).
                      0
                      Ага. А потом смотрим правила:
                      9.13. В случае если в процессе участия в Чемпионате Участником будет создан Результат, являющийся охраняемым результатом интеллектуальной деятельности, как это определено в статье 1225 Гражданского кодекса Российской Федерации, исключительные права в полном объеме на такой результат интеллектуальной деятельности (включая программный код, дизайн, документацию и иные материалы, относящиеся к нему) по предложению
                      Организатора Чемпионата могут быть приобретены у соответствующего Участника в порядке отчуждения на основании отдельного договора для дальнейшей передачи Генеральному спонсору. Участник Чемпионата, признанный Победителем, обязуется передать Организатору все, в т.ч. исключительные права на разработанные в процессе Чемпионата приложения и иные объекты интеллектуальной собственности, в срок не позднее 10 (десяти) рабочих дней с даты признания Победителя на основании отдельного
                      договора об отчуждении исключительных прав, заключаемого между Организатором и Участником.

                      Организатор оставляет за собой право использовать по своему усмотрению, без получения разрешения со стороны Участников Чемпионата и без выплаты им вознаграждения любые идеи, концепции, принципы, методы, процессы, системы, способы, решения технических, организационных или иных задач (не являющиеся в соответствии со статьей 1259 Гражданского кодекса Российской Федерации объектами авторского права), созданные такими Участниками в процессе участия в Чемпионате.


                      Не подскажете, сколько команд уже в конкурсе?
                        0
                        AmberSP, благодарим за внимательность. Данная формулировка попала сюда по недосмотру. Приносим извинения. Мы исправили этот пункт положения, убрали из него упоминание обязательной передачи прав (и проверили еще раз все положение на предмет корректности). В любом случае мы не собирались, да и не могли бы воспользоваться таким условием в прежней формулировке, поскольку оно противоречит законодательству РФ. Теперь пункт 9.13 звучит так:

                        9.13. В случае если в процессе участия в Чемпионате Участником будет создан Результат, являющийся охраняемым результатом интеллектуальной деятельности, как это определено в статье 1225 Гражданского кодекса Российской Федерации, исключительные права в полном объеме на такой результат интеллектуальной деятельности (включая программный код, дизайн, документацию и иные материалы, относящиеся к нему) по предложению Организатора Чемпионата могут быть приобретены у соответствующего Участника в порядке отчуждения на основании отдельного договора.

                        Организатор оставляет за собой право использовать по своему усмотрению, без получения разрешения со стороны Участников Чемпионата и без выплаты им вознаграждения любые идеи, концепции, принципы, методы, процессы, системы, способы, решения технических, организационных или иных задач (не являющиеся в соответствии со статьей 1259 Гражданского кодекса Российской Федерации объектами авторского права), созданные такими Участниками в процессе участия в Чемпионате.

                        Про идеи и концепции и т.п., не являющиеся объектами авторского права, мы уже ответили выше.
                          0
                          Спасибо за очень достойный ответ.
                0
                Добрый день, а можно ли будет использовать предоставленные данные в научных целях, для решения поставленных задач, но уже вне чемпионата?
                  0
                  Запретить использовать данные мы не можем, но если вы хотите упоминать публично, что работали с данными той или иной компании, то нужно сначала получить ее разрешение.
                    0

                    Возникли вопросы:


                    1) Поступление ЗП считает транзакцией?
                    2) Категории вида TRNCNT* обозначают транзакции связанные только со списанием средств? Или же перевод на счёт клиента может происходить по транзакции указанного вида?
                    3) В чём отличия между CONTRACT_TURN_AMOUNT и TRN_AMNT?
                    4) В подавляющем большинстве случаев CONTRACT_TURN_AMOUNT != TRN_AMNT + SALARY_INCOME и CONTRACT_TURN_AMOUNT != TRN_AMNT. Т.е. сумма всех транзакций не равна обороту средств по счёту. И сумма всех транзакций и величине поступлений ЗП не равна обороту средств по счёту. Поясните смысл каждой величины. Или же это проблема в данных?
                    5) Верно ли DBO_OPER_AMNT = DBO_REM_AMNT + DBO_PAY_AMNT? Если нет, то поясните, что означает каждая величина.
                    6) Как получается ACTIVE_FLAG?
                    7) Возможно ли отследить сумму, которая списывалась у клиента?
                    8) Возможно ли отследить сумму, которая начислялась клиенту?

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.