Вадим Сафронов @Safronov

data artist

ПрофильСтатьи14ПостыНовостиКомментарии77

Safronov 1 июн 2021 в 14:00

Учиться, учиться, и ещё раз учиться?

11 мин

17K

Блог компании Open Data ScienceАнализ и проектирование систем*Машинное обучение*Управление продуктом*Управление проектами*

TLDR: крохотные модельки обошли модные графовые нейронки в предсказании свойств молекул.
Код: здесь. Берегите Природу.

^{ФОТО: Андерс Хеллберг для Wikimedia Commons, модель — Грета Тунберг}

Необученная графовая свёрточная нейронная сеть [1] (uGCN) со случайной инициализацией весов уже пару лет занимает первое место в моём списке алгоритмов для задач машинного обучения на графах из-за копеечной стоимости, простоты реализации, да вполне очевидной элегантности решения. В то же время, насколько мне известно, никто ещё не не проводил соревнований между этой простой моделью и её старшей сестрой — полноценно обученной графовой свёрточной нейронной сетью (GCN) в режиме обучения с учителем. Вот я сделал.

Мотивация: показать, что uGCN выдаёт качественные представления, которые можно использовать в последующих задачах машинного обучения в индуктивном режиме, когда модели обобщаются к не виденным ранее данным (вдохновлено недавним отчётом [2] о производительности простых моделей в трансдуктивном случае).

Полученные результаты — занимательны. В худшем случае простые модели (uGCN + degree kernel + random forest) показали счёт 54:90 против полноценно обученных GCN, в то время как реалистичный сценарий закончился разгромным реваншем 93:51, указывающим на то, что мы можем позволить себе почти бесплатные эмбеддинги, которые превосходят или показывают результаты на уровне полноценно обученных GCN в задаче предсказания свойств графа (например — эффекта медикаментов: яд или лекарство) за долю стоимости. Простые модели обучались ~10 минут в то время как весь эксперимент продлился ~4 часа. Перейдём же к деталям и разберёмся с тем, что произошло!

Читать дальше →

+28

Safronov 9 мая 2020 в 14:00

Санитары спасают себя сами — сдюжат, спасуют, сгорят?

5 мин

3.3K

DIY или Сделай самData Mining*Машинное обучение*Управление персоналом*Управление проектами*

Медицинские работники сейчас горят. Авралы, перепрофилирование, реорганизация отделений — не говоря уже о риске заражения. Жару добавляют администраторы с реформами, преследующие свои политические цели.

Персонал работает на износ и вопросов два: когда люди начнут ломаться, и кто скорее всего сломается первым

Меня зовут Вадим Сафронов, и у меня есть инструмент для решения таких вопросов.

TLDR: видео

Эта заметка — обобщение увлекательного исследования инструментов теории графов применительно к вопросам, возникающим при трансформации организаций. Предыдущие публикации:

Помогите достучаться до человеколюбивых главврачей и завотделений.

Safronov 4 мая 2020 в 14:00

Лекарей сжигать нельзя беречь сейчас

16 мин

7.5K

Блог компании Open Data ScienceМатематика*Машинное обучение*Управление персоналом*Управление проектами*

TLDR: кому перестановки делают больнее — меряем свёрткой графов.
Код: RolX и ванильная трёхслойная GCN на мотифах.

Выгорание на рабочем месте повстречал ещё в начале своей карьеры — и с тех пор живо интересуюсь этим вопросом. Представьте обстановку. Большой проект внедрения SAP. Высокие ставки. Амбициозные сроки. Нагрузку каждый воспринимал по-своему. Кто-то сорвался и самоустранился от выполнения обязанностей, кто-то стал токсичнее, у меня самого в какой-то момент чувство юмора пропало. Ненадолго.

Управление изменениями (дисциплина, направленная на снижение напряжения во время внедрения информационных систем) многим обязана медикам. Во-первых, сам феномен эмоционального выгорания впервые зафиксировали у медицинских работников. Во-вторых, первое масштабное исследование, обобщающее 68 кейсов значительных перемен в английских госпиталях, открыло правила успеха для агентов изменения. Кроме того, моделирование эпидемий решает задачу максимизации влияния и позволяет внедрять нововведения быстрее и естественнее через (суб)оптимально выбранных людей на нужных местах.

Всё больше медучреждений перепрофилируют и это вызывает у работников ожидаемый стресс. Покажем, как его можно измерить, а уж где знаки препинания в заголовке ставить — решайте сами.

+22

Safronov 24 дек 2019 в 14:00

Уравнения для кухни под ёлку

4 мин

1.5K

Математика*Машинное обучение*Образование за рубежомУправление персоналом*Управление продуктом*

О сладких формах, подготовке разметчиков данных и современной математике.

Магические константы

Ч — Чистота (см. Чуковский),

Б — Баланс (см. Нэш),

МЛПП — Материалы, люди, и процесс в пространстве (см. Маяковский, Корбюзье).

Первые две — классика, третья — загадка (т.н. культура готовки). Похоже, вычислимая.

Свежая графовая свёрточная нейронная сеть сгодится и на кухне. Остроумный способ кодирования ингридиентов из Амстердама привлёк интерес к теории графов ещё более широкого круга исследователей. Начать играть в молекулярную кулинарию стало легко как никогда ранее. Вполне достаточно описать блюдо как:

$H = \hat D ^{-½} \hat A \hat D^{-½} Dropout \{\sigma[\hat D ^{-½} \hat A \hat D ^{-½} X W ]\} ,$

Где:

$inline$ — регуляризация обнулением случайно выбранных параметров — то самое 'забывание', запатентованное Google,
$\sigma \ a.k.a. ReLU$ — нелинейная функция активации $f(x) = max(0,x) \\ \\ \\ \hat D = D + I, \\ \hat A = A + I,$ ,
$inline$ — диагональная матрица степеней вершин (количество связей),
$inline$ — диагональная матрица из единиц,
$inline$ — матрица связности,
$inline$ — матрица свойств вершин,
$inline$ — веса нейросети, которые мы можем:

выучить в режиме обучения с учителем;
заполнить выбранными наугад значениями;
выбросить (функция от этого станет чуть-чуть линейнее).

Читать дальше →

-5

Safronov 21 дек 2019 в 15:11

Две точки на краю света

3 мин

3.3K

Визуализация данных*Геоинформационные сервисы*Лайфхаки для гиковУрбанизмЭкология

Пляж — делает город. Город с пляжа начинается. Пляжем город красен.

Заезжали коллеги на конференцию про геометрию графов, нейросети и прочую современную математику, остроумно решающую злободневные задачи на стыке биологии, общества, и химии. Некоторым повезло воплотить модную концепцию bleisure и захватить выходные в городе — бывает, работодатели поощряют такую практику. Разметил для таких ситуаций несколько километров побережья родного континента и данных о местных достопримечательностях собрал. Учтите, самые интересные участки сделаны из твёрдых и местами острых камней.

Осмотримся вокруг Кашкайша и посмотрим, где здесь найти песок до горизонта.

Добраться в этот город с предельной для Португалии концентрацией Тесл на километр дороги из Лиссабона проще всего на электричке, отправляющейся каждые 20 минут и проводящей 40 в пути. В вагонах есть места для велосипедов и опознать их можно по пандусам на платформе. Первый велопрокат встречает уже на вокзале. В принципе, есть даже бесплатный муниципальный велопрокат. Альтернатива — городской автобус 405, курсирующий раз в два часа по воскресеньям.

Красная или синяя дорожка вьётся вдоль кромки континента.

38,7033228, -9,4772811

Здесь можно пройти по краю. Тут хочется остаться. На виду у всех спрятались две жемчужины серебряного побережья и ухватить их за короткий зимний день вполне возможно. Самовывозом. Паралеллепипедики автомобилей примерно передают масштаб приключения на картинке выше.

Справа на фото — Cabo da Roca, 140 м над уровнем моря, вид от маяка Cabo Raso.

На полпути к самой западной точке континента есть пара живописных мест, куда я время от времени сбегаю из города — отвлечься от перемножения матриц, голову проветрить северо-атлантическим бризом, да поглазеть на уголки гор, в которых ещё не был.

-9

Safronov 2 дек 2019 в 14:00

О Структурном Моделировании Организационных Изменений

13 мин

5.4K

Блог компании Open Data ScienceМатематика*Машинное обучение*Управление персоналом*Управление продуктом*

75%

3 из 4 — так Boston Consulting Group оценивает долю IT проектов, почивших по не-техническим причинам.

Уже вот две подряд редакции свода знаний по управлению проектами (PMBOK) выделяют процессы по управлению стейкхолдерами в отдельную область знаний под счастливым номером 13 и настоятельно рекомендуют учитывать:

1. связи между ними,
2. центры влияния, а также
3. культуру общения — для повышения шансов на успех.

Вопрос один:

 доколе инженеры о стейкхолдерах будут судить догадками?

^{ФОТО: Шариф Хамза для Dazed & Confuzed, модель — Люпита Нионго}

В свете недавней безоговорочной победы русской математики над вопросом хроматических чисел рассмотрим сценарий применения стремительно набирающей популярность среди занимающихся машинным обучением теории графов к причине провала большинства IT проектов. Приложим вполне естественную науку о вычислениях к областям, ранее считавшимся 'мягкими'. И покажем, как современные модели позволяют организацию в эпоху перемен измерить. Стратегия решения — простая, двухшаговая — строим граф связей стейкхолдеров, а из него — нейросеть сворачиваем. И пока самообучаемые алгоритмы выполняют непростые управленческие задачи, снимая менеджерских проблем ворох с плеч человеческих — пьём кофе с пироженками.

Читать дальше →

+12

Safronov 25 сен 2018 в 14:00

Где и как врубиться в эмбеддинги графов

30 мин

33K

Блог компании Open Data ScienceМашинное обучение*Образование за рубежомУправление продуктом*Управление проектами*

Привет, Хабр!

Три года назад на сайте Леонида Жукова я ткнул ссылку на курс Юре Лесковека cs224w Analysis of Networks и теперь мы будем его проходить вместе со всеми желающими в нашем уютном чате в канале #class_cs224w. Cразу же после разминки с открытым курсом машинного обучения, который начнётся через несколько дней.

Вопрос: Что там начитывают?
Ответ: Современную математику. Покажем на примере улучшения процесса IT-рекрутинга.

Под катом читателя ждёт история о том, как руководителя проектов дискретная математика до нейросетей довела, почему внедряющим ERP и управляющим продуктами стоит почитывать журнал Биоинформатика, как появилась и решается задача рекомендации связей, кому нужны графовые эмбеддинги и откуда взялись, а также мнение о том, как перестать бояться вопросов про деревья на собеседованиях, и чего всё это может стоить. Погнали!

Читать дальше →

+36

Safronov 13 фев 2018 в 14:00

Незадача коммивояжера и жёлтый октябрь

15 мин

13K

Главнокоммивояжер Аристарх поглядывал на Пророка, покручивая дубинкой от снежных троллей — ходовым сезонным товаром — 11% отклонение прогноза продаж на 10 дней в среднем (MAPE) впечатлило и, как у нас в чате говорят, зашло в роли baseline. Если он так же хорош, как и их Цукерберг, то сразу в прод — таков был первый порыв. Пророк поглядывал на главнокоммивояжера, прищурив правый глаз. Такой серьезный, в костюме, и верит в то, что инновации апплодисментами встретят и сразу же примут — мысль в голове вертелась, постепенно обретая форму. А Вы в курсе, юноша, скольким коллегам и контрагентам со своими нововведениями немилы станете? Они же Вас невзлюбят сразу, к гадалке не ходи! В общем, порыв жил обычным циклом инноваций.

В дисциплине управления проектами стейкхолдерами называют всех, кого проект коснется (а также тех, кто может оказать на него влияние). Люди они разные, со своими интересами, ожиданиями, и чаяниями. Закрыть глаза в надежде, что и проекта не заметят — весьма опрометчиво (вспоминается неприглашенная колдунья). Boston Consulting Group оценивает долю IT проектов, почивших по не-техническим причинам, в 75%. Последние две редакции свода знаний по управлению проектами (PMBOK) выделяют процессы по управлению стейкхолдерами в отдельную область знаний под счастливым номером 13 и настоятельно рекомендуют учитывать связи между ними, центры влияния, а также культуру общения для повышения шансов на успех.

Мы покажем, как оценить стейкхолдеров с помощью машинного обучения. Выделим группы похожих между собой людей и решим задачу кластеризации — сегментации клиентов в терминах маркетинга — в социальных структурах, которые построим из: 1) потоков сообщений и 2) эмоциональной окрашенности текста. Для этого заглянем в переписку, любезно предоставленную г-жей Клинтон, способом, предложенным в журнале Биоинформатика.

Читать дальше →

+47

Safronov 7 ноя 2017 в 14:00

Незадача коммивояжера и красный октябрь

14 мин

16K

Блог компании Open Data ScienceВизуализация данных*Машинное обучение*Управление продажами*Управление продуктом*

Главнокоммивояжер Аристарх стоял у окна и с лёгкой грустью во взгляде провожал стаю улетающих на юг комаров. Осень. Конец сезона. Пора дубинки, полюбившиеся жителям города Н в качестве средства самозащиты от кровососов и предмета статуса (известно, некусаный горожанин — милее надкушенного), забирать из оружейных лавок и завозить на их место рогатины от снежных троллей.

В рознице падение спроса на сезонные товары приводит к смене ассортимента на полках и возвратам невостребованных остатков на склады поставщиков. Кутерьма та еще. Не все могут похвастаться сбалансированным портфелем продуктов. Конец сезона может привести к кассовому разрыву и поставщики всячески стараются уменьшить потери. Незадача коммивояжера, как она есть.

Лето жаркое выдалось, потому сезон затянулся — мысль поселилась в голове Аристарха — годовой ритм миграции крылатых определенно укладывался в какие-то предопределённые природой рамки. А что если между продажами и погодой есть эта, как её, корреляция?

Покажи мне корреляцию погоды и продаж дубинок от комаров, вот тебе гигабайт сводных таблиц в экселе — так началось мое знакомство с возвратами сезонных продуктов.

Читать дальше →

+46

Safronov 25 мар 2009 в 13:28

Разговоры с блондинкой. О управлении проектами.

2 мин

812

Чулан

Есть у меня одна знакомая. Умница, красавица. Натуральная блондинка. Затеяли мы обучить ее управлению проектами. Вот у кого-то прожект менеджер будет!

Привет — сказала она, — Сафронов, я тут твою визитную карточку нашла, на ней написано «руководитель проектов». А чем ты вообще занимаешься? Я и в Википедии твою профессию искала. Не нашла.
А кто такой руководитель проектов?

Да уж, ну и вопросы — подумалось мне. Расскажу как для ребенка…

Кто я, где я, кто эти люди… Раз Википедия определения не содержит, то тогда его дам я. Золотое правило — хочешь, чтобы что-то произошло — сделай сам.
Или проконтролируй лично. Такова жизнь..

Прежде всего, руководитель проектов — это моя профессия, так записано в трудовой книжке.

В самой скучной книжке на свете мою работу определяют как «Лицо, назначенное исполняющей организацией для достижения целей проекта*.» Непонятно! Расскажу понятно :]
Как я рассказывал неделю назад, проекты — это способ создания новых вещей с помощью имеющихся ресурсов. Руководитель проекта — человек, задача которого организовать превращение ресурсов в заранее определенный результат. Что-то вроде работы фокусника. Или шеф-повара.

Кулинарные сравнения — самые простые для меня. Представь, создается новое блюдо. Предположим, торт. Есть кухня ресторана, есть поварята с приборами, печь есть. Шеф руководит процессом; поварята делают простые операции: тесто месят, коржи пекут, крем намазывают; на выходе — небывалый шедевр.

Точно так же и руководитель проекта организовывает совместную работу специалистов для выполнения общей задачи. Чего-то нового. Крутого. Небывалого. Вовремя.

Есть у меня друг Васыль, уже почти МВА, он мне на этот вопрос ответил следующее: «Руководитель проектов — это человек, который понимает, что и когда нужно делать и чего достичь, но делает так, чтобы делали и достигали другие. Короче, такой хитрый жук.».

Вот, в принципе, и все. Что еще тебе рассказать?

-16

Safronov 24 мар 2009 в 22:43

Быстрые ответы

3 мин

1.1K

Чулан

Виктор Собирайский. Карикатура "Снеговик и пьяница"

Есть у меня одна мечта. Заветная. Быстрые ответы. На любой вопрос!

Ведь, как бывает порой, не знаешь или забыл что-то — позвонил в справочную и получил ответ за пару минут. На этой потребности коммерческие справочные немалые деньги зарабатывают, между прочим. Вам доводилось организовывать собственный центр компетенций?

Быстрый исчерпывающий ответ на вопрос пользователя – то, к чему должны стремиться сервисные подразделения. Ответьте сразу и вам не придется перенаправлять запрос или, что еще грустнее, выслушивать один и тот же вопрос, на который нет ответа, по нескольку раз.

Читать дальше →

-2

Safronov 20 мар 2009 в 12:23

Откуда они такие берутся?

2 мин

896

Чулан

После рассуждений на тему профессиональной незрелости руководителя и критериев успеха проекта, пришло время разобраться с тем, кто он, этот руководитель проектов.

Кто они, руководители проектов? Какими компетенциями должны обладать? Откуда они такие берутся: ими рождаются или становятся?

Самое емкое определение, которое я с недавних пор даю профессии руководителя проектов — это «зверек, что елку поливает»…

Читать дальше →

Safronov 18 мар 2009 в 17:02

Какой проект успешен?

2 мин

11K

Управление проектами*

Хороший руководитель проектов должен делать успешные проекты. Предыдущая заметка была о профессиональной незрелости руководителя и ее последствиях для проекта. Теперь — черед рассуждений о том, что же нужно сделать, чтоы проект считался успешным. Сегодняшняя тема — критерии успешности проекта, выходящие за общепринятые рамки.

Испокон веков, с тех самых пор, когда были осуществлены первые успешные проекты, считалось, что критериев успеха три. Вовремя. Качественно. Недорого.

Кстати, а вы знаете, что первыми упешными руководителями проектов были египтяне? Именно в честь их пирамид, треугольных в профиль, ограничения проекта по срокам, качеству и бюждету назвали “Золотым треугольником”.

Так было в древности, тогда проекты были редкостью, результат поставки — поражал воображение. Нынешние проекты измельчали донельзя. Сравните сами строительство пирамид и внедрение ERP-системы, пусть и в транснациональной компании. А ведь второе — пример самого масштабного мероприятия в области информационных технологий!

В принципе, даже подготовку корпоративной попойки можно считать проектом.

Читать дальше →

Safronov 18 мар 2009 в 15:09

А девочка созрела? О том, что такое профессиональная незрелость руководителя проекта.

2 мин

4.1K

Управление проектами*

С девочками все ясно, а вот какое отношение, казалось бы, имеет зрелость к управлению проектами? Оказывается, самую непосредственную! Вопрос профессиональной зрелости — ключевой в карьере руководителя проектов.

Вы когда-нибудь встречали новобранцев, этих обритых наголо солдатиков в форме на два размера больше положенного, мальчишек, призванных защищать Родину со школьной скамьи? Образ щуплого служивого, уже не подростка, но еще не мужчины, торчащие из-под головного убора уши, — все это у меня ассоциируется с незрелостью.

Читать дальше →

+36