Comments / Profile of feriat / Habr

feriat Apr 15 2017 at 11:52

Ну тут, мне кажется, нужно вводить предпочтения на множестве времени-количества билбордов. У меня предпочтения были значительно повернуты в сторону количества точек, ограничение по времени было лишь в один выходной день.

И да, вы правы, что в случае усталости меня или моих спутников у нас был вариант «не ехать в зеленоград, выиграем 1,5 часа». Но мы доехали.

feriat Apr 15 2017 at 11:44

А, когда я строил маршрут на общественном транспорте электричек кажется было минимально. Ускорить движение на метро по сравнению с автомобилем без пробок невозможно, тогда мы этим воспользовались бы

feriat Apr 14 2017 at 12:36

А, ну тогда мой ответ вас не удовлетворит. Затраты на бензин в городе пропорциональны не километражу, а времени (потому что обороты двигателя стабильны), поэтому минимизация времени это и есть минимизация трат на бензин. А в случае общественного транспорта в Москве есть дневной безлимит, который точно всех победит.

Я думал что речь про найм специальных сотрудников, но это уже совсем другая история

feriat Apr 14 2017 at 10:33

Слушайте, а отличная идея кстати! Но ответ и вправду будет 35, я думаю. На всякий случай уточню, что я прокладывал маршрут с возможностью ехать по платной дороге, но алгоритм предпочел бесплатные.

feriat Apr 13 2017 at 14:29

Всё верно, Гамильтонов путь на графе я не нашёл, а искал незамкнутую цепь, содержащую все точки. А также я был дважды в одной точке (случайно). Тем не менее задаче поиска кратчайшего маршрута между всеми точками без возврата домой свойственны все те же свойства, что и «классической» задаче коммивояжёра.

Если вернуться к задаче, то я попробовал несколько вариантов решения и пермутаций точек, и финальная оказалась очень близка к дому, хотя это и не было важно: хотелось минимизировать именно время от первой до последней. Время возвращения от последней точки до дома меня вообще не интересовало, в воскресенье вечером возвращаться из Зеленограда в Москву совсем несложно.

А место моего дома я убрал из анализа из соображений приватности. :-)

feriat Apr 13 2017 at 13:30

Итоговый маршрут вот такой на Яндекс.Картах. Ссылка из гитхаб.кода, но картинку добавлю, отличная идея

Немного про кино или как делать интерактивные визуализации в python

feriat Aug 21 2016 at 14:14

alexkuku, а можешь привести пример на ipython виджетах, которые можно было бы отправить в NBviewer (или самое главное: без запуска python kernel), и где будут такие drop-down'ы?

Про длину кода люто согласен, это серьезная преграда для удобства пользования «из коробки». Приходится писать всякие неизбежно устаревающие или неработающие обертки, это непрактично.

Но пока я не знаю более хорошего способа поделиться с заказчиком, менеджером, или просто не-программистом результатом в Jupyter'е. Тутлипы со значениями критически важны для подобных визуализаций, очень сильно упрощают жизнь. Это такой BI в миниатюре: в твоей аналитике есть не только то, что попросил заказчик, но и то, что ему на самом деле надо, плюс ещё немного данных на «покрутить вокруг да около».

feriat May 6 2016 at 13:03

KrOvean, именно эту ссылку я и показал у себя в комментарии выше. :-) И да, видно, что медуза использует like + share + comment. О причинах такого решения можно спросить samat
В то же время, чтобы сразу выгружать эти данные, потребовалось бы намного больше времени, так как 22.5к урлов пришлось бы прокачивать по одному через АПИ фейсбука, а потом, в идеале, и контакта. Если будет время продолжить это исследование, я попробую посмотреть на это глубже

feriat May 6 2016 at 12:41

AllegroMod, В аналитике данных python сейчас можно назвать мейнстримом. Я пользуюсь связкой Jupyter Notebooks (раньше назывались iPython, сменили название из-за того, что начали поддерживать другие языки программирования) плюс Pandas dataframe (обёртка над numpy с ну очень удобным интерфейсом для «верчения» данных, см. код) плюс библиотечка seaborn для красивой визуализации. Самая большая крутость Jupyter, по сравнению с «обычными» IDE, в том, что код запускается в ячейках последовательно, и можно исправлять «на лету» не перезапуская всё остальное. Ну и плюс визуализация прямо здесь же, и возможность делать полноценные отчёты с заголовками и текстовыми комментариями.

А так весь код выложен на гитхабе, его можно открыть и посмотреть «моими глазами» прямо в интерфейсе. В целом могу подробнее поотвечать про технологии, если интересует что-то конкретное

feriat May 6 2016 at 12:35

Как отмечали выше, сравнивать fb и vk надо аккуратно: в цифре фейсбука включаются не только сами репосты, но и лайки, и комментарии. Постараюсь в следующих сериях раскрыть это более подробно, если удастся выгрузить данные. В целом вроде бы vk всегда был российским, иностранцев там всегда было мизерное количество, несмотря на короткую кампанию по интернационализации где-то лет пять назад.

feriat May 6 2016 at 10:17

Самат, большое спасибо, а ещё благодарю за очень хорошее АПИ: я не видел ещё «неайтишного» сервиса, который представлял бы такие понятные и развернутые данные.

feriat May 6 2016 at 09:12

Сложно сказать: «низкочастотники» расположены на уровне 10 fb, между 10 и 70 стабильно низкая плотность, начиная с третьего месяца (см. гифку). С другой стороны, на общем графике они действительно видны. Плюс ещё он со временем затухает

feriat May 6 2016 at 09:03

Судя по всему, facebook туда не только share и like, но и комментарии подмешивает. Возможно этим можно объяснить размазанность данных fb. Можно попробовать повыгружать фейсбучные данные, и порезать их по типу активности.

А где можно почитать, что api vk.com считает только share?