Как стать автором
Обновить
195
0
Александр Кукушкин @alexanderkuk

Лаборатория анализа данных Александра Кукушкина

Отправить сообщение
Верно. Ничего не обновляется
Читатели пишут
Хочу Вам показать карту, которую я нашел, когда Росгидромет ограничил возможность просматривать данные с метеорологических радаров. pogoda.by/leaflet — это проект Гидрометцентра Беларуси. Они также отображают данные с радаров в «прямом эфире» на карте.
На data.gov.ru я уже заявку подал. Проблему проекций я не решал, потому что не знал о её существовании. Примерно вручную подогнал картинку под карту, так чтобы города совпадали и всё.
Круто! Ровно такую же штуку мне хочется для Москвы
Почти уверен, что влезет. Но всегда можно заплатить или подставить тайлы OSM
Её тоже обещали убрать или сделать с задержкой или загрубить
Да, думаю, связаны.
А почему cian.ru решили не парсить? Он раз в 10 больше по трафику, чем sob.ru и realto.ru.
Вы не занимались проблемой кластеризации очень больших графов с использованием распределённых вычислений: Хадупа, Жирафа?
Хранил в файликах, обрабатывал кодом на Питоне
Если обоснуете почему, займусь. Можете скачать граф (ссылка ниже) и поукладывать
А какие есть варианты? Берём пользователя, смотрим в каких группах из выборки он состоит
На группах от 5000 до 10000 распределение такое
Уменьшение выборки не должно к этому приводить, если выборка равномерная. У меня неравномерная, у меня только группы среднего размера
yadi.sk/d/1FMLAtShiEg5L — в таблице две колонки: номер группы и номер пользователя. Рассматривались группы с числом пользователей от 5000 до 10000 человек. Данные недельной давности.
yadi.sk/d/Yv3cCMkBiEgDS — граф, который можно открыть в Гефи и смотреть в любом разрешении.
Возьмём выборку из трёх групп Киномания, МДК и Чёткие приколы. Сколько пользователей будут состоять во всех трёх из них? Много. Теперь возьмём выборку из Любители стрижки каре!, НЕФТЯНИКИ, Любопышка- мамы и папы Ярославля. Сколько будут состоять в этих трёх? Мало. Вот такая идея
Не знаю, какой-то артефакт укладки. Укладка — полуслучайный процесс. Сейчас уложил ещё раз, эта хорда пропала.
Наверное, это потому что в тексте идёт речь о выборке групп размером от 5000 до 10000 человек. Грубо говоря, если добавить в выборку МДК, все сразу станут состоять в 16 группах.
На чем вы это делаете, какие технологии используете?

Пишу код на питоне.
Давно хочу разобраться с доступом к контакту как крупнейшей русскоязычной социальной сети. Обзорная/вводная статья (а лучше серия статей «по шагам») была бы очень кстати.

Неужели их не существует? Мне, честно говоря, обзорные и вводные тексты не очень интересно писать. У ВК прекрасная документация.
Можно ли например провернуть такую штуку: взять список пользователей и список групп, пройтись по ним и найти все комментарии и все лайки пользователя с конкретным ID. Скорость пофиг, все в личных целях.

Да, думаю, можно.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность