Pull to refresh

Comments 20

Просили поправок? Получите.

Большинство памятников архитектуры располагаются в Центральном,
Петродворцовом и Адмиралтейских районах города. Это самый что ни на есть
центр.

На этом я перестал читать. Вы бы карту хоть посмотрели для начала. Петродворцовый район, конечно, расположен внутри КАДа, но к центру города отношение он имеет крайне посредственное.

Из этого можно сделать вывод, что мало владеть инструментом. Можно близко к идеалу все посчитать и доверить алгоритмам анализ. Но итог нужно подводить, разбираясь в предметной области, по которой проводится анализ.

Да, Ваш вывод корректен. Несколько раз уже слышал, что аналитик более ценен, когда он хорошо знаком с анализируемой им областью. Взял для анализа исторические ценности, придется залезть и подучить историю

В данном случае всё ещё гораздо сложнее. Историю можно подучить, но вся проблема в том, что почти каждый, кто обладает возможностью, переписывает историю под свою выгоду. Например для расчистки места, где земля стоит дорого, лишаются статуса памятников многие здания для того, чтобы их снести.

К сожалению история - очень не точная наука и все эти открытые данные более-менее точно могут показать только год постройки. А вот статус памятника архитектуры например показывает только текущую ситуацию необходимости пока не сносить это здание.

Посмотрите на сайты и сообщества тех, кто борется с незаконным сносом. Они конечно одержимые люди, но доля правды в их действиях есть :)

Да, спасибо за правки, тут Вы абсолютно правы. Исключил Петродворцовый район из выборки, и точка ожидаемо сместилась ближе к центру города. Исправил этот момент в статье

Хм, на северо-востоке плотный отдельностоящий кластер памятников - это, похоже, больница Петра Великого, которая в реестре, видимо, разбита чуть ли не на отдельные сараи. Ваш друг точно захочет её осматривать?.. :) На юго-востоке Пролетарский завод - аналогичная ситуация и вопрос. А вот что за аналогичное скопление на юго-западе - не пойму, это, вроде, квартал между ул. Зенитчиков, Зайцева, Краснопутиловской и пр. Стачек - обычные сталинки, точно такие же, как в соседних кварталах.

А вот эти три отделённых, но богатых "памятниками" пятна, похоже, сильно поспособствовали смещению точки размещения в место, от которого до ближайшего памятника ещё прогуляться надо :)

Да ладно, прямо на Крюковом стоят Новая Голландия, Мариинка, Никольский собор, Никольский рынок и десяток-другой памятников помельче.

Но в целом замечание толковое, поддерживаю.

Не, ну я-то знаю, что там находится, но вот на карте автора поста, к слову говоря, красных точек на этих объектах нет... то ли дело Пролетарский завод :)

Это квартал №1 в Автово. Первые сталинки, как группа домов в едином микрорайоне. Но например в Московском районе есть аналогичные кварталы, которые были построены даже раньше и про них можно рассказать побольше, но на карте они почему-то не обозначены.

Учитывая, что автор поста отсекал строения младше 1900 года (весьма варварским способом, NER - нет, не слышал :), подозреваю, что конкретно у этого квартала в реестре даты постройки как-то своеобразно записаны оказались.

У вас там и Приморский район за КАД уехал странным образом. Срочно пересматривайте выборку, пока злые краеведы не понабежали!

Точно! Вернул Приморский район обратно в выборку, там не очень много объектов, но выборку это чуть скорректировало

Этот график совсем не выглядит информативным. Чисто для целей
визуализации предлагаю посмотреть тех авторов, которые построили более
20 объектов.

Поздравляю! В вашем списке всего четыре-пять значимых фамилий, зато крайне удачно исключены (так, чисто навскидку) Бенуа, Валлен-Деламот, Воронихин, Кваренги, Монферран, Растрелли, Тома де Томон, Трезини. Не дотянули.

На самом деле, наиболее важным параметром была как раз протекционная категория, придающая «веса» точкам. Попробуйте пересчитать, может получиться интересно.

Отличное исследование для познавательных целей. Но путешествовать по такому путеводителю может только айтишник :)

Хорошо заметен предсказуемый эффект несущкствующего среднего: непосредственно возле точки "центра всех достопримечательностей" их самих почти нет.

А главная ошибка пошла вот отсюда:

В датасете есть такая характеристика объектов, как протекционная категория. Будет ли нам полезна эта колонка? <...> Возможно информация важная, на для нашей задачи тут ничего полезного. Всего три категории, по которым мы не собираемся сортировать данные.

А меж тем это и есть та самая важная и полезная величина, которая позволяет очистить список от больничных корпусов и сталинок, которые хоть и важны с историко-краеведчиской точки зрения, но малоинтересны для туризма.

Это действительно оказалось одной и самых важных характеристик. Сделал выборку по объектам федерального значения, точка сместилась на Инженерный замок. В итоге исправил большую часть статьи и даже заголовок

Вообще, например, весь первый фрагмент кода можно заменить на: seaborn.countplot(y=data['district']), никакие "ручные" вычисления не нужны. А если бы и нужны были, то есть такая штука data['district'].value_counts(), она опять же сама посчитает сколько раз какое значение встречается в данных. Если вы при использовании Pandas что-то считаете с помощью циклов, то нужно сразу задуматься, что тут не так. Обычно это вообще не нужно, все необходимые аггрегации туда уже встроены в готовом виде.

Архитекторов по количеству выкидывать на стоило. Вроде могли пропасть такие, которые построили всего одно строение, но при этом очень ценное.

Ещё по 1900 зря отсечка сделана, лучше было бы по 1918, к примеру. Или по 1914 хотя бы, чтобы начало 20 века зацепить.

Понравилась и статья и комментарии, которые помогли автору допилить анализ и сделать его более качественным. Плюсанула в карму, спасибо за материал. Я тоже начинающий дата аналитик, мне было интересно :)

Sign up to leave a comment.

Articles