Pull to refresh

Comments 182

Занятно.
Только вы упустили 3 важных ценообразующих момента:
1. Состояние квартиры. За ремонт, да не «евро», обычно накидывают 2-3 процента.
2. И значительно более существенный параметр — тип дома. То есть структура: монолит, кирпич, панельный, монолит-кирпич,… Причём разница между кирпичной двушкой и панельной может быть чуть ли не в полтора раза.
3. Планировка.

Особенно без второго параметра невозможно говорить об адекватности данных.
Если честно, я бы к риэторам обратился, особенно в Минске, ибо что-то мне подсказывает что они не такие офигевшие как в Москве. В моем городе услуги риэлтора с юр. сопровождением сделки (предварительный договор + договор купли-продажи) в среднем 1-2 килобакса, в зависимости от стоимости квартиры.
Насчёт типа дома, честно говоря, не заметил сильной разницы. Возможно, просто не обратил внимания, возможно, это отражено в возрасте дома — у нас как-то типы домов сменялись волнами: какой вождь пришёл к власти, такие дома и строятся.

В остальном согласен: как я и написал в заключении, подход довольно наивный и не учитывающий кучи факторов. Это скорее был proof-of-concept и средство автоматизации разбора данных — просто переходить со страницы на страницу, изучая все подряд предложения, это довольно таки утомительно :)

В общем-то, оформляем как раз через агентство, хотя изначально агента нанимали продавцы. Обещают взять с нас вообще немного — меньше $500. А нанимать риэлтора именно для поиска квартиры не хотелось принципиально — ни один агент не будет знать, что мне действительно нужно. Да и я сам бы не понял, если бы не просмотрел достаточное количество предложений.
> Насчёт типа дома, честно говоря, не заметил сильной разницы.
панель — монолит — монолиткирпич — кирпич.
Каждый шаг это условно +10%.
Ну да, связь с возрастом дома прямая, дома 20+ лет почти на 100% панельные.
А чем одно хуже другого? Имхо, стены и стены.
От вида стены зависит естественный микроклимат квартиры (например, как она нагревается от лучей солнца). Также нужно учесть риски при землетрясении, наводнении и т.д.
Считается, что панельки холодные. + различные сроки службы у домов.
А вы в этих разных стенах жили? :-) Если жили и разницы не ощущали — то я в шоке. :-) Панельки мало того, что холодные, так еще и сырые (на нижних этажах черная плесень на стенах внутри квартиры — вещь типичная, нужно заморачиваться на покрытие стен спец.составами и т.п.). Перепланировку там сделать нереально. Из-за своей бюджетной сущности потолки почти всегда низкие (до 2.7м и то 2.7 — редкость), а подъезды частенько обшарпанные и убогие. Слышимость соседей опять же…
В общем, теоретически, квартиры нормальные могут быть, но слишком много «но»: изначально должна нравится планировка, этаж не низкий, дом новый (старые панельки это ж вообще ад!) и т.п. Но с такими условиями и ценник растет и уж лучше нормальную «сталинку» взять с ж-б перекрытиями и потолками 3м. :-)
О, вот со слышимостью актуально.
плюс ещё перекрытия (например в кирпичных «сталинках» — деревянные или железобетон) от них тоже сильно зависит слышимость, пожаробезопасность и долговечность. Ах да, ещё расположение окон по сторонам света. есть риск жить во мраке всю жизнь. айтишнику приятно, но семье не всегда.
UFO just landed and posted this here
А еще вай-фай плохо ловит даже за одной стеной, за двумя совсем гаснет сигнал, даже с модной beamforming технологией и двухчастотным передатчиком. И вместо дрели в хозяйстве приходится покупать перфоратор :) (благо они есть бюджетные).
А вот насчет холода и планировок не согласен. С нормальными окнами зимой не холодно, даже наружная стена без всяких утеплений не сильно холодная.
Планировка целиком и полностью зависит от поколения дома, хоть в панельках хоть в кирпичных домах были говенные планировки, чем старше тем хуже (довоенные это отдельная история).
вместо дрели лучше купить перфоратор в ЛЮБОМ доме.
Как часто вам требовалось именно функция перфоратора?
Мне например всего пару раз, во всех остальных случаях стояла насадка для режима дрели.
если стены не из дерева, то перфоратором с вращением стены сверлятся легче и проще. и сдс+ мне больше нравится, чем патрон.
Да это так, мне тоже SDS+ по нраву, и сверлить стены быстрее с перфорацией.
Но стоит ли выйгрыш 10-20 секунд на отверстие своих денег, при условии того что эти отверстия будут делаться 1-2 раз в месяц?
Перфоратор, как правило, в 2-3 раза дороже дрели аналогичного уровня.
Я купил перфоратор с полгода назад, теперь думаю что вполне подошла бы и дрель.
Зависит какие у Вас стены. Имел удовольствие сверлить достаточное количество отверстий с помощью обычной дрели в панельном доме. Имитировал перфоратор круглым зубилом. То еще удовольствие.
я тоже купил перфоратор несколько месяцев назад, и думаю что зря покупал 3 дрели до этого. единсветнную живую дрель использую в качестве шуроповерта
UFO just landed and posted this here
[Перфоратор]
+7 к бурению стен
-20 к репутации с фракцией «соседи»
только если к вам не ходят соседи «а ты не повесишь нам полку?»
на «повесить полку» очень неплохо идёт победитовое сверло-лопаточка «по кафелю».
Вдобавок к сверлу — обычный аккумуляторный шуруповёрт/дрель.
Отверстие получается быстро — и — главное — бесшумно для соседей.
это если стены монолитные. хотя мне жалко сверло.
а если стены из говна — сверлом удобнее
[Ударная дрель]
+3 к бурению стен
-130 к репутации с фракцией «соседи».

То что человек с перфоратором сделает за несколько секунд, человек с дрелью будет мусолить очень долго и слышно будет не хуже.
1) Ну, это не только у панелей… Если монолит не «столбами», а сплошняком — тоже самое будет… Арматура-с…
2) И холод, и планировки от серии зависят — согласен. Новее — лучше. Собственно, меня самого в новых (несколько серий смотрел) планировки вполне устраивают, но только высота потолков — все равно 2.6м. :-( Мало мне, мало… Заколебало уже, что встаешь на цыпочки и трогаешь рукой потолок… О люстрах и не говорю — только плоские «блины» использовать остается… :-( Применительно к Москве, учитывая, что точечной застройки почти не осталось, а новые дома с нормальными потолками в основном черте где — остается только на сталинки и рассчитывать…
Бетон бетону рознь. Жил у родителей в бетонном военном доме типа «голубая мечта», слышно было соседей периодически, потом переехал в кирпичную хрущевку 1960 года — и по-настоящему был в шоке, от того, насколько сильная слышимость через несколько этажей, слава богу, ремонт с шумоизоляцией решает все подобные проблемы, а то от разговоров про путена по ночам было совсем не по себе
UFO just landed and posted this here
Прочность, долговечность, шумоизоляция, морозостойкость, теплопроводность + приспособленность к «ремонту».
UFO just landed and posted this here
В Минске тоже такие вещи встречаются, но гораздо реже, поэтому на цену особо не влияют.

Собственно, да, как я уже говорил в комментариях, этот метод — скорее фильтр, или алгоритм ранжирования, позволяющих сильно сократить количество ручной работы. Конечных ответов он не даёт. Причём не столько из-за таких факторов, как внутреннее состояние квартиры — его то теоретически ещё можно как-то вычленить — сколько из-за субъективности выбора. Может получится так, что вот эта большая квартира с фактором недооценённости 1.5 субъективно кажется жутко некомфортной, а вот та маленькая и немного переоценённая — то, что надо. И вот этот фактор уже учесть ну никак не получится.
Самое обидное, что такие вещи не часто пишут в объявлениях, но по опыту 8 из 10 «недооцененных» квартир имеют низкую цену как премию за риск. Поэтому описанный метод риски с документами оценивать не сможет.

Этот уровень риска решён уже давным давно. Называется титульное страхование недвижимости.
UFO just landed and posted this here
Это теория.
Практика гораздо богаче. Страховая не захочет деньги отдавать.
Все может закончиться все тем, что вы будете судиться со страховой пару лет.
Не знаю, не знаю. Как минчанин минчанину — выберите для себя район, где вам хотелось бы жить, и ищите на реалт.бай по базе данных в том районе и с сортировкой по цене, + во многих предложениях фото или же планы квартир. В Минске от места расположения зависит очень многое. А когда вы по десятку-другому домов проедете — то отсеете еще варианты с забитыми автомобилями детскими площадками и скученными панельными высотками, с вонючими мусорками под окном, отсутствием детских садов и школ поблизости или полным асфальтопокрытием территории. Мы выбирали квартиру именно так, начиная с места, в котором было бы приятно жить
в Москве тоже можно найти недорогого риэлтора за 1-1.5% от стоимости квартиры, за сопровождение сделки по однушке (подбор и проверка варианта, заключение сделки) отдадите 60-100 тысяч рублей.
UFO just landed and posted this here
Это правда.
Мне риэлторы «втюхивали» квартиру, у которой были очень серьезные проблемы с документами. И даже договорились со страховой, что она застрахует. К счастью, банк не пропустил. А то был очень серьзный риск остаться без денег и квартиры и долго-долго судиться.

Теперь прикиньте: в этой сделке банк самая защищенная сторона. Потому что выгодоприобретателем по страховке является он. То есть чуть что — он свои деньги назад вернет. А вот что будут делать страховая, покупатель и продавец? И тем не менее банк не захотел рисковать.
А теоретики рекомендуют «титульное страхование».
Не смотря на мелкие недочеты, статья просто супер. Никак не ожидал такого анализа когда заходил сюда видя лишь название топика.
Вам спасибо!
Такой подход сгодится как основа, например в системе оценки залогов, как оценка недвижимости…

С нетерпением жду статью: Как я выбирал жену )
очень занимательно.
2 момента:
— для Москвы можете такое посчитать? Если да- то пора открывать бизнес.
— не знаю как в Минске, но на сайтах обычно не учитываются приукрашивания, уменьшение расстояния до метро(ни раз не смог дойти так быстро как указано в объявлениях). Просто в данных есть погрешность и эта недооцененная квартира может оказать просто развалюхой или наоборот после подсчета, окажется что это квартира едва ли не в польше находится.
Делайте стартапец за несколько дней. И продавайте тому же яндексу с их сервисом Недвижимость за 15M$. Спасибо за классную статью.
Если серьёзно заморочаться, то нужно добавлять обработку естественного языка, сегментацию рынка квартир с построением отдельных моделей для каждого сегмента (хотя, возможно, достаточно будет алгоритма M5'), а также кучу логики. Это уже работы на несколько месяцев, а ещё бизнес часть продумывать и согласовывать. Так что я пока не спешу с монетизацией этого дела :)
Спасибо за комментарий!
Если таки надумаешь серьёзно делать, то вполне можешь взорвать рынок недвижимости. Как в фильме «Человек который изменил всё». Блин всё ещё не могу уложить в голове недооценку квартиры на 20 килобаксов.
А вы сходите в эту квартиру, посмотрите.

Вместо 5 минут от метро, она будет в 20. Вместо хорошего состояния, вы уведите, что разве что свиньи по квартире не бегают. Будет неузаконенная планировка, в собственниках квартиры будут несовершеннолетние дети, квартира покупалась менее трех лет назад по доверенности и продавать ее вам тоже будут по доверенности. Окна на помойку. Второй этаж, который написан в объявлении — это если считать с подвалом. Соседи — алкаши те еще, 3 раза за последние полгода сжигали свою квартиру. Ну и тд и тп
> в собственниках квартиры будут несовершеннолетние дети, квартира покупалась менее трех лет назад по доверенности и продавать ее вам тоже будут по доверенности

Это всё ерунда, разруливается довольно легко.
И насколько легко разруливается? Если можно — пример.
С несовершеннолетними собственниками единственное препятствие это органы опеки, но в моей практике практически всегда они удовлетворялись тем, что куплено или в процессе оформления новое жилье. Было пару случаев когда пришлось открывать счет в банке и разбивать сумму на 2 части — одну родителям, вторую — ребёнку.
Однако ни разу органы опеки не запретили продажу.
Насчет квартиры до 3х лет в собственности — есть такая практика, что указывают 1млн в качестве стоимости квартиры в договоре купли-продажи.
А, да, точно, про 1 млн — стоимость квартиры я совсем забыл. И это — далеко не разруливание
Простите, но что это за волшебный миллион?
Это размер налогового вычета. Т.е. при указании суммы до 1 млн. продавец не заплатит налогов. Если покупатель берет за нал и ему самому возврат НДФЛ не нужен — то по фиг. А вот если ипотека и хочется НДФЛ вернуть (таки мелочь, а приятно, а кому-то очень даже не мелочь — ту же мебель в квартиру купить...) — то уже сложнее…
+ при в случае расторжения сделки, продавец вернет вам ваш миллион, который указан в договоре, а себе заберет квартиру. И не важно, что вы ее за 5 покупали, документально это не подтверждено.
Спасибо за оперативный ответ.
Расторгнуть сделку совсем не просто, особенно со стороны продавца.
Проблемы могут возникнуть в том случае, когда договор хочет расторгнуть покупатель. К примеру, выявились скрытые недостатки, а-ля за шкафом дыра в Нарнию :)
Но здесь уже собственно и нужно понимать свои риски как покупателя и уделять осмотру квартиры немало времени, и только убедившись что всё 100% ок — покупать её.
В общем не вижу особых проблем, кроме возможных траблов с налоговой.
Например, вылезли юридические проблемы — сделка может быть расторгнута.
Вот ситуация: хозяин квартиры развелся 10 лет назад, сейчас связи с женой нет (по его словам то она за рубежом, то на даче). Банк решил, что сделка очень рискованная и не пропустил. Даже несмотря на согласие страховой.
Потому что даже такое можно оспорить. Ну и что, что срок давности 3 года давно прошел. Есть такая вещь как восстановление срока давности.
Самый лучший способ «разрулить» подобную ситуацию — никогда туда не звонить и не связываться с этим.
Может разруливается и легко для кого-то, но не факт что в этой ситуации это вообще разруливаемо.

+ столько нюансов, что я предпочитал не связываться и отсекал такие квартиры при звонке по объявлению
Ну вообще нюансов при оформлении сделки очень много, и не только с проблемными квартирами.
Вполне стандартная ипотека может принести стока факапов что мама не горюй.
К примеру, ВТБ обязывает в договоре ипотеки указывать определенные слова.
То есть буквально в памятке пишут список keyword'ов.
Не зная этого и оформляя как обычно доки, вы просто будете отвергнуты банком.
Или, опять же по ипотеке, некоторые банки обязывают работать только с собственными «сертифицированными» оценщиками.
Сторонние эксперты опять же посылаются лесом, и офрмляется отказ в ипотеке.
Невыдача ипотеки — это максимум факапчик. А вот потеря квартиры в результате сомнительной покупки — это факап тот еще.
Как сказать.
То, что это просто факапчик — не соглашусь, ибо часто в предварительном договоре есть возможность пролонгации с единоразовым повышением стоимости.
То есть затянули с ипотекой -> предварительный срок договора истек -> пролонгация -> +50-100k к стоимости.
Конечно с потерей квартиры не сравнить, но 100к тоже немалые деньги.
Я брал в сбере. Там нет никакого предварительного договора. Заявка, решение о выдаче, 2 мес на поиск квартиры, подача документов на квартиру, проверка договор. Не успел за 2 мес, переходим к пункту заявка.
Предварительный договор между продавцом и покупателем.
Так сказать, договор о намерениях.
Закрепляется договор частенько задатком, а полная сумма отдаётся при заключении договора купли-продажи. Ну или обговаривается порядок расчета детально с долговыми расписками и т.д.
То есть workflow в агентстве недвижимости такой:
1. Заключается договор об оказании услуг м/ду риэлтором и клиентом.
2. Находится квартира мечты.
3. Предварительный договор м/ду продавцом и покупателем.
4. Подготовка доков/денег с обеих сторон.
5. Договор купли-продажи.

Предварительный договор нужен для того, чтобы не упустить квартиру, так как между окончательным решением о покупке конкретной квартиры и самой покупкой могут пройти 2-3 месяца.
Просто потому что: деньги будут через N дней, доки продавца (дети, пары, долги), выписка из квартиры продавца, 3хсторонние сделки (A покупает у B, B покупает у C), открытие счетов в банках, и прочее-прочее.
Поэтому дабы не ловить журавля в небе, продавец соглашается на обязательства продажи перед покупателем. Тем более он получает задаток, как гарантию покупки.
Ещё одна небольшая деталь, с которой как раз недавно столкнулся: если продавец решает соскочить и не продавать квартиру, когда предварительный договор уже заключён, то он обязан выплатить обратно и залог, и ещё такую же сумму. Так что продавец, получается, тоже связывается обязанностями.
Угу, в этом и смысл задатка.
Кто разрывает договор в одностороннем непредусмотренном порядке, теряет величину задатка.
Поэтому продавцы не любят задаток, а предпочитают залог, который просто возвращается без штрафа.
это не залог, это ЗАДАТОК, и это прописано в ГК РФ. Главное, правильно это оформить: вместо ЗАДАТКА могут написать АВАНС.
Так вот при отказе от продажи продаваец возвращает просто АВАНС и ничего больше не должен, а вот в случае ЗАДАТКА — его двойной размер.
Странно.
Обычно договаривались на проверку квартиры. Если квартира проверку не проходит — то продавец возвращает залог.
Что за предварительный договор?
Скорее всего договор о намерениях.
Ну так и никто не заставляет брать первую подходящую под критерии квартиру. Посмотрел, не подошла — следующая по списку.

Ну и на этом этапе, было бы здорово добавить социальности, например, чтобы состояние квартиры мог уточнить покупатель. Можно просто отзывами, можно прямым изменением описания, но в этом случае нужна защита от недобросовестного пользователя.
— Всё упирается в методы сбора данных. Если покажете сайт, на котором для большинства квартир заполнены хотя бы основные поля, то я просто ради интереса дополню парсер. Но, как правило, сайты весьма демократичны в плане заполнения полей. А связываться с московскими риэлторами будет довольно проблематично :)
— На самом деле проблема с расстоянием до метро элементарно решается с помощью того же геокодинга. Правда, тут ещё нужно учитывать расстояние до центра (в Москве и на метро до центра можно ехать довольно долго), а также другой транспорт.

Любую недооценённую квартиру всё равно нужно проверять. Анализ данных в данном случае больше похож на поисковики: на первой странице находятся страницы с высоким рейтингом соответствия запросу, но ещё не факт, что эти страницы действительно релевантны, так что всё равно приходится походить по ссылкам, но уже по гораздо меньшему их количеству.
Даже если на сайте агенства все красиво расписано, то по факту выясниться что той самой квартиры уже нет, но у нас есть много других…
В таких случаях отчего-то думается, что изначально этой квартиры-конфетки и не было — а всё это делалось исключительно с целью привлечь внимание потенциального клиента.
ну вот например поиск по питеру — bn.ru
Спасибо, посмотрю, если подойдёт — накидаю парсер. Тем более, что Питер для меня тоже стратегически важный город.
Главная проблема всех сайтов о недвижимости — это не обработка данных и разные интеллектуальные поиски. Это самое простое.
Проблема — риэлторы, которые создают информационный шум, приукрашивают свои объекты, подкоректируют все данные, рекламируют несуществующие объекты, лишь бы получить входящий звонок. Если вы решите эту проблему на московском рынке, то получите намного больше чем $15М.
UFO just landed and posted this here
Да, помогла: в итоге выбрал квартиру из первой двадцатки в отсортированном массиве коэффициентов недооценённости. Правда, я ещё добавил фильтр по районе при сборе данных.

Ну не знаю, у нас как-то всё довольно честно получается. Хозяева ещё могут преврать (да и то по субъективным параметрам, типа законченности ремонта, но не по задокументированным, таким как площадь кухни), а агенты — вообще самые честные люди в мире :)
> После общения в маклерами у меня осталось впечатление, что прикоснулся к грязи.
Вероятно вам просто не повезло, мне наоборот встречались только адекватные и честные риэлторы.
А вот собственники бывают в полном неадеквате.
Хоть не отношусь, но предположу, что «москвичи не подАвились слюной» ;)
Таки надо поставить себе MS Office на виртуалку, чисто, чтобы проверять орфографию.
Спасибо.
Зачем такие жертвы? Плугины проверки орфографии к популярным браузерам давно существуют. Например, спросите у гугла firefox russian check spell.
>Плугины
Плагины они.
plug — [plʌɡ]
мне показалось что те кто немецкий в школе учил — говорят плУгин
А лучше выучить правила русского языка. Виртуалку с собой не потаскаешь. Да и престижно — знать свой язык.
КО подсказывает, что в Белоруссии белорусский язык.
КО подсказывает что в Беларуси два госязыка: белорусский и русский.
На только своём языке мы бы не выплыли, маленькие слишком :) Так что приходится учить два.
Одно дело — знание правил, другое — чувство грамотности. При написании длинных текстов вы не будете для каждого слова вспоминать подходящее правило. Если забыли, как пишется, тогда да: вспомнили правило — написали грамотно. А если на слове вовремя не сконцентрироваться, то довольно просто пропустить ошибку.
А итог? Какую квартиру и с какими параметрами покупаете?
55k, 47кв.м. (хотя обычно за такие деньги предлагают не больше 40), 3 минуты до метро в зелёном районе. Минус — отсутствие кап ремонта (вроде в этом году должны сделать), но жить уже можно. Часть «недооценённости» идёт как раз из-за ремонта, однако это уже дело наживное, в отличие от места и количества квадратных метров.
Ждем похожую статью по приобретению автомобиля.
Аналогия, конечно, не совсем подходит, ибо при покупке автомобиля никогда не бывает больше 40-50 предложений, которые можно просмотреть вручную. Только единицы покупают автомибиль по принципу: «у меня есть 800.000 рублей, вот и буду смотреть все, что стоит от 100 рублей и до максимального лимита». Обычно человек имеет достаточно четкие представления о том, какая ему нужна марка, какой модельный ряд, какой нужен двигатель, какой год и какой цвет — все это отсекает 90% предложений.

Но есть и общий момент, который называется «есть нюансы» и который, как уже сказали выше, ставит под сомнение адекватность входных данных и, следовательно, адекватность данных на выходе. И с машиной значительно легче напороться на «не бита, не крашена, ездила бабушка, в соседний магазин», т.к. большинсво людей просто не могут оценить состояние автомобиля — у меня таких историй мильен.
Толщинометр ЛКП — наш выбор!
При первичном осмотре можно и не разбираясь совсем в автомобилях выявить возможные поврежденные и перекрашенные места.
Ну а затем, отсеяв совсем уж врунов, заехать с владельцем на осмотр к знакомым механикам.
У каждого прям знакомые механики есть. Знаете, это ведь целая проблема: найти приличный сервис, причем близко к месту осмотра авто. А кто платит за осмотр? А если в сервисе скажут что авто убитый — кто будет платить за осмотр? А если переносить осмотр на другой день — тачку могут перекупить. И еще куча если.

В общем, если сам не в состоянии корча выявить — покупай новый в салоне или бери опытного человека с собой.
Всё это решаемо. Если машина убитая — то продавец, если всё ок — то покупатель.
Кто из продавцов не согласен — лесом.
Брать опытного человека с собой не всегда вариант, так как очень многие проблемы не заметить с ходу, только в яме.
>> Кто из продавцов не согласен — лесом
Вы видимо ни разу не продавали машину.
Ваша правда, не продавал.
Только покупал.
О да!
Вспоминаю веселую хохму.
Хотел я как-то купить б/у авто. Нашел салон с интересным предложением, договорился, что можно будет проверить. Нашел сервис неподалеку от салона. Договорился с ними на проверку.
Продавец клялся и божился, что «машин нэ бит нэ крашен», с абсолютно уверенным видом — мне даже захотелось ему поверить на слово. Но решил проверить. В сервисе сразу сказали: бито и в морду и в зад, причем сделано крайне криво — диагонали у машины кривые.
Поговорил с ара-продавцом, мол как так. Он раскололся, что купил эту машину год назад себе за одну сумму, серьезно стукнул в аварии, подлатал и продает еще дороже. Нормально?

Самое смешное дальше, когда я через час захотел проверить еще одну машину в том же сервисе, мне отказали. Очень нервно мол извини чувак закрыто и вообще мы этим не занимаеися. Очень похоже, что Ара с автосалона позвонил Аре с сервиса и сказал: «Вай-вай, ти чего мне бизнес портишь, дарагой?». А попало простым слесарям :( — даже неловко перед ними.
Новые тачки в салоне у офф дилеров тоже бывают очень битые. Раша.
Толщинометр — это хорошо, но не панацея. Например, у машины менялся порог и для маскировки проделанных работ был нанесен антигравий по обоим бортам. Или была замена морды, без перекраски внешних элементов, которые взяты с донора. Сейчас на рынке очень много хорошо сделаных машин, реально хорошо сделанных, поэтому еще нужно представлять, куда прикладывать прибор. Совсем недавно давал людям толщинометр «на попользоваться», так они вернулись на «перевертыше» — на стойки взглянуть не догадались и китайские стекла подозрений не вызвали.

В любом случае, если вернуться к изначальной теме, то идея слабо подходит для оценки предложений по автомобилям. Вот, например, взять задачу определить класс автомобиля за данные деньги (т.е., по аналогии, количество комнат в квартире) — на рынке будут представленны почти все классы, даже если это будет скромная сумма в 500.000 рублей. И на цену будет влиять только техсостояние и «чистота» доков, а не пробег (это вобще не характеристика для б/у автомобиля) или, скажем, наличие кожи в салоне («расстояние до метро»).
Толщинометр — это просто первичный фильтр, уменьшающий количество осмотров в гараже, ибо времени занимает полдня фактически.
>> Сейчас на рынке очень много хорошо сделаных машин, реально хорошо сделанных, поэтому еще нужно представлять, куда прикладывать прибор

А все почему-то ищут не битый некрашеный и за 3 копейки. Ну не бывает такого. Более того, как бывалый автолюбитель, могу сказать что 90% машин старше 3 лет хоть раз да побывали в аварии. Пусть в мелкой, но побывали. Если уж ищите неновую машину, ищите хорошо сделанную а не «небитую, некрашенную». Конечно перевертыши и корчи брать не стоит. Но перекрашенное крыло или замененный бампер совсем не повод слать продавца лесом.
Дело не в том, что перекрашенное крыло или заменённый бампер, это, само по себе, конечно, не повод, повод — когда при этом говорят, что «не бита, не крашена».
Всегда есть отмазка про «предыдущего хозяина»
Ну ПТС-то я же попрошу посмотреть, пусть даже копию.
Ну это если 1 хозяин у машины был, что встречается тем реже чем старше автомобиль.
Вообще, да, вы правы относительно возраста. Но я просто для себя не могу придумать причину покупки б/у автомобиля более чем с 1 хозяином :)
ну если машине более 5-10 лет ты высока вероятность что ее перепродавали несколько раз… и никто уже доподлинно не знает сколько хозяев у нее было =)
Если машины по всем критериям подходит то какая разница сколько у нее было хозяев?)
Каждый хозяин записывается в ПТС, посчитать н есложно.
А почему бы и нет? Если машина по всем критериям подходит? Моей первой машине было 11 лет и хозяевами весь ПТС исписан. Тем не менее самые теплые воспоминания. Хотя с первой машиной всегда так…
Почти половина новых машин на стоянках дилера уже подкрашены или проходили полировку. Их же на автовозе везут, при погрузке-разгрузке тоже возможны повреждения, да и на стоянке дилера тоже. 2 истории сходу про мэйджор: на 1 машину уронили башмак, который под колёса подкладывают, вторую задели углом копировального аппарата, который тащили из одного помещения в другое через стоянку.

И, самое главное, если машина покрашена — это ещё не значит, что она была бита. Довольно часто красят морду из-за сколов. У одного знакомого на капоте 5 слоёв краски — перекрашивали из-за сколов, не могли попасть в цвет, за что он выносил им мозг и они перекрашивали. Это официалы, если что.
Знавал одного дядечку, который в собственном гараже, завешивая все тряпочками, красил так, что никто отличить от оригинала не мог.
Официалы же не попадают в цвет постоянно. Есть подозрение что они тупо берут заводскую краску по номеру. А на машине она уже выгорела, и не совпадает.
Мне вот было достаточно неважно, какой марки машина, и уж тем более цвета, с достаточно широкими рамками по цене и возрасту, только с предпочтениями по некоторым параметрам. Дождался пока кто-нибудь хоть отдаленно знакомый будет продавать.
Таким образом, мне многофакторный анализ автомобилей был бы интересен.
По моему опыту, таких людей очень и очень мало, буквально единицы. Обычно у человека есть более-менее четкие требования, зачастую список из нескольких наиболее приглянувшихся вариантов, ну или «пофигу какая, но чтобы под цвет сумочки и на автомате», но в этом случае редко смотрят на остальные параметры.
Мне кажется если доработать данную программу, то можно сделать хороший B2B проект для агентств недвижимости. Надеюсь вами заинтересуются нужные люди и вы сделаете свое дело.
они я думаю «на глазок» определяют недооцененность.
хотя для начинающих риэлтеров (коих в Москве множество, если не большинство) могло бы быть действительно полезно и наглядно.
Вообще, сама идея же проста и лежит на поверхности — может, у всех кому по делу надо, такие штуки уже есть :)
Я надеюсь, что вы выберите квартиру душой и не будите об этом жалеть, хоть она и не вошла в топ 10 вашей умной программы.
У меня друг выбирал квартиру с девушкой- брали с собой кота в заходили в кваритру. Он там убегать пытался, фырчал, нервничал. В итоге выбрали квартиру в которой их кот чувствовал себя хорошо. И живут радуются.
Ну это суеверие. Он мог например чувствовать себя хорошо где есть мыши или крысы. Кот им тут никак не помог.
Главное — чтобы коту было хорошо ;)
Вот так 5 рублей на пузырёк валерьянки и знание народных суеверий помогли продавцу сбагрить квартирку.
Так, коту квартиру купили, можно теперь и себе поискать…
Душой вы не просмотрите 500 объявлений :) Тут суть в том, чтобы уменьшить количество вариантов для рассмотрения до разумных, чтобы можно было спокойно походить и выбрать из достойных вариантов, а не проверять всё подряд и в итоге выбрать наугад.
UFO just landed and posted this here
UFO just landed and posted this here
можно попробовать отбрасывать объявления по сильной корелляции с другими объявлениями, семантической или фактической.
В общем, научить парсер отделять булшит от интересного.
Я вот не покупал квартиру, но когда хочешь снять — хорошие объявления как раз обычно от агентств, иногда их много на одну и ту же квартиру, и это еще не значит, что она плохая.
Но с арендой часто другая задача: как можно ближе к работе, это обычно сводит количество рассматриваемых квартир до минимального.
UFO just landed and posted this here
Баян! И это ещё игрушечки. Я также выбирал лучший ноутбук, и параметров там было не какая-то дюжина, а порядка 60, и парсил я целый сайт магазина, и решал в N раундов M СЛАУ, и усреднял целые 11 мегабайт коэффициентов, и получал таблицу из порядка 500 ноутбуков со всеми соотношениями цена-качество и прочее. Жаль, времени нет об этом писать тут.
Вы наверно будете думать, что вас заминусовали потому что не оценили, но я вам сразу скажу — это не так. Вас заминусовали потому что вы написали глупые, бесполезные понты.
Отличная статья, очень понравилось. Есть несколько мыслей, которые хотелось бы упомянуть.
Недавно вышла книжка как раз на эту тему — amzn.com/1449315151 Та же идея, о которой вы пишите — применение стат анализа и machine learning для сравнительно небольших, бытовых задач.
Когда я брал квартиру лет 8 назад, самым актуальным ресурсом был nb.by/realty/proposal/ Сейчас чуть меньше табличных данных дают, но все же должно быть более удобно чем irr. Чем мотивировались выбирая источник, и почему не объединяли данные из разных для большей выборки?
Уверен, что риэлторы тоже используют некую методику для рассчета адекватности цены, не только «средний метр умножить на общую площадь». Интерсно услышать от кого-то знающего, что и как.
В Штатах есть несколько авторитетных ресурсов, которые не только собирают данные об актуальных продажах квартир и прочей недвижимости, но и проводят оценку, выдают ориентировочную оценку текущей стоимости объектов, которые вообще еще не продаются, применяя все те же алгоритмы ML. Самый известный, наверное, это Zillow. С самим алгоритмом не знаком, но один из ключевых факторов — это расположение и цена на аналогичную недвижимость в том же районе. Если у вас будет еще интерес заниматься этой темой, я бы посоветовал покапать в этом направлении, выделить геокластеры аналогичных квартир, и уже среди них поискать выделяющихся. Но вы и так отметили в комментариях, что добавили выборку по районам…
И последняя реплика. Вспомнилось как год назад на одном выступлении Martin Omander из Гугла описывал на аналогичном примере их Prediction API, который позволяет проводить как распознование (язык, спам-не спам, настроение текста и т.п.), так и скалярное прогнозирование. В качестве примера он загрузил в это открытое API базу из нескольких сотнях записей о продаже домов, в том же csv — 5 параметров вроде использовалось для наглядности. API позволяет проанализировать эти данные в том же ключе, что и вы делаете, и выдать ориентировочную стоимость по заданным параметрам. Такой вот публичный сервис, однако.
Спасибо за отзыв, и пардон, что так долго добирался до вашего комментария :) Судя по описания, книга действительно интересная, даже просто с точки зрения идей применения статистики в быту. Источник данных выбирал практически наугад. Поначалу я ещё пробовал искать на hata.by, но там настроек гораздо меньше. Чтобы объединить данные из разных источников, нужно как минимум написать парсеры для каждого из них и согласовать формат данных. А учитывая, что и на irr.by предложений хоть отбавляй, для своего маленького эксперимента я посчитал это излишним.

Честно говоря, из общения с риэлторами я так понял, что цену они определяют «на глаз». Ну, т.е., средняя цена за метр квадратный в этом районе умножается на площадь, а затем просто применяются оценки: хороший ремонт — ага, прибавим пару тысяч, 5-й этаж без лифта — скинем тысячу, рядом нет школ и поликлиник — замнём, но если клиент заметит, предложим небольшую скидку.
В других странах, таких как США, вполне вероятно, что используются более автоматические и точные средства определения цены.

Про геокластеры тоже думал. На Udacity, кстати, в курсе по статистике как раз приводился пример про разные средние цены в разных регионах. Очень наглядно. В Минске, насколько я могу видеть, цены для квартир в разных регионах отличаются не так сильно (не считая некоторых элитных мест), а вот для той же Москвы, думаю, расслоение будет значительным.

Я когда-то колупал Prediction API, но насколько я помню, там внутри всё те же классификаторы и регрессионные модели, доступные и в любой open source библиотеке. Поэтому для серьёзных проектов я бы всё-таки предпочёл библиотеки, которые к тому же ещё можно кастомизировать под себя. Хотя для простых сайтов, наверное, Prediction API — вполне неплохой выбор.
Покупать никогда не покупал (и не собираюсь покамест), а на съём у меня за 11 лет выработались крайне нематериальные критерии. Отчасти они от работы дома. Это все в Китае, но имхо часть из них можно и в России применять. Площадь не меньше 100 м2, окна до пола, потолок от 3 м, этаж от 10 а лучше от 25, паркет или ламинат, зелень вокруг и отсутствие магистралей и вообще крупных дорог. Автобус / метро от дома на расстоянии *не меньше* 1 км (ходить полезно, и существенно тише) и не больше 3 км. Велодорожки. У соседей нет собак. Соседи не делают ремонт и не увлекаются музыкой и игрой на инструментах. Нет детей. Бассейн и спортзал в моем комплексе или в соседних прилегающих. Рестораны не менее 20 ближе 2 км. Кофейни и чайные. Парки и велодорожки. Отсутствие парковки под окнами. Отсутствие определенных видов деревьев, чтобы не было цикад. Хороший вид из окна. Желательно квартира на три стороны, если на две — то юго-запад на северо-восток (иначе слишком жарко). В общем, ни один из этих критериев, кроме площади, не автоматизируется :)
Хорошие у вас критерии. Видно бизнес идет хорошо=)
Отчего это Вы думаете, что не автоматизируются:
-высота потолков
-этаж
-расстояние до крупных дорог
-количество кафе в округе
-расстояние до метро\автобуса

Хотя соглашусь, субъективные параметры очень важны. Но автор же не предлагает выбирать квартиру только по коэффициентам, с помощью его методики можно отбросить явный шлак и выбирать уже только среди подходящих по числовым параметрам квартир.
Этаж да. Высоту редко где указывают. С расстояниями сложно до *крупных* дорог сложно, ведь бывают крупные дороги почти без трафика, или надо пробки подключать, это уже довольно сложный расчет. С количеством кафе тоже все непросто, это могут быть стандартные макдаки и старбаксы, надо ходить смотреть, где правда можно будет кушать (тут в Китае дома готовить невыгодно и муторно).
И в итоге оказывается, что лучше покупать/строить дом.
В вашем случае — может быть. Я пока придерживаюсь варианта снимать квартиры по полгода максимум. Помогает от накопления кучи ненужного барахла, плюс смена декораций. И пока на каждой квартире какие-то косяки да находились. Дом может быть, если где-то в центре города, на берегу озера или реки. Дом как в Питере или Москве, до которого надо еще час ехать, это вообще не мой вариант — очень люблю центры крупных городов.
в центрах крупных городов бывает >1км до метро и автобуса?
как «зелень вокруг» согласуется с 25 этажом? в окнах в большинстве случаев будут такие же 25 этажи соседних домов (если это не Москва, где выше 22-24 этажей пока не принято)
Как вы выясняете вопросы о соседях?
Товарищ в Москве менял квартиру из-за детей у соседей сверху.
Тут это будет очень сложно выяснить, придется обойти всех соседей и со всеми поговорить, а не дай Бог кто в отпуск уехал, прихватив собаку и детей, а потом вернется…
Про соседей спрашиваем через «обратные» вопросы (делаешь радостно-удивленное лицо и говоришь — я такой собачник! правда-правда тут есть соседи с собаками? а полюбоваться как вечером под окном танцуют тут можно? а моим детишкам будет с кем поиграть? а на пианино есть кто играет? — так хочу научиться! — агенты все бросаются сразу выяснять и рассказывать).

Зелень вокруг — это вид из окна, да и выходим мы все же иногда из дома. :)

С центрами и расстояниями — бывает, но надо искать. Я не говорю про самый-самый даунтаун, но надо, чтобы в него было легко дойти или доехать (в идеале — на велосипеде). Опять же, китайские города имеют достаточно просторную и размазанную структуру, часто «центры» вытянуты на километры вдоль основных улиц или набережных, а чуть поодаль вглубь начинаются кварталы с жильем.
В России, к сожалению, большая часть этих критериев (обо всех речи не идет) автоматом переводят недвижимость в класс сверх-элитной
Здесь тоже с этим нелегко. Особенно китайцы, совершенно невосприимчивые к шуму, любят воткнуть какой-нибудь крайне приличный во всех других отношениях комплекс — всеми окнами на пятиэтажную развязку. :)
В полном восторге. Именно на таких примерах нужно студентам объяснять статистику.
UFO just landed and posted this here
Честно говоря, как человек, пришедший из машинного обучения, я больше привык полагаться на другие показатели точности, такие как accuracy, F1 и т.п., а о t-статистиках имею весьма смутное представление (сказывается в т.ч. разница в терминологии). Зависимости остатков от индекса не вижу:

  > plot(residuals(model))


Но тут мы ещё делаем неявное предположение, что данные были считаны в хронологическом порядке (или вы что-то другое имели ввиду?), а это может быть и не так. А если всё-таки есть зависимость, то как тут применить MLE (опять же, у меня есть несколько предположений, но все они могут расходиться с вашим методом)?

Собрать сезонную статистику мгновенно тоже не получится: предложения по немногу удаляются, так что найти что-то старше пары месяцев было бы сложно. А так, конечно, зависимость будет. Если заниматься серьёзно, то неплохо было добавить в модель ещё по фиктивной переменной на каждый месяц года, а заодно отслеживать общее повышение/понижение цены.
UFO just landed and posted this here
Сначала гистограмма, чуть позже на всё остальное отвечу.

Гистограмма остатков:


И, наверное, немного более удобный для восприятия график плотности вероятности:


Для сравнения — график сгенерированного нормального распределения:
UFO just landed and posted this here
По-хорошему, это должен делать сервис объявлений. Правильно построенное сообщество с приятным интерфейсом, грамотной анкетой — и большинство сделок закрывалось бы качественнее и без посредников. Но такого сервиса пока нет.

Рынок недвижимости у нас дикий. Несмотря на то, что сделки там огромные. Сталкивался несколько раз, когда снимал квартиру.
UFO just landed and posted this here
У нас это обычно называют «цепочка». Да, весьма неприятная штука.
Спасибо за отзыв :)
Я люблю свою работу ;) вижу, что вы тоже!
Отличная статья!

Да, есть пара недочетов и неучтенных параметров, но это все мелочи. Главное, что прямо вдохновляет самому попробовать :)
Спасибо. Одним из мотивов для написания статьи как раз и было желание показать, что анализ данных — это не только большие корпаративные БД и стратегические решения, но и самые обычные бытовые задачи.
Ах, как мне нравятся, когда находятся люди, способные показать, как применять сложные технологии к бытовым проблемам.
А что в этих технологиях сложного?
Сложного действительно ничего нет, но у нас люди как-то ещё не привыкли использовать систематический подход к решению проблем. У нас всё ещё чаще всё делается на глаз, исходя из опыта и собственных ощущений, которые часто врут.
Курс на coursera даже пример приводит тот-же — недвижимость. Все кому понравилась статья — советую посмотреть.
Я хотел написать статью про линейную регрессию, но потом подумал, да ну её, лучше куплю квартиру

Тонко… ))
В своё время Ирэн Адлер из современного Холмса говорила, что мозги — это нынче сексуально (Brainy is the new sexy), не знаю, даёт ли это преимущество при размножении — но преимущество при поиске квартиры однозначно предоставляет )))
Я бы об этом вспомнил:

image
Отдельно нужно рассказать про тип санузла. Предвидя числовые вычисления я понимал, что работать со значениями «общий/раздельный» гораздо сложней, чем с числами, поэтому пришлось завести 2 отдельные переменные, по одной на каждый тип. При этом если одна переменная была равна 1, то вторая обязательно равнялась 0

если бы вы затолкали эти переменные в регрессию, у вас была бы мультиколлинеарность: ru.wikipedia.org/wiki/%D0%9C%D1%83%D0%BB%D1%8C%D1%82%D0%B8%D0%BA%D0%BE%D0%BB%D0%BB%D0%B8%D0%BD%D0%B5%D0%B0%D1%80%D0%BD%D0%BE%D1%81%D1%82%D1%8C
Не совсем: есть ещё вариант, когда тип саузла не указан, тогда обе переменные равны 0.
Так вы находите закономерности на придуманных данных. Интерпретация полученных таким образом коэффициентов не имеет смысла и будет сильно меняться при незначительной смене модели.
Тут зависит от получившихся коэффицинетов. По логике коэффициент при переменной раздельного санузла должен быть положительным, а при совмещённом — отрицательным. Тогда нули для обеих переменных как раз будут давать некоторое среднее значение, что и показывает отсутствие данных об этих переменных. К счастью, линейную модель довольно легко интерпретировать и при ошибках в коэффициентах всегда можно её доработать, использовав, например, одну переменную со значениями 1 (для раздельного), -1 (для совмещённого) и 0 при отсутствии информации или, что более правильно, просто использовать среднее значение по данным, возможно c лапласовским сглаживанием. Однако, в рамках простой POC модели, как мне кажется, на этом не стоит заморачиваться. В конце концов, в получившейся модели есть гораздо более серьёзные погрешности.
1, -1, 0 нормально, но модель должна быть в логарифмах. Иначе получится, что раздельный санузел прибавляет одну и ту же сумму к квартире за 30 и 130 тыщ баксов, а он скорее действует пропорционально
Мне кажется, если рассматривать такие диапазоны цен, то нужно вводить дополнительный параметр («класс» или что-то вроде), ибо там не только санузел будет прибавлять в цене. А для небольшого диапазона разница между разными раздельными санузлами будет незначительна.
Я вообще не понял зачем вводить две булевых переменных, когда можно одну? 0 — совмещённый, 1 — нормальный и всё. Не?
Во-первых, если сделать как вы говорите, то при совмещённом санузле эта переменная вообще никак не будет учитываться — 0, умноденный на любой коэффициент k всё равно даст 0. В принципе, регрессионный анализ должен подстоиться и под такую ситуацию, но интерпретировать модель уже станет сложней. А во-вторых, с одним булевым атрибутом вы уже не сможете расширить логику для 3 и более состояний. Переменные, которые могут принимать строго фиксированный набор значений (как enumerations в языках программирования) в статистике/машинном обучении называют номинальными или категориальными. Например, категориальной переменной является день недели. Представьте, что вы продаёте лимонад в парке и хотите спланировать, сколько его нужно закупать. При этом вы знаете, что в субботу и воскресенье в парке полно народу и лимонада нужно гораздо больше, чем например, в понедельник или среду. Как использовать день недели в уравнении линейной регрессии? Вы не можете просто назначить дням с понедельника по воскресенье числа от 1 до 7, иначе получится, что в воскресенье будет всегда продаваться в 7 раз больше лимонада, чем в понедельник. Переменная дня недели является категориальной, а для значений этого типа не существует арифметических правил. Наиболее простой способ использовать информацию из категориальных переменных — это разложить их на индикаторные. Тогда вместо 1 переменной «день недели» у вас появится 7 — «понедельник», «вторник» и т.д. Зато теперь регрессия позволит найти «вес» каждого дня недели отдельно и построить гораздо более точную модель.
Во-первых, если сделать как вы говорите, то при совмещённом санузле эта переменная вообще никак не будет учитываться — 0, умноденный на любой коэффициент k всё равно даст 0. В принципе, регрессионный анализ должен подстоиться и под такую ситуацию, но интерпретировать модель уже станет сложней

Регрессионный анализ достаточно мудр, чтобы интерпретировать эту ситуацию: положительный коэффициент будет обозначать премию за раздельный санузел.
В случае с парком нужно не 7 переменных, а 6, иначе будет мультиколлинеарность, о чём вам уже написано выше. День, не покрытый dummy-переменной, считается днём по умолчанию. В модели должна быть константа.
Тогда это уже будет другая логическая модель санузла :) В общем-то, ничего плохого для данного случая, но в потенциале лишает систему возможности расширения (невозможно добавить более тонкую градацию санузлов).
Про 6 дней для 7 переменных — верно, это я уже разогнался, извиняюсь. Хотелось показать именно сам принцип замены категориальных переменных индикаторными.
Респект за статью. Только зачем столько знаков после точки?
Если вы про вывод чисел, то это стандартный формат в R. При желании можно отформатировать и иначе, например, с помощью функция formatC() или prettyNum().
Интересная статья, спасибо большое! Жду продолжения «как я покупал штаны» и «как я выбирал жену» :))
Супер :) Ждем статью о том как вы выбирали себе девушку :D
Вы не в курсе не появилось ли сервисов с подобными функциями?:)
Неожиданно нашёлся такой отклик: http://telegra.ph/Statisticheskij-analiz-anket-prostitutok-Moskvy-04-09
Sign up to leave a comment.

Articles