Pull to refresh

Comments 38

Делал примерно тоже самое когда прорешивал задания Яндекса размещенные у них в разделе с вакансиями. Задачей было максимально точно спрогнозировать цену машины.

Подход был похожий, основную боль вызывали рандомные блокировки моего миникраулера со стороны auto.ru при сборе датасета. В итоге удалось на catboost'e при помощи линейной регрессии соорудить вполне жизнеспособное решение без каких-либо ML'ных изысков, но вот вакансия к тому моменту закрылась :)
Очень многие сайты научились детектить Selenium. Кто научился это обходить?
AutoIt + OpenCV + любой браузер.
Минус — намного больше геморроя, чем с Selenium, времени на настройку и отладку уходит больше, сам сбор данных работает дольше, надо парсить полученные html, работает только в винде.
Плюс — стопроцентная эмуляция кликающего в браузере юзера, невозможно задетектить в принципе (ок, в принципе возможно, если анализировать скорость и траекторию движения мышки или регулярность частоты кликов, но и в это можно добавить рандома, максимально приблизив к обычному юзеру).
Нормально настроенное на определенный сайт и отлаженное, такое поделие скрапит сайт не менее надежно, чем селениум.
Непонятно за что минусят, ведь ответ хоть и бесполезный, но семантически абсолютно корректный. :-) Как и в анекдоте.
Завидуют! ;)
Мой ответ совсем не бесполезен! Он показывает, что это возможно!
Однажды один ̶ч̶е̶л̶о̶в̶е̶к̶ подонок рассказал мне, что продавая банки кофе научился вскрывать мембрану из фольги отсыпать хороший кофе и досыпать дешевый. Мембрану потом как-то обратно запаивал.
На вопрос как это делать он ответил: «На таких знаниях состояния делаются!»
Но на вопрос в личке я отвечу, я не жадный
Просто человек поупражнялся в своём ремесле. А на факту купил ту, которая была ближе к дому при равном бюджете. Даже на в его таблице есть машина и новее и с большим количеством опций и чуть дешевле:
Выделил красным
image
На 7% аж дешевле, т.е. $2000. Это почти столько же, сколько его «сэкономленные» $3000!
Так вроде список отсортирован — певая еще выгоднее
Хорошая б/у машина определяется не собранными метриками, а капризностью эксплуатации конкретного экземпляра. Но для поиска оптимального диапазона цен — норм.
Ну это вопрос подготовки датасета же, делая такое по авто.ру можно отсеять автомобили с низкими баллами в отзывах, например.
Суть не в этом, надо смотреть конкретный экземпляр. Одни автомобилисты со своих авто пылинки сдувают, другие годами масло не меняют. А перекупы сварят два авто после серьезного ДТП в одно, и будут продавать как «не бит, не крашен, бабушка в церковь по воскресеньям ездила». Данные этого не покажут. Вполне может быть, что более плохой авто по данным окажется лучше других, потому что владелец «более плохого авто с точки зрения данных» написал честно.
Опять же, могу смотреть только с позиции своего опыта. Потенциально проблемная машина на авто.ру имеет:
1. Большое кол-во хозяев за небольшой промежуток времени.
2. Подсвеченную красным проверку по VIN.
3. Странные идентификаторы или шаблоны в описании.
4. Низкую цену относительно комплекса базовых параметров (год, пробег, комплектация, двигатель, тип кпп, итд).
(Может ещё что-то забыл)

Всё что частично или в комплексе подпадает под эти критерии — должно настораживать. При этом не зависимо от глубины проведённой аналитики правду удастся узнать лишь увидев машину, продавца и документы в живую (и то не в 100% случаев).
Ну а допустим машина с одним владельцем, проверка VIN-зеленая, инфы по ДТП нет, а по фото видно что зазоры кривые и некоторые элементы кузова не попадают в цвет при хорошем освещении? В печально известном АТЦ М… таких объявлений половина
Скорее всего такое объявление подпадет под пункты 3 и 4 из моего ответа выше. На моей практике выбора авто — это утверждение подтверждается.

Я выбрал по формальным параметрам машину, приехал за 700 км и оказалось, что на фото всё хорошо, а глазами видно столько мелочей, что совсем не хочется покупать. В итоге взял машину ниже классом, но новее, с ДТП формальным, и дороже. И только зря время потратил и деньги на пробив десятка моделей, которую хотел взять изначально.

Такое бывает. Из спортивного интереса: первое авто было по низу рынка для этой модели а второе середина-верх?

По идее интересная модель заработка — отбираем и покупаем сильно недооцененные автомобили и затем выставляем их по рыночной цене. Я бы еще добавил обработку по регионам, чтобы понять где можно купить данное авто подешевле, а где продать подороже и перевозить авто трейлерами, чтобы было ближе к дому, как отметил автор поста.


По-сути получается полностью автоматизированная система с минимальным участием человека в принятии решений.

Вы придумали «перекупов»

Не, "киберперекупов" :-)

UFO just landed and posted this here

Насколько я знаю, во многих случаях считается количество регистраций. Т.е. если авто не регистрировать на перекупа, то количество регистраций не увеличивается.

Это ж очень старое приседание, которе я читал года 3-4 назад… может даже на хабре… правда, скорее всего, было на R, а не py.
P.S. Я себе бюджет планирую: собрал банковские выписки (все траты со всех банков) за несколько лет -> получил сезонку -> использовал как веса при планировании операционных затрат. Да, модель весьма специфична, работает далеко не для всех: несколько лет как стараюсь жить на одну и ту же сумму в месяц (+- сезонка). Поэтому мне подходит.
UFO just landed and posted this here
Годнота! Просто, понятно, практично.
Выбирал, выбирал и итоге купил ту, что поближе.
Отличная статья.

Я с самого начала ожидал, что пробег и год влияет на цену. Так и оказалось :)

Делал похожий анализ. Мне показалось интересным сравнивать скорость паления цены на машину с пробегом или годами.


Некоторые падают быстрее ( французы все приходят к нулю через 3 года исчезают) некоторые падают медленнее ( немцы кроме vw).


Некоторые сильно сбрасывают цену в начале (выезд из салона) но потом достаточно долгое плато. Вот такие и нужны на вторичке. Купил Вольво в результате.

При прочих равных сильно зависит от хозяина и хранения. Некоторые за пару лет уделают авто так, как другие за 10. И это вам ни пробег, ни год не покажут.
тормоза, ой, фильтры придумал трус! вот если честно, неужели стандартные фильтры не смогли бы помочь с поиском? или надо было вот прям убедиться, что обвес и пробег/год увеличивают и уменьшают цену, соответственно?
Вероятно, самыми шокирующими результатами из всех стали те, которые указывают на разницу в цене между SLE и Denali
вот это серьёзно? без шуток?

а если посчитать время, потраченное на добывание и вылизывание выборки, да на почасовую ставку такого специалиста, какая экономия выйдет?

когда коту делать нечего…
Мои выводы из сего опуса:

1. датасатанист — сущность бессмысленная. Ибо рисует отчёты в стиле КО, а ЗП просит огого.
2. ИТшники ботаны, кто так машину выбирает?
Как представитель этих самых дата сантистов, имею сказать следующее:
1. Главное не картинки а модель, а точнее поддержка принятия решения
2. Интуицию и экспертное мнение никто не отменял, но подтвердить достоверность при помощи матеши — это аргумент.
3. Пример в статье скорее игрушечно — фановый, в реальной работе ДСа данных намного больше и критериев для выбора решения тоже.
Я примерно так супруге Фиат купил. Но мне было проще, ибо нужна была определенная марка — Фиат пятисотый с коробкой — роботом и «красненькая». С пробегом в 30-40 тыщ они стоили в районе 7-8 килоевро. Я купил у турка за шесть тыщ. В итоге — зимой на летней резине, с убитым аккумулятором, масло ни разу не меняли, коробка через некоторое время начала глючить. Ее обслуживание примерно в тысячу и вышло. Машина была предназначена для обучения вождению и мы довольно быстро распрощались с ней, купив такой же, но почти новый Фиат с гарантией у официалов. Я это к тому, что если машина сильно ниже рынка, то тому могут быть причины, и в конечном итоге с учетом доп вложений так на так и выйдет. Либо придется потратить кучу временми на осмотры. Хотя не купить сильно выше рынка этот метод безусловно может помочь.

Есть сайт, robasta.ru, то же самое делает, автор здесь про него рассказывал.

Сеймур Крей ( Основатель компании Cray Inc. которая создавала суперкомпьютеры ) автор другого интересного метода выбора подходящей машины для покупки.
Метод заключается в следующем: вы идете в магазин, ближайший к вашему дому, показываете на машину, ближайшую к двери, и говорите: «Я беру эту». Этот алгоритм оптимален по одному важному показателю: он позволяет тратить минимум времени на не очень важные дела (покупку автомобилей) и оставляет большую часть времени на важные (разработку суперкомпьютеров).
Сеймур Крей не образчик здравого смысла, если почитать его биографию…
В те времена гики милиардерами становились, а он всю жизнь скакал от банкротства к банкротству, в перерывах работая на ЗП (возможно и неплохую).

Ну и машины выбирать есть способы лучше…

Следует отметить, что у многих русских, в отличие от буржуев, машина — почти член семьи ;) хотя потреблядство, конечно понемногу заполоняет.
Sign up to leave a comment.