Comments 122
Сколько в итоге модель по времени отрабатывает?
А почему судом не стали решать? Кража контента на лицо, доказательств куча, нарушение и ваших соглашений/оферт и законов тоже доказать не составило бы труда. Или это параллельно решается?
nomeroff.net.ua/onlinedemo.html
А с Black-box да, сложно.
nomeroff.net.ua/models/mrcnn
Исходный код здесь:
github.com/ria-com/nomeroff-net
И вообще то это статья не про бизнес, а про науку. Статьи про бизнес и деньги — это на другие ресурсы, к цукербергам там или еще каким.
Заранее извините, если вдруг обидел.
Собственно, а почему владелец объявления не сможет так же "обработать" фотографию, чтобы алгоритм сокрытия номеров от Авито не смог обнаружить номер?
И вообще то это статья не про бизнес, а про науку.
Ну тогда и надо удалить первый абзац текста, и сразу перейти к проблеме. И все вот эти вставочки про этичность и недоговороспособность конкурента.
По закону о ПД общедоступные персональные данные могут обрабатываться кем угодно. И потом, согласие людей ведь спрашивали.
При чем здесь закон «О рекламе», я вообще не понял. Ну и все остальное, кроме «правил авито», тоже притянуто за уши.
— во-первых, рекламная коммуникация осуществляется без предварительного согласия на получение такого сообщения (закон о рекламе);
— во-вторых, нет предварительного согласия на обработку перс. данных с целью прямого контакта с потенциальным потребителем для продвижения собственных услуг (закон о персональных данных);
— в-третьих, нарушается принцип целевой обработки персональных данных, их используют не в тех целях, в которых они были изначально предоставлены (ещё раз закон о персональных данных);
— в-четвёртых, нарушаются права Авито на базу данных и товарные знаки.
То, что Avito пытается быть прокурором и защитить возможные права рекламодателя, не делает действия по копированию незаконными.
А конкуретны не отслеживают пропажу объявления с авито, поэтому я считаю, что в данном случае Авито поступают верно.
С другой стороны, было бы идеально, чтобы авито, авто.ру и другие площадки, могли бы встретиться за круглым столом и договориться о едином API, чтобы можно было сводобно постить объявления и чистить их за собой, при этом у пользователя при посте объявления была галочка «распространить ваше объявления и на другие площадки автоматически»
2, 3. Общедоступные данные могут обрабатываться кем угодно и как угодно.
4. По базе данных — а вы сможете доказать, что заимствован значительный объем? По ТЗ — вас никто не просил его добавлять. И тут вот вообще смешное написано:
«Мы вправе автоматически наносить на загружаемые вами фотографии логотипы/водяные знаки Авито и Domofond, чтобы предотвращать несанкционированное копирование пользовательского контента.»
«Защищать от копирования» может только обладатель исключительных прав, тогда как у авиты — неисключительная лицензия.
Так что открыто != могу скачать и делать что хочу
Вообще-то «и проиграл», кажется :)
kad.arbitr.ru/Card/1f33e071-4a16-4bf9-ab17-4df80f6c1556 — ссылка на само дело
Действительно сейчас очередной этап пересмотра решения
А что плохого в само рекламе? Сколько технических статей на хабре из серии смотрите какой я молодец какую штуку крутую сделал. + подробный рассказ как сделал. Да таким статьям тут самое место.
Р.с. А конкурентам (негодяям) так и надо. Тоже сугубо мое личное мнение.
Можно сказать про них, что угодно и они не ответят, т.к. просто не знаю об этомт.е. использование чужого контента и данных — это плохо, но показывать пальцем на виновника как-то «не по-пацански»?
тем кому нужно — все равно бы узнали сайт по дизайнутем, кому не нужно — и так по барабану, зачем скрывать?
т.е. использование чужого контента и данных — это плохо, но показывать пальцем на виновника как-то «не по-пацански»?
я считал это «нормой этики» (не уверен, что правильно называю) не ссылаться на третьих лиц в технических статьях без крайней необходимости (данная статья не потеряла бы смысловой нагрузки), даже если они виноваты.
Но я уже понял, что я с таким мнением в меньшинстве и нет смысла развивать эту тему. Всем спасибо за высказанное мнение:)
P.S. авторам спасибо за статью, сам процесс было очень интересно читать.
Вы ни разу не подвергли сомнению, что у конкурентов нейросеть, которая ищет ваш логотип.
Но у них, судя по всему, НЕ нейросеть. Именно поэтому незаметный шум не сработал (и не может сработать). Искать прямоугольник с цветами логотипа внутри не сложно и без нейросети.
«Именно поэтому незаметный шум не сработал» — в статье написано про сложность обобщения на black box, поэтому утверждать что у них «НЕ нейросеть» основываясь тольно на этом довольно смело.
Почему мы всё таки склоняемся к тому, что у них нейросеть — это следствие разбора случаев, когда номерной знак был ими закрыт не идеально.
следствие разбора случаев, когда номерной знак был ими закрыт не идеально
Возможно. Я сделал предположение исходя из ваших результатов. Данные о машине не влияют (на стиралке тоже работает), зато помогает уничтожение рамки.
В любом случае статья очень интересная (не только технически, но и как противостояние платформ), спасибо.
Поверьте, при подаче объявления человеку сложнее правильно описать, чем тыкнуть в чекбоксы и выбрать из тройки значений выпадающего списка.
А вот сформировать типовые параметры для категорий — чем не отличная задача для того же ИИ?
Ту, которую в итоге и разместили, да? :)
В самом тяжёлом случае можно вообще натренировать сеть определять где у машины номер по очертаниям самой машины. Т.е. не искать прямоугольник похожий на номер на картинке, а делать примерно тоже самое, что делают камеры смартфонов, когда распознают лицо и динамически позиционируют на нём маску.
Тоже считаю злом скрытие номера. Лучше бы с помощью нейросети как-нибудь красиво вписывали бы логотип Avito в пейзаж окружающий машину. Вот тогда бы его точно вырезать было сложно.
Во-первых, скрывать номера — это правильная идея. Незачем всяким мутным личностям их собирать и накапливать. Желание владельца сохранить приватность выше вашего желания просматривать чужие данные, что тут непонятного? Я бы вообще наказывал тех, кто владеет или пытается использовать нелегальные базы данных. Не только тех, кто продает доступ, но и кто покупает. Дать "умнику" полгодика тюрьмы — глядишь, желание "пробивать" номера машин поубавится.
У нас и так слишком много баз данных в открытом доступе и слишком неэффективно наказываются те, кто их распространяет. И конечно, опция скрытия данных должна стоять по умолчанию.
Что касается объявлений, то они не являются собственностью Авито. Если вспоминать авторское право, то права на фото принадлежат автору, текст объявления не защищен авторским правом. Что касается охраны базы данных, то это не Авито составил базу данных, а люди сами вносят свои данные. Ишь вы какие умные, решили "приватизировать" чужой контент.
Я кстати, замечаю, что бизнесу в таких случаях верить нельзя, это всегда двойные стандарты: пока они маленькие, они сами парсят данные с других сайтов, а как станут крупнее, начинать рассуждать об авторском праве.
Скрывать номера это ужасная идея. Мутные личности могут совершенно спокойно выйти на улицу с блокнотиком, фотоаппаратом и вручную собрать даже больше данных, чем есть на Авито. А вот гемора это добавляет огромное количество, как владельцу, так и покупателю.
Нелегальные базы данных с номерами авто чем вам насолили? А вот выручить порой они могут.(в основно для того, чтобы узнать телефон владельца авто и предостеречь/попросить/т.д.)
Они делают это так: обзванивают продавцов и предлагают им разместиться на своей платформе. А иногда и вовсе копируют объявления без разрешения пользователей. Авито — популярная площадка, и мы часто сталкиваемся с такой недобросовестной конкуренцией.
А что недобросовестного в обзванивании и предложении размещения? Как по мне так конкуренция в чистом виде.
ЗЫ Сама статья очень понравилась.
на мой взгляд в том, что меня обманывают. «Тут» вы заплатили за премиум, а вот «у нас» бесплатно.
«Вы» в данном примере кто? Авито? Я не пойму в чем для них недобросовестная конкуренция.
То что клиент разместил у них объяву равносильно подписанию эксклюзивных прав?
Некто пришел к твоему клиенту и предлагает свои услуги — чистая конкуренция.
Ну и к слову, «конкуренция» это же просто выбор меж разными вариантами.
А что недобросовестного в обзванивании и предложении размещения?
Они предлагают одно (используя мой телефон, который я оставил для тех, кто хочет купить у меня вещь), вводят в заблуждение (и тратят моё время), т.е. я страдаю.
А когда я размещался «у них», то меня одолели слать спам через смс/вайбер и т.п. Т.е. в случае «с ними» (авто.ру) я страдаю от третьих лиц (мошенники), а в случае с авито я точно так же страдают от третьих лиц (авто.ру). И те и другие хотят получить мои деньги обманным способом (очень утрировано, но идея одна).
А еще из объявлений (не знаю с какого точно сервиса, предполагаю что с Авто) звонят из третьего сервиса, Кар прайс и тоже предлагают продать мою машину быстрее, без оплаты им, но для этого нужно съездить на бесплатное ТО, причем приехать должен тот, кто собственник по документам. Т.е. все честно и открыто.
На недобросовестную конкуренцию жалуется авито — их конкуренты ведут недобросовестную конкуренцию.
Чего там чувствует чей пользователь никому не интересно.
Суть 1 претензии — тырят их контент, тут вопросов нет, претензия в меру справедлива.
Суть 2 претензии что некто звонит их пользователям и предлагает свои услуги. В чем тут недобросовестная конкуренция?
В том, что пользователя в заблуждение вводят. Скажи они сразу «за 1000 можно и у нас», я бы им сказал спасибо, не нужно.
Вас как пользователя в этом диалоге просто не существует.
Признаком недобросовестной конкуренции называется дозвон конкурента их клиентам и предложение своих услуг.
Вероятно, что один сервис А обвиняет другой сервис А в том, что после моего согласия (или до него?) «другие А» автоматом тащут (парсят) контент с Авито.
Мне всегда было интересно, кто у авито устанавливает приоритеты задач? На сайте помойка из липовых объявлений, неверных названий, не верных данных, дублирования и прочего, поиск нормально не работает, но зато мы закрываем номера для того чтобы плодить еще больше мошенников, и даже не спрашиваем пользователя о необходимости этого. Надеюсь что конкуренция рано или поздно сделает свое дело, и мы получим удобный сервис, а не то что имеем.
Фейковые (я сталкивался недавно с недвижкой) размещаются платно и никакими жалобами не убираются, тк они платные (какой смысл сайту отказываться от денег?). Кроме того конкуренты риэлторов не спят и точно также могут пожаловаться на реальное объявление как на фейк, видимо и поэтому закрывают глаза на жалобы.
Кроме «ловли на живца» фейки используются для манипулирования рынком (занизить/завысить рыночную оценку стоимости в данном районе).
В общем в недвижке там сам по себе бардак творится, который техническими средствами в виде Авито — не решить, требуется какое-то законодательное ограничение, например ограничение публикации объявлений только от лица владельцев (верифицировать можно через налоговую, вся информация о недвижимости у нее есть)
например ограничение публикации объявлений только от лица владельцев
Ирина Анатольевна, перелогиньтесь!
Я понимаю, что бардак в авто и недвиж объявлениях страшный. Но попытка регулирования со стороны государства (в таком виде) приведет только к появлению еще одного зонда. Количество кривых объявлений не уменьшится, так же как не уменьшилось количество педофилов после появления РКН.
И вторая — что люди старше 50лет, не врубающиеся в IT, не смогут выложить или потеряют учетку к налоговой.
В общем еще раз подтверждается что бардак в отраслях сначала надо устранить.
Из диалогов с оценщиком:
— а почему вы в сравнении показываете как «аналог» объявление квартиру на 9-м этаже 17-этажного дома, если в этом районе 3-х этажные дома. Вы же ездили в «нашу» квартиру!
— не обратила внимания…
Это уже мелочи по сравнению в остальным, когда заходишь в покупку домов, и видишь что процентов 70 объявление это объявления от строительных компаний которые предлагают тебе построить дом по их проекту. Или когда ты хочешь арендовать дом, а тебе предлагают арендовать комнату в доме. Ну а в разделе по продаже мотоциклов можно найти объявление о том что кто-то хочет обменять машину на мотоцикл.
Ну а про поиск телефонов и чехлов для них даже говорить сложно.
У них ДО СИХ ПОР (2019!) нет фильтра по мин/макс цене в веб-интерфейсе. Я уже по-приколу об этом им напоминаю при каждом удобном случае — писал в поддержку, подходил на конференциях к разработчикам, при любом удобном случае напоминал в соцсетях… Всегда "да-да, мы работаем над этим". Уже лет 5 не могут на сайт добавить простейший фильтр, который помогает отфильтровать кучу 10-рублевого шлака при поиске, при том что он есть на мобиле и в веб для таких крутых профессионалов его добавлять 10 минут. Видать, партия не велит сделать пользователям удобно. Вот такие приоритеты. :)
UPD: кому фильтр по цене жесть как нужен — &pmin=
и &pmax=
в url'е нам помогут. :)
Лучше бы открытый API сделали и зарабатывали на платных объявлениях, а не на рекламе.
Мне бы допустим очень хотелось получать информацию о новых интересующих меня объявлениях в телегам.
уникальным добавочным кодом, а у себя в коллцентре редиректить на правильный.
и тогда можно будет анализировать и отрезать телефонный спам, обзвон конкурентами, уголовниками и тд.
Авито можно ругать, но Авто ру это за пределами добра и зла вообще.
Мать продавала машину, с тех пор приходит всякая хрень на почту каждый день в духе "новые объявления Toyota" и никак это не отключить.
Кнопки отписаться не работают, интерфейс дико глючит, удалить аккаунт возможности нет.
Думаю заблочить их на почтаре...
Обе компании приведены в качестве примера на самом деле, продажа и перепродажа данных — дело такое, решается только правильным воспитанием админа. С детства.
Финальное решение — это ведь не advesarial атака на нейросеть, а просто замена номерного знака на объект, который не обладает признаками номерного знака.
Альтернативно можно было на лобовом стекле большими буквами АВИТО писать, тоже Advesarial атака против вырезания номерного знака :)
Как мы боремся с копированием контента, или первая adversarial attack в проде