All streams
Search
Write a publication
Pull to refresh
261
0
xenon @xenon

Пользователь

Send message

Она про количество отзывов пользователей, да.

Вообще веб-интерфейс для af2gis - это сейчас такая "затычка", лишь бы было, чтобы можно было поиграться не устанавливая (потому что в браузере многие перейдут, а ставить пайтон и пакет - уже не все). И с медианой я еще вообще не решился - показывать ли ее или может вообще убрать. Ну такая вот черта проекта, который в разработке, с неопределенным будущим.

Мне приятно, что статью и проект хорошо приняли и я вижу, что это нужное. До публикации я вообще допускал, что никто в принципе читать не будет. Поэтому и в af2gis никаких мыслей про "вдолгую" у меня не было.

Но если дорабатывать его, то да, согласен, подсказки или тултипы или другие названия колонок чтобы было понятнее надо будет сделать.

Вот про медиану интересный пример сейчас в недавних отчетах на af2gis: https://af2gis.ru/report/70000001036200436

у хинкальной связи с 4 другими хинкальными с этим же названием. и медиана 3. То есть, типичный аккаунт, который их хвалит - оставляет отзывы только на эти хинкальные и ни на что другое. Для живых пользователей это не характерно, они, обычно, еще и на что-то другое хоть иногда отзывы оставляют.

Думаю, загрузка - это временно, хабраэффект. 62 задачи сейчас. Через неделю должна быть спокойная, свободная.

Есть у меня фетиш - мне нравится чтобы железо работало, сервер уже 3 года с нулевым load average стоял, а теперь прямо шуршит! Если нагрузка не снизится - перетащу на более мощную машину, у меня их достаточно.

Как-то ответственно, с цифрами, замерить по яндексу - это надо еще 2-3 месяца потратить :-). Но вот интуитивно тыкая, что мы видим в Яндекс.Картах по нашим рок-звездам из 2GIS:

  1. Мебельный Кристалл - 94 отзыва и 5.0 рейтинг

  2. Воронежское Лимпопо - 4.4 (ну... не так ярко как в 2гис)

  3. РСХБ и Совкомбанк - я в статье привел примеры

  4. wax bar - ну вот например: https://yandex.ru/maps/user/5735e32n2t7b47dv0n59gb0at4

В общем, как мне кажется, хрен редьки не сильно слаще.

Пока что для меня 2gis + af2gis дают более надежные результаты, чем яндекс.карты сами по себе.

Но если яндекс попросит адаптировать антифрод для них - продамся с потрохами!

Да, как-то неожиданно я создал для 2gis конкурентное преимущество :-).

Медиана 20, означает, что если мы запишем в список количество отзывов каждого из этих 15 человек и отсортируем, то в серединке будет 20. Как медианная зарплата (отличается от средней), но не зарплату замеряем а количество отзывов. (ну и 20 выглядит как очень правдоподобное реалистичное число. Никак не странное, может даже выше среднего)

Это исторически пошло от того что в первых накрутках которые я смотрел было явно видно, что у всех пользователей в накрутке - малое количество отзывов. Низкое медианное значение - дополнительный критерии, чтобы начать подозревать. Это не слишком надежный критерий сам по себе, иногда бывают и живые пользователи и связи с низкой медианой (например, студенты - они лайкают универ и все общаги и студ. столовую и магазин хотдогов рядом, а другой истории у них нет) и мне встречались раскачанные матерые ботофермы где медиана очень высокая (то есть, этот бот лайкнул не три киоска с шаурмой, а 100+ объектов). Но раз уж показывается - пусть показывается, иногда может и пригодиться.

Про lmdb - у вас windows? На Linux вся моя lmdb база - это 5.1 гигов (там все, что я собрал и все что с хабра сейчас запрашивали и в 5G влезло). Просто на винде, наверное, mmap и sparse files не так работают. Размер должен быть такой, чтобы точно хватило, но такой дикий запас на линуксе не мешает, а на винде вот мешает. Измените в src/antifraud2gis/const.py строчку

LMDB_MAP_SIZE = 1 << 36

на что-нибудь поскромнее. Думаю, что на поиграться и "для дома, для семьи" даже 1 гига будет более чем достаточно.

Так мне кажется, опыт поисковиков - очень неплохой. Первые страницы SERP вполне себе релевантны. А оптимизиторы (смотря кого мы этим словом называем) могут делать хорошее дело. Тупая схема "мыло продаем дешево" красным цветом в H1 повторить 200 раз на странице - давно не работает. Гугл выше ранжирует качественные сайты поэтому есть смысл делать сайт качественным, а не "на тильде", соблюдать всякие Web Vitals (если сайт технически низкокачественный и дешевый - скорее всего и контент на тем не очень). Сайт Леруа будет выше сайта Хозмага на ул Тургенева.

Ну и если есть возможность поднять сайт, то: 1) Не каждый сайт. Совсем плохой не поднимешь. 2) Это стоит немного другие деньги (если запрос популярный), далеко не те, которые могут себе позволить каждый ларек с шаурмой.

Это как с ауди, тойотой и BMW. У них большие бюджеты на рекламу, хорошие режиссеры и маркетологи, и может быть даже успешный рекламный ролик позволит компании с 3го места стать 1ой, но только потому, что у них всех трех - хорошие машины.

Про маркетплейсы у меня есть другая, более мягкая теория. Есть конкретный товар (электронное устройство такой-то модели, например). Оно может быть хорошим или не очень, но есть 1000 продавцов, которые его продают. Пусть даже 10% устройств сгорают в первый же день, все равно у кого-то из этих 1000 будет наиболее успешная история. (так уж совпало, обычная неравномерность, что именно их 100 продаж привели к 10 позитивным отзывам, а у другой компании - к 1 позитивному и 20 негативным. Вторую компанию мы больше не увидим, у нее никто не покупают, а видим - компанию исключение, которой немного повезло).

Но с заинтересованностью площадок - согласен.

Нет, вроде все ок (но я за пивом уходил, может не застали).

Но я вижу, что сервак молотит без перерыва почти!

а на что ориентироваться?

и можно хоть все филиалы отлайкать и за каждый 500 баллов будет?

Вы говорите про какие-то особые заведения. Я в целом согласен. Один из минусов af2gis - это "одна гребенка". Для разных типов заведений можно использовать разные критерии. (Яркий пример - туристические места, они вместе со своими соседями по мнению антифрода "аномально хорошие", потому что они в самом деле аномально хорошие).

Ну и второй аспект - должны быть какие-то явные правила. Можно ли просить людей поставить оценку? Можно ли чтобы в организации сотрудник сам ставил клиенту на телефон 2gis и от его имени ставил оценку? Чтобы если да - то это засчитываем и пусть все так делают, а если нет - то нет. В этом тоже нет проблем, какой-нибудь пансионат для престарелых не конкурирует с молодежным пивным баром.

антифрод иногда такое отловит если это боты и они похожи (например, недавно хвалили или ругали другую фирму). И отловит, если это новичковые аккаунты (недавно зареганы). Аномально, если в пекарню идут только новые клиенты 2гис, а старые - нет.

Ну и сама пекарня может использовать средства 2гис - попросить подтверждение отзыва. В самом ли деле они приходили и покупали ли хлеб. (но это механизм такой, что им можно убрать и реальный негативный отзыв)

Как-то даже и не ответишь одним термином, типа там senior-программист или CSO - любой ответ будет по своему ошибочный.

Формально - ИП, до недавнего времени свое ООО еще было, но редко им пользовался (только от крупных российских компаний принимать платежи, они ИП и ГПХ не любят). Под проекты иногда нанимал людей.

По навыкам - генералист (то есть, человек, который умеет все, и все делает плохо). "стрелять, варить халву, подковать жеребца, подделать документы, принять роды". Но с упором в юникса, сети-протоколы и безопасность. С виндой - на уровне "в танчики играть умею" но когда-то в прошлом через Soft-Ice защиты с виндовских программ снимал. Ну и вообще в IT безопасности я немного с другой стороны все вижу, "в артиллерии свои взгляды на архитектуру".

Ну и несколько проектов (включая то, над чем сейчас работаю) были очень похожи на эту статью (только здесь все публично и только на основании внешних данных). То есть, надо прийти в компанию, посмотреть все и рассказать им самим, как у них все плохо. Можно назвать это аудитом безопасности, близко, но не совсем так. Очень часто руководство где-то там страшно далеко от реально технических дел. Подчиненные программисты-админы, конечно, многое видят-знают - но не вся информация наверх доходит. А многое - не видят (или не особо хотят видеть, тупо не имеют времени чтобы разобраться и увидеть "может быть проблему, а может нет").

Примеры, что находилось: в одной фин.компании после начала работы (еще когда снаружи) принес им распечатки их документов. Не особо секретных, но внутренних, с сетевого принтера. Потому что во внутренней сети он никак не защищен, а войти в нее можно было через VPN. И это не я такой маг и кудесник, а у них пароль на VPN вроде test/test работал. Просто им не хотелось про это думать и проверять, у них дела были, а мне захотелось, я проверил.

В другой оказалось, что пароли пользователей хранятся хешами без соли (я уж не говорю про старые алгоритмы). Ну норм же, все же работает? Никого это не беспокоило, всех устраивало, каждый свои тикеты из jira делал, которые им мудрое, стратегически мыслящее, но слепое руководство давало.

То что сейчас - успешная небольшая компания, в своей узкой сфере. Все технически делалось "ну как получится", на соплях, но бизнес идет хорошо (вовремя попали в нужную нишу и в целом для пользователя продукт неплох). Все делали фрилансеры, так что понятно в каком состоянии. А еще у владельца была мысль продать бизнес более крупной компании, и надо чтобы все было хорошо и красиво - тогда гораздо дороже можно сторговаться, любые затраты окупаются. А там все настолько плохо, что от них даже индусы сбежали. Ну и среди прочего, помимо просто древних технологий (древний debian за гранью EOL, некоторые приложения на php5, итд), но самое интересное - они даже не знали, сколько у них пользователей! (Как можно продать компанию, которая даже сама не знает, сколько у нее клиентов? Бухгалтера свои поступления как-то видят, но с техническими данными это не увязано). То есть, программисты конечно по запросу могли сделать SELECT COUNT(1) FROM users вот только дальше этого они не заходили. А там оказывалось, что у многих юзеров пароли в одном формате, а у многих - в другом. То есть, "абонент не абонент", он не может залогиниться в принципе. Считать ли его юзером? Он - кривая запись в табличке (непонятно как появившаяся, современников этого уже нет), но не юзер. Еще у кучи юзеров был одинаковый хеш пароля (с солью). То есть, это явно не настоящие юзерские аккаунты тоже. У кого-то другие значения записей были странные. В общем, руководители сами не знали, чем они управляют, управляли какой-то иллюзорной IT-компанией, которая сильно отличалась от реальной.

Плывет корабль, капитаны в красивых кителях обсуждают стратегические решения, куда им выгоднее плыть чтобы больше заработать, а там в двигателе уже половина подшипников развалилась, чинить их нечем, рация не работает, а в трюме маленькая течь, которая скоро станет большой. И какой смысл при таком раскладе в стратегических планах? У каждого мертвого мамонта были когда-то стратегические планы, но погубили его не они.

Нужно продвигаться в этой борьбе щита и меча. Если компания прямо сильно разозлила - все таки прийти к ним и получить чек (сделать минимальную покупку, чисто чтобы написать разгромный отзыв).

А на следующем этапе компании прочухают такой подвох и не будут обслуживать подозрительных лиц. Будет как в том ролике, где тетка из Почты России с метлой гналась за посетителем по улице.

Скоро на всех улицах страны! :-)

Этого тоже не исключал. Но все-таки, IT - немного другая сфера с другими традициями. Да и "Барбара Стрейзанд". Сейчас еще в суд подавать - это вообще закопать свою репутацию. Я все таки сторонник того, что на мир надо смотреть оптимистично. Не все хорошие фантазии сбываются, мир не такой розовенький, но и не такой ужасный, как наши кошмары.

Есть магия таких заведений, мне они очень нравятся. Ощущение, что ты нашел какое-то сокровище, выиграл в лотерею. Не просто "потратил тысячу - хорошо поел на тысячу", а именно выиграл.

Одно из таких заведений - Городок на троллейке. Это не ресторан, ближе к той кафешке, что вы описали. Скорее ты заходишь в кафе, цены как в кафе, но обслуживание, вкус, атмосфера - почти как в ресторане.

Забавно, что я городок использовал для отладки как эталон настоящего хорошего заведения, но у меня не шло. А потом заметил, что они в 2023 году сами накручивали себе отзывы! Сейчас это выглядит странно - мой личный опыт показывает, что заведение отличное. Пятерки у него сейчас заслуженные и похожи на честные. Доля фейковых отзывов (тех вот) - очень маленькая. Но - они были.

Не знаю, как это понимать. Может заведение изменилось сильно. Может тогда рейтинг уронили и как-то выправляли. А может быть: 2гис ведь создает правила игры и фактически дозволяет накрутку. Что если хорошее кафе в самом деле должно иметь рейтинг, скажем 4.2. Но как ему выживать, если вокруг него плохонькие заведения, которые имеют честный рейтинг в 3 балла, но накрутками дотягивают до 4.8+?

Получается система с положительной обратной связью - если мы допускаем накрутки в принципе (ну накрутило одно заведение, фиг с ним, другое накрутило - да пофиг), то третье заведение, которое никогда бы не стало накручивать - тоже будет, потому что мы его вынудим к этому.

Кстати, кейс с Городоком - это еще одна причина, почему антифрод надо принимать к сведению, но не руководствоваться им.

защитит от накрученных положительных отзывов

А защитит ли? Или просто заставить накручивать чуть другим (но тоже простым и дешевым отзывом). Вот, допустим сеть салонов красоты (как из примера в статье) и есть подозрение, что каждая их сотрудница, и каждая ее подруга и родственница все ставят 5ки всем этим заведениям по городу. Естественно, руководство не против. Неужели им сложно будет для этого еще и небольшую транзакцию сделать, ватный диск купить или салфеточку?

Ну это все равно усложняет (уже хорошо), но совсем не препятствие, потому что дешево и деньги из одного своего кармана в другой переходят. (Накрученные отзывы, даже не доверенные - они и сейчас за деньги покупаются, не бесплатно).

Самый эффективный способ - затребовать чек не сразу, а через пару месяцев хотя бы. Тогда в отзывах будут минусики только за последние 2 месяца (а плюсики - от сотворения мира). Человек выплеснул негатив в отзыв, все хорошо, забыл про это, а ему потом хоба-на, вы 14 ноября пирожок кушали? А документик где!?

В таких сложных вещах надо смотреть не на ответы, а на тонкости вопроса, на контекст. Или, на косвенные признаки. Например, легитимность косвенно измеряется в затратах на разные силовые ведомства. Если в Гаити все горячо поддерживают местного царя, но при этом на каждого жителя - три-четыре тонтон-макута, то может быть сам-то царь в этой поддержке не слишком уверен и что-то знает.

Ну и опросы в политике и в маркетинге разные. В маркетинге опрашивающий очень желает получить нужную ему информацию. Известный феномен, что опрашивают аудиторию "вам нравится этот продукт? вы бы его купили?" И получают офигенные результаты. Выпускают продукт, его никто не покупает. Оказывается, чтобы получить истинный ответ, опрашивать надо было гораздо тоньше, сложнее. И очень легко получить искаженный результат если ты не боишься его и даже немножечко желаешь.

Обман (неявный) в выборах или в социологии начинается уже с того, что создают впечатление, что все просто и измеряется простой скалярной величиной.

Information

Rating
4,892-nd
Location
Россия
Date of birth
Registered
Activity