Город засыпает, просыпаются хабровчане

    Если количество комментариев под статьёй стремительным домкратом приближается к 1000, будьте уверены — независимо от заявленной автором темы внутри бушует срач: очаги возгорания политоты, окружённые диванными экспертами по всем вопросам, психиатрические диагнозы на расстоянии по аватарке и никнейму, переходы на личности, саркастические выпады, едкость которых превышает таковую у крови ксеноморфов, и, конечно же, обязательное в таких случаях блюдо — взаимные обвинения в том, что ваш визави с вами дискутирует исключительно за вознаграждение и\или по долгу службы. Которая, видимо, и опасна и трудна, и на первый взгляд как будто не видна, а тридцать серебренников на дороге не валяются.

    Самое забавное в такой ситуации это то,что люди, глубоко поражённые синдромом в-интернете-кто-то-неправ, зачастую тратят чёртову прорву времени и нервов чтобы совершенно бесплатно доказать другому такому же поражённому, что уж он-то ровно это же самое делает за деньги или по приказу. Вы ищите тут логику? Её нет. Это интернет, детка.

    Возьмём один из относительно свежих срачей о предполагаемой территориальной дискриминации на Гитлабе. С момента публикации статьи прошло 4 дня и, разумеется, обсуждение давным давно съехало от изначально заявленной темы за тридевять земель. Звучат такие фразы:
    Реальный человек не сможет ничего противопоставить профессиональному комментатору на подписке…

    Пользователь (такой-то) тратит просто нереальное количество времени на комментарии…
    При этом его активность не имеет паттернов которые обычно присущи обычному пользователю

    p.s. но это навело меня на мысль написать парсер-анализатор таких комментаторов ) С показанием активности по часам, количеством времени в день, в неделю и т.п… Хорошая тема для статье)
    Так, стоп. А какие такие паттерны «обычно присущи обычному пользователю»? Автора этой фразы в той теме, к сожалению, уже транклюкировали, так что придётся идти наугад.

    Вопрос, который я хочу поставить пред ваши ясны очи, следующий — возможно ли вообще методами статистики хоть сколь-нибудь надёжно выделить эти самые паттерны так, чтобы создать формальный классификатор, отличающий комментаторов казуальных от профессиональных? Представьте себе — «по данным хабра-ботометра вы с вероятностью 76% являетесь кремлеботом». Это будет намного круче кармических рейдов друг на друга.
    К сожалению, моих компетенций не хватит на то, чтобы даже предположить, в какую сторону копать для решения такой задачи. Тем не менее, за вчерашний вечер я сколхозил «на коленке» небольшой примитивный парсер, который (благо страницы с комментариями открыты даже для неавторизованных посетителей) пока что делает две вещи — а) собирает у заданного юзернейма статистику всех его комментариев (пока что просто time-stamp) и складывает в базу MySQL; б) рисует временную диаграмму, отмечая на ней взятые из этой базы события отправки комментария. Даже без какого-то мудрёного анализа получилось довольно забавно. Вот так выглядит диаграмма моих комментариев. Пояснения — под ней. Лучше всего её рассматривать в отдельном окне на масштабе в 100% и больше.

    image

    По горизонтальной оси — время, каждый пиксель равен одной минуте, цена серых делений равна одному часу, вся горизонтальная линия равна одним суткам. Сутки идут снизу вверх вдоль вертикальной оси, цена деления на ней — 365 суток.

    Ничего особенно интересного в моей диаграмме нет. Видно, что я люблю поспать по 7-8 часов, часто ложусь за полночь, и иногда устраиваю многочасовые марафоны комментирования, и что активность за последний год превышает или примерно равна таковой за предыдущие пять лет.
    Или вот товарищ gecube три с половиной года хранил обет молчания, а потом как прорвало…

    image

    Диаграмма активности типичного хабракомментатора выглядит приблизительно таким образом (это QtRoS)

    image

    Отчётливая «сонная лощина» слева где-то в европейской ночи и неспешное комментирование во время светового дня, возможно с перерывами на пол-года.

    Но не все диаграммы такие скучные! Как вам, например, такое:

    image

    За два с небольшим года наш коллега, видимо, переучил свои биоритмы спать с европейской ночи куда-то под Срединно-Атлантический хребет, причём равномерно и постепенно, а потом ещё два года потратил, чтобы вернуться к берегам Португалии. Пешком шёл? Вплавь? Я не могу придумать правдоподобных объяснений… Первые три часа бодрствования комменты летят как из пулемёта, а под конец дня уже так, раз в часик заглянул, что там делается да и всё.

    Это был, кстати, 0xd34df00d.

    А вот ещё загадка:

    image

    Четыре с половиной года коллега продержался без единого комментария — видать тренировался где-то в тайных монастырях, как не спать потом сутками, судя по тому, сколько комментов отправлено в «сонной лощине».

    Но вот самое тут интересное — это аномалия в 16-м часу, которая длится более трёх лет и в последний год постепенно затухает. Перекур? Выгуливание собаки? Пробежка? Что ещё может оторвать хабровчанина от ленты комментариев в разгар рабочего дня с такой ежедневной предопределённостью? Я раздолбай и лентяй, не могу себе представить подобной самодисциплины, которую может себе позволить уважаемый khim.

    Наконец, последняя диаграмма для подумать:

    image

    На ней вообще нет чётко выраженной «сонной лощины». Только еле-еле угадывается видимое превышение количества комментов, отправленных после полудня над отправленными до.

    Со всей комсомольской строгостью призываю уважаемого MTyrz разоружиться перед партией и честно признаться, сколько бабушек, дедушек, внучек, жучек и мышек рулят вашим аккаунтом и строчат комменты.

    И под занавес коварный вопрос — может ли кому-то это всё быть интересно настолько, что захочется развить код парсера и\или получить дамп базы или доступ ней и так далее? Мои собственные познания в дата-майнинге и в методах визуализации данных едва ли превышают общую эрудицию. Что-то более умное и интересное, чем эти простенькие диаграммки я вряд-ли придумаю. Если кто-то заинтересовался, пишите мне в телеграм (ник в профиле).

    Спасибо за внимание!

    UPD. Выложил исходники на GitHub.
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 162

      +16

      Фигасе. Я уже стал настолько известным, что меня в тестовые выборки включают… Забавно....


      Или вот товарищ gecube три с половиной года хранил обет молчания, а потом как прорвало

      Ответ очень простой — мне стало О ЧЕМ ПИСАТЬ.

        +10
        Тестовая выборка составлялась по принципу «первый попавшийся» или «хорошо примелькавшийся в срачах» :)
          +33

          Есть бешеная идея. Не только рисовать картинку, но и красить каждую точку зелёным или красным цветом в зависимости от оценки данного коммента. Можно тогда поймать волны, когда конкретный персонаж бывает особо токсичным )))

            +6
            Можно реализовать и перевыложить разноцветные графики в статье?
              0

              Извините, не понял Вашего вопроса.


              1. Если хотите сами это сделать — welcome. Код ниже.
              2. Если попросить автора статьи — я тоже присоединяюсь.
              3. Я в принципе готов это и сам сделать, но точно не в ближайшие полдня.
                +1
                Я просил бы автора статьи. Выкладывать картинки в комментах — ну они крупноватые. Поэтому лучше перевыложить в статье и улучшить ее
                +1
                Реализовать можно (уже).
                Перевыложить, наверное, не стоит. Слишком маленькая разница для того времени и усилий, что потребуются.
                Вот ваш разноцветный
                https://habrastorage.org/webt/f3/p4/uk/f3p4ukqonohzohfzuj1qbow_opq.png
                  0
                  Спасибо, забавно как после 2016 года у меня резко уменьшилось количество «белых» комментариев.
                0
                Можно. Но никаких волн там нет, т.к. токсичность явно не совпадает с суточным периодом.
                Вот ваши:
                https://habrastorage.org/webt/_n/nt/w4/_nntw4rjeqiwwoplglgyvuon2-u.png
                  0

                  Токсичность лучше отслеживать в масштабе месяца, а не суток.

                    +1
                    Токсичность зависит, в основном, не от исследуемого клиента и тем более времени суток/года, а от мастерства наброса какого-нить «невидимого героя».
                    Если я, например, при поддержке нескольких друзей создам тему «остроконечники рулят», то токсичными окажутся все случайно зашедшие в мою тему «тупоконечники».
                +2

                Ткни меня?) Интересно ужасно.

            +14

            Прикольные графики. По ним действительно ритмы отслеживать можно: примерно 3.5 года назад я переехал из Британии в США, довольно быстро режим дня у меня сполз ещё вперёд с подъемом в 10-11 утра, полтора года назад я его начал сдвигать обратно и год назад в итоге сдвинул на 3 часа.

              +1
              Странно это. У меня джетлаг от переезда в США прошёл за полторы недели, и то — в первый раз. Все последующие за пару дней справлялся.
                +10

                А у меня не джетлаг, у меня просто в моих естественных сутках больше 24 часов, поэтому без дисциплины они вперёд съезжают, пока не утыкаются в какой-нибудь фактор типа окон на южную сторону, в которые солнце заглядывает в 10 утра.

                  +2
                  Вот так вот — шифруйся не шифруйся, комменты тебя сдадут :)
                    +3
                    Анонимность это самоуспокоение. На самом деле, большинство комментаторов с количество комментов более 1000, деаномизируются за 10-30 минут просто в лоб по показаным интересам, стилю письма, никам (или элементов ника), проскочившим личным фразам.

                    Лет через 5-10 можно будет вообще составлять карту всего общения пользователя, просто на основе анализа текстов с разных источников.
                      0

                      Остается написать сервис, которому на входе подаешь свой авторский текст, а он его обфусцирует по какому-то заранее определенному алгоритму. В результате — смысл остается, а все остальное меняется настолько, что тебя распознать как общего автора невозможно.


                      Кстати, офигенная идея для стартапа. Чтобы продать его новостным агенствам.

                        +3
                        Такие сервисы уже имеются. По крайней мере в зарубежном сегменте (Paraphrasing Tool как простой пример).
                        Плюс, такие сервисы как Grammary так же достаточно сильно убирают индивидуальность из текста во время редактирования.

                        Но опять же — если вы действительно хотите оставаться анонимным, то для начала нужно генерировать случайные ники, без вкладывания части себя в имя. Нужно использовать разные ники для разные сервисов, случайные email (т.к. базы утекают), менять ники время от времени, а не использовать один и тот же ник в течении 20 лет.

                        В современном мире (пока маятник не качнется в другую сторону) будет не лишним держать отдельный ник для профессиональных бесед(на что можно сослаться и в реальном мире) и отдельный — для разной политики (просто высказаться). Т.к. люди не понимают, как сами себя ставят под удар.
                          +1

                          С последним абзацем полностью согласен. К сожалению, интернет уже давно перестал быть территорией свободы. И теперь реально "любое ваше слово может быть использовано против вас"

                    +1
                    в моих естественных сутках больше 24 часов

                    alien detected!
                      +3
                      Вам смешно, а нам это реально представляет некоторое неудобство — предоставленный самому себе, мой график сна ползет на 20-30 минут в будущее каждый день, и даже окна с южной стороны ему ни разу не помеха. Итого примерно за два месяца я сплю на восемь часов меньше, чем нормальные люди. Продуктивно использовать это никак нельзя, потому что сдвиг слишком маленький, в ритмы сна он не попадает (и поэтому спать 7.5 часов я не могу, я тупо не высыпаюсь на длинных дистанциях), ну и окружающий мир живёт совсем даже не по такому времени.
                +12
                На ней вообще нет чётко выраженной «сонной лощины».

                Пора практику открывать — "диагностирую бессонницу по срачам" :)


                А если серьёзно — код выложите на гитхаб, пожалуйста — мне тоже поиграться захотелось.

                  +12

                  Лучше — на гитлаб. Или уже нет???? )))))))

                    +1
                    ты-то как раз бессонницей не страдаешь :)
                    Заголовок спойлера
                    image

                    А если серьёзно — код выложите на гитхаб
                    ок, чуть позже
                      –13
                      ты-то как раз бессонницей не страдаешь :)

                      Ну что, теперь Вы верите, что ya amerikanskiy grazhdanin? :)


                      Кстати, не припомню, когда мы с Вами на брудершафт пили.

                        +12
                        Ну что, теперь Вы верите, что ya amerikanskiy grazhdanin? :)
                        А я где-то сомневался?
                        Кстати, не припомню, когда мы с Вами на брудершафт пили.
                        Ох, ну простите великодушно.
                          +1

                          Добавил в список "за что сливают карму" пункты:


                          • Вежливое указание незнакомому человеку из интернетов, на тот факт, что он тебе "тыкает";
                          • Тот факт, что ты имел (не)счастье вовремя завести трактор.
                            0
                            Если это такой тонкий наброс в мою сторону, то не будьте таким мнительным, это вредно для нервов.
                            а) я вам карму не сливал, могу скриншот приложить, если нужно;
                            б) ваша позиция по этому вопросу не является общепринятой, во многих около-IT-шных сообществах, особенно возникших на заре интернетизации, наоборот, обращение на «вы» считается чуть ли не оскорблением; кроме того, я могу нечаянно оказаться старше вас;
                            в) мне ваш трактор индифферентен, я сам два года в США работал, потом вернулся, и могу снова туда уехать, если очень надо будет — не считаю это поводом хвастаться;
                              +1
                              Если это такой тонкий наброс в мою сторону, то не будьте таким мнительным, это вредно для нервов. а) я вам карму не сливал, могу скриншот приложить, если нужно;

                              Лично к Вам претензий нет: во-первых, если бы Вы хотели слить мне карму, Вы бы её уже слили за наш разговор про MH17; во-вторых, я глубоко сомневаюсь, что один Вы могли слить её на 10 единиц, ;) Это были размышления вслух: как бы я на него не пялился, в моём заминусованном комментарии я вижу всего два утверждения:


                              1) Как я неоднократно заявлял, я являюсь гражданином США (в чём Вы, равно как и все желающие — благодаря Вашим графикам — могут убедиться: моя ночь совпадает с американской и не совпадает с ночью российского бот-центра — забыл, как он там называется).
                              2) К людям, с которыми Вы (условно говоря) не пьёте раз в неделю пиво, следует обращаться на "Вы".


                              И внезапно один из (или оба) посылов вызвал такое отторжение читателей, что не поленились слить карму, что вдвойне странно — про брудершафт я ранее делал замечания и другим участникам, но такой реакции они не вызывали.


                              б) ваша позиция по этому вопросу не является общепринятой, во многих около-IT-шных сообществах, особенно возникших на заре интернетизации, наоборот, обращение на «вы» считается чуть ли не оскорблением;

                              FIDO, знаю, сам там был, и наблюдал за столкновением этой парадигмы с интернетовской. Интернетовская (дефолт — "Вы", Вы ведь помните, что и в СССР/России интернет начинался с университетов и прочих академических кругов) таки победила.


                              кроме того, я могу нечаянно оказаться старше вас;

                              Но точно Вы этого не знаете, поэтому — пока не узнали — безопаснее всё же применять безопасный дефолт "Вы".


                              (Кстати, возраст Вы можете примерно определить по косвенным признакам — например, что я рассуждаю о БК-0010 со знанием дела, что даёт Вам нижнюю границу. И смайлики у меня каноничные, текстовые ;)

                      +5
                      А если серьёзно — код выложите на гитхаб
                      Выложил. Это был мой первый опыт с гитхабом, так что я не уверен что всё правильно сделал, но вот

                      https://github.com/UrsusArctos/lahwa
                        0
                        Интересно, кто первым и как быстро сделает web страничку со статистикой а аналитикой?
                          +3
                          Да, прям захотелось страничку, чтоб отслеживать по ней свой биоритмы и степень синдрома неправости в интернетах ^_^
                            +20
                            Не так, чтобы со статистикой и аналитикой, но я закодал веб версию. Получаются вот такие графики, с красно/заленой раскраской по рейтингу коммента:
                            картиночка
                            image
                              +2
                              Кайф, Хабр-торт. Спасибо!
                                +1
                                У вас чёт с 17-м годом случилось на графиках почему-то.

                                И на некоторых (на моём, как пример) точки есть снизу шкалы.
                                  0
                                  С 2017 годом всё ок, обратите внимание на полную дату — он находится между 01.01.2018 и 31.12.2016.
                                    0

                                    Не то, чтобы ок: есть 1 января 2015, 2016, 2018 и 2019. А 2017 представлен в виде 31 декабря 2016.

                                      +2
                                      Предположу что это из-за високосного года.
                                        0
                                        Да, так и есть, я просто +365.25 дней добавляю к году, чтобы получить следующий. Вообще, формально, результат получается правильный, согласен, что немного некрасиво.
                                    0
                                    Да, спасибо, точки надо бы срезать.
                                    0

                                    Время в какой таймзноне? MSK? GMT?

                            +2
                            Но вот самое тут интересное — это аномалия в 16-м часу, которая длится более трёх лет и в последний год постепенно затухает. Перекур? Выгуливание собаки? Пробежка? Что ещё может оторвать хабровчанина от ленты комментариев в разгар рабочего дня с такой ежедневной предопределённостью?

                            Любимая женщина?

                              +9

                              По расписанию?

                                0

                                ну, если дети — почему нет? Надо же поддерживать здоровье на уровне.

                                  0

                                  Тег "юмор на хабре" же ж.

                                  +4

                                  Я бы на обед скорее ставил. Его в расписание проще жёстко воткнуть

                                    +1
                                    Любимый начальник и планерка. Или дорога до дома.
                                    +3
                                    Но вот самое тут интересное — это аномалия в 16-м часу, которая длится более трёх лет и в последний год постепенно затухает. Перекур? Выгуливание собаки? Пробежка? Что ещё может оторвать хабровчанина от ленты комментариев в разгар рабочего дня с такой ежедневной предопределённостью?


                                    Возможно scrum standup, который проводится из москвы по утреннему времени с NYc. Все же если я не ошибаюсь, khim один из достаточно топовых инженеров одной очень большой конторы из Mountain View.
                                      0
                                      Это давало бы отклонения по выходным дням, а аномалия — прям совсем аномалия, никаких выходных на ней не видно.
                                      +2
                                      Предположу, что чем меньше карма у пользователя, то тем скучнее и малоинформативнее диаграмма его комментариев. :)
                                      Можно, и наверное, проследить как уход в минус кармы отражается на хаброактивности.
                                        0
                                        Есть такой эффект:)
                                          +4
                                          Таки да, не все могут себе позволить роскошь комментировать болезненные темы
                                          +3
                                          Вот я еще транклюкированному (Кстати, а кто-нибудь понимает, за что? Вроде бы он на людей не бросался, а только за политику в дискуссии здесь обычно НЛО все же не прилетает) автору идеи думал подбросить свою кандидатуру для анализа, но скромность не дала. У нас, рептилоидов, полушария спят по очереди примерно так выглядят порванные, как грелка Тузиком, циркадные ритмы.

                                          Автору спасибо! Вот так посмотришь на себя со стороны: а казалось бы, все не настолько ужасно…
                                            0
                                            А почему порванные, если не секрет? (Заранее извиняюсь, если это тема не для публичного обсуждения.)
                                              0
                                              Нет, вовсе не секрет.
                                              Склонность к «совиности» у меня с детства, а потом на нее наложилось двадцать полевых сезонов на северах, с белыми ночами и совершенно ненормированной длиной рабочего… днем это уже не назвать, скорее отрезка. Уже давно никуда не езжу, но все попытки соблюсти режим пока кончаются срывами — хотя я не то, чтобы особо стараюсь.
                                              Привык уже.
                                                +1
                                                Как себя чувствуешь? Правда ли говорят, что если не спать в одно и то же время — то умрёшь и мама заругает?
                                                  0
                                                  Пока не умер.
                                                  Мама тоже не ругается. В общем, скорее врут.

                                                  Но правда, если удается выйти в режим жаворонка, ложиться в девять, вставать в районе пяти — работоспособность вырастает очень заметно. Только удержаться в этом режиме я не могу, неделя-другая, и срыв.
                                            +4

                                            Так, ну все люди из статьи отписались, отпишусь и я :) И сделаю это, конечно же, в типичные для себя рамки.
                                            В целом, статистика верная, добавить к ней нечего, разве что немного пугает то, насколько периодично твое проведение.

                                              +5
                                              Не все. Ещё ждём khim — у него ж самая интрига как раз.
                                                0
                                                Будет потешно, если он придёт и скажет, что-то в духе «фиг знает, ничё особого не делаю в это время, всегда по разному получается».
                                                  0
                                                  Любопытных случаев немало.
                                                  habr.galqiwi.ru/files/15d9ec707ea42032d1e020e7eead5a75.png — тоже нет сонной лощины
                                                  habr.galqiwi.ru/files/14ac7318916920d7b3694416a40e98a4.png — комменты строго в рабочее время
                                                  habr.galqiwi.ru/files/11680a210fba711fe15d1b4c7bed30f8.png — нарушение режима сна длиной в два года, потом восстановление
                                                    0
                                                      0
                                                      Нарушение сна на два года: вероятно появление маленького ребенка. К этому возрасту он перестает просыпаться ночью, и жизнь возвращается в нормальное русло.
                                                        0
                                                        Я не то, чтобы был совсем уверен, всякое бывает: но когда просыпаешься из-за маленького ребенка, обычно все-таки не Хабр идешь комментировать…
                                                          +2

                                                          У меня возле детской кровати стоит ноут. Ребёнку иногда нужно, чтобы просто кто-то рядом сидел — вот и комменчу иногда.


                                                          Но вообще график ещё сдвигается, когда ребёнок начинает ходить в сад.

                                                  +3
                                                  Принимаете заказы на анализ профиля? :)
                                                    +4

                                                    "определение характера по картинке профиля"
                                                    "лечение психологических расстройств по картинке профиля"
                                                    И многое другое.


                                                    А ещё обязательно надо назвать полученный артефакт, картинку активности одним умным словом. Например, активограмма. А потом ещё придумать единицу измерения заполненности — активограм )

                                                      0
                                                      Ничего необычного, увы
                                                      image

                                                      А может и не увы, а к счастью )
                                                        0
                                                        Да у меня комментарии раз в час только, можт было бы и поинтереснее.
                                                        Хорошо видно, что поздно спать ложусь. У меня ещё и UTC+5.
                                                      +13
                                                      Можно еще сделать карту активности как на github. Можно еще использовать какую-нибудь примитивную форму для вычисления сколько времени было затрачено на написание всех этих комментариев. + выводить как-нибудь стимулирующий комментарии вроде
                                                      В прошлом году вы потратили на комментарии 400 часов. За это время Шекспир написал Ромео и Джульетту, а Элон Маск заработал $273'972'400.

                                                      Сделать думаю лучше в виде расширения для Chrome, т.к. думаю хабру не понравится парсинг сторонними ресурсами )

                                                      И распространять под девизом борьбы с комментоголизмом. Можно еще ачивки присваивать — комментоголик 1 уровня, комментоголик в завязки. Господа из статьи могут вступить в клуб анонимных (хе-хе) комментоголиков.
                                                        +7
                                                        habrahabr как на счёт запилить подобный прикол для профиля? Вроде не выглядит особо сложным.
                                                        +1
                                                        Вопрос, который я хочу поставить пред ваши ясны очи, следующий — возможно ли вообще методами статистики хоть сколь-нибудь надёжно выделить эти самые паттерны так, чтобы создать формальный классификатор, отличающий комментаторов казуальных от профессиональных?

                                                        Предложу такой алгоритм.
                                                        1. Вы верно заметили:
                                                        Если количество комментариев под статьёй стремительным домкратом приближается к 1000

                                                        Отсюда первый шаг. Отсеять тех пользователей, которые умудряются прийти к какому нибудь общему мнению, за ограниченное число пар вопрос-ответ в одной публикации. Начиная с того варианта вывода: «что с этим собеседником невозможно договориться». Допустим за три пары. То есть если человек не участвует в перепалках, состоящих из более чем в трех парах вопрос-ответ, то вероятность того, что он относится к казуальной группе максимально низка. Соответственно пользователи, чьи комменты в публикациях, где они не являются авторами, представлены в количестве меньше-равно, чем 3, исключаются из гипотезы, что они относятся к казуальной группе.
                                                        Получим три кластера:
                                                        I. Те, кто не давал никогда больше трех комментариев в одной публикации.
                                                        II. Те, кто могут давать >< трех комментариев.
                                                        III. Те, кто выкладывают > трех комментариев всегда.
                                                        Второй шаг.
                                                        Время реплика-отклик. Такую статистику собрать можно в среднем для Хабра, с соответствующими показателями распределения этой случайной величины. Проанализировать эту статистику для II-ой и III-ей группы пользователей. Допустим, на согласованность коэффициента вариации пользователя с общей статистикой.
                                                        Предполагаю, что можно будет довести коэффициент надежности до 99%. Величина надежности, то есть порог отнесения, при получении данного коэффициента для конкретного пользователя, будут определяться только критериями установленными операторами ресурса из условия — когда преодолевается порог и наносится вред ресурсу.
                                                        Третий шаг.
                                                        Смотреть плотность минусовок.
                                                        Ключевые слова.
                                                          +7
                                                          Как отличить срач от конструктивной технической дискуссии? Хабр же, как ни странно, иногда бывает тот еще торт
                                                            +1
                                                            Термина
                                                            конструктивной технической дискуссии

                                                            в статье не было.
                                                              0

                                                              Это не значит, что таких не бывает на хабре

                                                                0
                                                                Предполагаю, что если у меня будет технология, которая различает срач от конструктивной технической дискуссии, то через полгода я буду попивать благородные напитки в уютном автономном бунгало на берегу теплого моря. И до Хабра, мне уже не будет никакого дела :)
                                                                Но пока, увы, пойду заводить машину в мороз
                                                                  0
                                                                  Ну последнее легко исправить — прикрутите удаленный запуск
                                                                    0
                                                                    Да это легче всего решить
                                                            0
                                                            Думаю что уже или в ближайшее время технологии ИИ смогут спокойно в статистические кластеры, так что нужны будут другие решения. Может быть помогут специальные цифровые подписи, которые не раскрывают анонимность, но при этом удостоверяют принадлежность автора комментария к какой-либо группе (человек, холодильник (IOT), человек старше 18, мужчина, женщина и т.д.).
                                                              0
                                                              Скорей всего это будет побочное решение, какой-то другой, более глобальной проблемы
                                                                +4
                                                                «На хабре никто не знает, что ты — холодильник...» :)
                                                                  0
                                                                  Холодильник тоже не знает что он холодильник :)
                                                              +9
                                                              Вы так хорошо придумали алгоритм, следящий за людьми, что у меня возник вопрос — это не вы повлияли на последние президентские выборы в США?
                                                                +1
                                                                Ой по грани ходите…
                                                                  0
                                                                  Это мне вопрос? Или Sistemaalex? Алгоритм придумал он, парой комментов выше.
                                                                    0
                                                                    Придумал или опубликовал?
                                                                      0
                                                                      Иррелевантно
                                                                        0
                                                                        Просто учил математику
                                                                        +1
                                                                        Это мне вопрос? Или Sistemaalex? Алгоритм придумал он, парой комментов выше.
                                                                        Алгоритм сваливания ответственности на другого применен правильно.
                                                                        </сарказм>
                                                                          –1
                                                                          Вы предполагает, что алгоритм анализа предполагает перенесение ответственности? Алгоритма абсолютно все безразлично.
                                                                      +9

                                                                      А я довольно легко избавился от привычки участвовать в дебатах(уже неделю как). Ввел для себя правило: хочешь написать комментарий — прочитай два раздела учебника/мануала/две статьи по интересующей теме, или реши три задачи, или сделай коммит в пет-проект. И как-то сразу стало неинтересно доказывать кому-то, что он не прав. Руки тянутся к клавиатуре, а потом приходит мысль: "Нет, этот человек не достоин часа моих усилий на зарабатывание комментария". Теперь хочется предлагать только конструктивное, интересное, дискутировать, и совсем не хочется кого-то переубеждать. Вот сегодня, к примеру, и коммит сделал, и прочитал пару-тройку разделов учебника, а сейчас предлагаю этот метод другим.

                                                                        +3
                                                                        Руки тянутся к клавиатуре, а потом приходит мысль: "Нет, этот человек не достоин часа моих усилий на зарабатывание комментария".

                                                                        Я просто оставлю это здесь

                                                                        image

                                                                          +17

                                                                          Иногда пишу комментарий в формочке, потом думаю: а кому это нужно, и стираю его.

                                                                            +5
                                                                            Аналогично.

                                                                            «с возрастом мы понимаем, как много событий в этой жизни не нуждаются ни в нашем мнении ни в наших комментариях»
                                                                            +7
                                                                            Для напоминания себе добавил на аву эту картинку:
                                                                            image
                                                                            Как только начинаю писать второй сообщение в теме — смотрю на свое первое сообщение, вижу аватарку, и вспоминаю…
                                                                            В итоге из большинства споров здесь люди дискутирующие со мной выходят с мнением, что они задавали меня фактами, победили в споре, и я слился. Ну что, пусть думают так. А я потрачу время на что-нибудь другое.
                                                                              +2
                                                                              Со временем вырабатывается понимание, что доказывать всем, что ты круче и умнее — бесполезный процесс, как вычерпывать ложкой море. Понимаешь некоторую бесконечность круга общения в интернете.

                                                                              А затем наступает дзенн, когда тебе просто пофиг на то, что думают про тебя другие.

                                                                              И уже после этой точки начинаешь общаться ради удовольствия или обмена знаниями.
                                                                                +1
                                                                                Со временем вырабатывается понимание, что доказывать всем, что ты круче и умнее — бесполезный процесс, как вычерпывать ложкой море.

                                                                                Но умение это делать полезно, увы.


                                                                                Такой способ прокачивать софт скиллз, если хотите.

                                                                                  +1
                                                                                  А еще полезно умение распознавать персонажей, с которыми спорить совсем бесполезно. Мне на работе часто помогает(к сожалению — не всегда).
                                                                            +6
                                                                            DreamingKitten этим постом и потраченным временем показал как надо тратить время на «в интернете кто-то неправ» :D
                                                                              0
                                                                              К слову интересно добавить эту статистику статистикой статьи Хабрастатистика: анализируем комментарии читателей by DmitrySpb79
                                                                              image
                                                                                0

                                                                                Доктор, доктор а посмотрите мои анализы.

                                                                                +1
                                                                                Если целью автора была детекция срачей, я бы обратил внимание на размеры комментария и на наличие большого количества комментариев к одной и той же статье в небольшом временном окне. Размер можно отобразить радиусом точки, в сочетании с цветом будет интересно.
                                                                                  +2
                                                                                  на наличие большого количества комментариев к одной и той же статье в небольшом временном окне.

                                                                                  Есть статьи на хабре и не только, где процентов 50 мои ответы. И при этом там нет срача.
                                                                                  Просто открываешь комменты, там вопросы или утверждения, на вопросы отвечаешь(потому что в теме), ложные утверждения опровергаешь(потому что в теме). Получается делаешь это подряд друг за другом, просто читая комменты один за другим
                                                                                    0

                                                                                    Если поискать датасет для анализа эмоциональной окраски, то можно будет даже отделить "технические дискуссии" от срачей.

                                                                                      0
                                                                                      Может быть, за 5 лет что-то поменялось, но когда я смотрел на sentiment analysis последний раз, все там было примитивно и печально. Срачики на хабре, в основном, вежливые, а sarcasm detection точно не изобрели.
                                                                                  +3
                                                                                  Для детекции срачей ещё полезен признак «все комменты в ветке заминусованы» (типичный случай, а когда ещё и зрители подтапливают, то очень заметно) или «комменты заминусованы через один» (например я стараюсь не минусовать оппонентов — в этом же нет никакого смысла, если я текстом свои аргументы привожу, но среди моих оппонентов люди с таким подходом к вопросу почти не встречаются).
                                                                                  +1
                                                                                  Может попробовать объединить точки в heatmap?
                                                                                    +3
                                                                                    Если количество комментариев под статьёй стремительным домкратом приближается к 1000

                                                                                    Так логично. Когда число комментариев приближается уже к 500, то их не очень приятно читать из-за скорость прогрузки. Когда их уже 1000, то остаются лишь те, кому действительно очень хочется что-то доказать.

                                                                                      +2
                                                                                      Или пользователи Firefox, у которых нет никаких проблем даже с 2к комментариев.
                                                                                      Правда я бросаю комментировать такие статьи и отписываюсь по другим причинам.
                                                                                        +2

                                                                                        Проблема может быть и в случае слабого интернет-канала. Сам сервер отвечает долго, объём данных достаточно большой — у меня при сидении с мобильного интернета часто случалось, что страница не догружалась, но при этом комментарии становились прочитанными. Вот и смысл участвовать в срачах?

                                                                                          +2

                                                                                          habrahabr оптимизирует наконец-то свой сайт. Даже с мощного телефона читать и комментировать статьи с > 500 комментов невозможно. Да что там — у меня даже неслабый ноутбук подтормаживает на отображении десктопной версии. Нет, так жить нельзя. Это точно. А прикиньте — сколько комментариев мы теряем из-за этого ежедневно, ежеминутно ?

                                                                                      0
                                                                                      и, конечно же, обязательное в таких случаях блюдо — взаимные обвинения в том, что ваш визави с вами дискутирует исключительно за вознаграждение и\или по долгу службы.

                                                                                      Что характерно, в мегасраче под моей статьей про выживание мотоциклиста в городе небыло ни одного такого коммента :)

                                                                                        0

                                                                                        Так тема политику не затрагивает, вот и не было :)

                                                                                        0
                                                                                        Угадайте когда ко мне переехала, на тот момент будущая жена?
                                                                                        image
                                                                                          0
                                                                                          Когда ваши отношения перешли в новую фазу развития?)
                                                                                            0

                                                                                            А разве не видно смещение моей активности ровно в 8 утра?

                                                                                              0
                                                                                              По-моему видно меньше времени на сон.
                                                                                                0
                                                                                                То есть, к нему переехала будущая жена и в связи с этим он стал залипать в интернете по ночам?)
                                                                                                  0
                                                                                                  Днем компьютер под оккупацией захватчицей. Сам часто в своем ПК по RDP с телефона сижу. Ибо «смотреть сериалы на большом ТВ не так удобно как на ПК».
                                                                                                    +1
                                                                                                    В сокращении ПК первая буква когда-то означала «персональный».
                                                                                                    Всяко бывает, конечно — но стремиться-то, по моему скромному надо к этому.
                                                                                                      0

                                                                                                      Ставите Gentoo, покупаете Ergodox вместо клавиатуры, и компьютер естественным образом снова становится персональным.

                                                                                                        0
                                                                                                        Хмм…
                                                                                                        Даже если исключить то, что у нас дома этой проблемы просто нет, компов больше, чем людей: но с чего вы взяли, что Gentoo будет надежным препятствием для любой наперед взятой супруги? Мы не гентушники, но свой Debian моя прекрасная дама администрит сама, справляясь с этим ничуть не хуже меня. А Ergodox, подозреваю, она еще и раньше меня освоит, если он заведется.
                                                                                                        +1
                                                                                                        В сокращении ПК первая буква когда-то означала «персональный».

                                                                                                        Вчера как раз пост был в зателеком
                                                                                                        PC — это вовсе не Personal Computer, как все привыкли. На самом деле, в IBM запилили первый PC аж в 1975 году. Это на год раньше Apple I (но на год позже Altair 8800).
                                                                                                        Система называлась IBM 5100 Portable Computer. Portable is not Personal!
                                                                                                        Так что, можно спорить, что было раньше.
                                                                                                          0

                                                                                                          Да. Вы аппелируете к шутке — в чем разница по количеству ручек между портативным и персональным компьютером

                                                                                                            0
                                                                                                            Не знал, спасибо.
                                                                                                            Хотя можно дискутировать, конечно, об общеупотребимости значения…
                                                                                                +1

                                                                                                Судя по количеству комментариев, она до сих пор не переехала и не знает, что она ваша будущая жена?

                                                                                                  +2
                                                                                                  Да нет, вот рядом сидит, читает что-то с планшета.
                                                                                                  0

                                                                                                  А как по этим графикам вообще это определить-то? Комментов стало больше, а не меньше же.

                                                                                                    0
                                                                                                    Возможно, что после начала отношений Aquahawk с на тот момент будущей женой они отправились в свадебное путешествие в прошлое. Никогда ещё путешественники во времени не были так близки к провалу.
                                                                                                      +2

                                                                                                      Всё просто, я был раздолбаем и вставал когда угодно. А теперь я железно в 8 на работе. И там никого особо нет. Только тссс.

                                                                                                        +2
                                                                                                        Всё просто, я был раздолбаем и вставал когда угодно. А теперь я железно в 8 на работе.

                                                                                                        Жена настолько задолбала, что хочется смыться от неё куда подальше (например, на работу — ещё и отмазка железобетонная)? :)

                                                                                                          +1

                                                                                                          Всё гораздо хуже. Ей удобно работать с 8 до 5. Я сдвинул свой график на такой же, чтобы вечерами как раз быть вместе.

                                                                                                  +2
                                                                                                  Мда. И обычно здесь любят говорить о «состоянии потока». Где же оно? Или под «состоянием потока» обычно имеется в виду поток комментариев?
                                                                                                    0
                                                                                                    Если вы каждый день можете «в потоке» кодить строго по расписанию на протяжении длительного времени, чтоб это на визуализации стало заметно — то вы супергерой какой-то.

                                                                                                    PS: Идея — может аномалия у khim — это как раз то, что он многие месяца строго в одно и то же время каждый день час кодит, ни на что не отвлекаясь?
                                                                                                      0
                                                                                                      PS: Идея — может аномалия у khim — это как раз то, что он многие месяца строго в одно и то же время каждый день час кодит, ни на что не отвлекаясь?
                                                                                                      Или спит
                                                                                                    +1

                                                                                                    Вообще можно попробовать портировать на js и отрабатывать прямо в браузере.
                                                                                                    Зачем там SQL вообще? Для такой задачи можно результаты просто в текстовых файлах хранить. Неохота ставить и настраивать базу ради одного скрипта.


                                                                                                    Кстати мой график должен выглядеть странным. Интересно, на сколько?

                                                                                                      +2
                                                                                                      Поглядел на знакомые ники в веб-версии, теперь у меня есть фавориты — человек-нерасписание 0xd34df00d и человек-расписание mayorovp ^_^
                                                                                                        0
                                                                                                        Автор хочет «вычислить» поведение разных групп людей, не зная о них почти ничего.
                                                                                                        Развитию этой темы помогло-бы введение в Big Data и социальную физику.
                                                                                                          –1
                                                                                                          Во, как
                                                                                                          image
                                                                                                            0

                                                                                                            Вау! Так просто и так информативно.

                                                                                                              +4
                                                                                                              Блин, по картинке чётко видно смену работы и полгода сидения дома между ними. Нужно написать скрипт для отправки комментариев в рандомное время.
                                                                                                                0

                                                                                                                … и в ответ на рандомные статьи (или чужие комментарии)

                                                                                                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                                                              Самое читаемое