Как стать автором
Обновить
27
0

Пользователь

Отправить сообщение
С этим, я думаю, мало кто спорит. Это базовая идея кармы. Но вы вот ответили человеку с остаточной положительной кармой, у которого нет статей на GT, и повышать ему карму нельзя, а значит, со временем он может только уйти в минус. Я не вижу в этом ни глубокой продуманности, ни здравого смысла, ни справедливости, как ее ни понимай.
Я слегка не в курсе истории изменений (или, может, подзабыл, ибо на границе 2010-х пользовался ресурсом лишь эпизодически), можете уточнить: каких правил? Я вот пока еще не вполне уверен, что администрацию устраивает опустение комментариев к статьям и исход производителей контента. Причем речь же не идет о тех, кого сообщество не желает видеть в своих рядах: как я показал, вовсе не нужно писать что-то неугодное большинству, чтобы потерять возможность комфортно пользоваться ресурсом со временем. Достаточно просто писать. Т.е. мы имеем парадоксальную ситуацию отрицательной обратной связи: пользователей мотивируют к тому, чтобы они не оставляли комментариев, не генерировали контент. Но общение, обмен знаниями и опытом — важная составляющая здоровой и полноценной жизни сообщества. Сообщества, на которое в конечном счете и ориентированы рекламодатели в качестве своей целевой аудитории. В результате оная жизнь может существовать только в режиме сопротивления.

Я могу понять некоторые другие строгие правила, высокие требования и т.п. из соображений поддержания качества материалов, но в этом вопросе логика от меня ускользает. Особенно тяжело мне дается понимание, какой стратегической цели достигает неинформирование комментаторов без публикаций о невозможности повышать им карму. Я все-таки склонен полагать, что этот аспект не был принят в рассмотрение или был недооценен.
Может, это немного офтопик, но я, с вашего позволения, разовью тему. На настоящий момент распространенный цикл жизни хабраюзера такой:

  1. получить приглашение и радоваться ему;
  2. написать 100 хороших и полезных и 1 неосторожный комментарий, нарушающий (не)гласные правила сайта;
  3. от первого недовольного этим пользователя получить минус в карму, лишившись тегов;
  4. или не нарушить ни одного правила, но повстречаться в темном переулке с кем-то нетерпимым к его точке зрения или стилю поведения;
  5. невозможно нравиться всем, и с течением времени количество таких случаев может и будет только расти, карма достигает значений −10–15, делая некомфортным присутствие на сайте;
  6. и в этот момент юзер либо пишет публикацию (а не у всех есть талант к этому) и (не) восстанавливает карму, либо, чаще, уходит с сайта, часто даже не подозревая, что у желавших его плюсануть просто не было для этого возможности. Занавес.

Да, это лишь одна из возможностей, и с кем-то все происходит совсем иначе, но я успел просмотреть немалое количество профилей, и подобный шаблон встречается уж слишком, непозволительно часто. На мой взгляд.

Полгода назад я общался с интересным собеседником на тему возможностей распределения земных ресурсов на разные задачи, а через пару недель он коснулся в одном месте щекотливой околополитической темы, да еще и имел неосторожность огрызнуться на тех, кто пошел сливать ему карму. Наверное, делать это было глупо; жаль только, что теперь качественно пообщаться с ним по тематике ресурса мне, скорее всего, не удастся: не более одного комментария в час.

Или вот человек, хорошо разбирающийся в электронике и написавший ряд ценных комментариев по теме. Противоречивые оценки, но с большим преобладанием плюсов, вызвал его комментарий в защиту фонда «Династия», содержащий в том числе следующие строки:
Ну а фонду «Династия» надо не по ковру перед царём ползать, а сделать именно то, в чём фонд обвиняют: начать работать «с отстаиванием интересов иностранных государств», то есть заниматься поиском и поддержкой талантов, только на этот раз уже вывозить их за границу.
Теперь он ходит в минусах, и у меня мало сомнений, что он последует собственному совету, а именно: не заискивать перед кем-то, а хлопать дверью, — если ситуация повторится с ним самим.

Маленький юзер на Хабре гулял
Что-то в каментах про власть рассказал
(вариант: Против Навального слово сказал)
Хабр теперь может он только читать
Думал бы, прежде чем рот открывать


На самом деле этот стишок — даже серьезное преувеличение. Затрагивать острые темы необязательно. Достаточно просто быть активным пользователем и написать много комментариев. Кому-нибудь что-нибудь в них точно не понравится.

Так к чему это я? Этой тенденции есть возможность крупно обломать рога, просто если дать возможность повышать карму комментаторам без публикаций.

Притянутые дружелюбной атмосферой, эти юзеры со временем расщедрятся и на публикацию-другую. Луна будет обернута, все будут счастливы.
Думаю, комментариев под постами было бы еще больше, если бы комментаторам, не написавшим ни одной публикации, можно было повышать, а не только понижать карму, в результате чего ряды комментаторов не редели бы, как сейчас, когда комментаторам по сути уготована судьба медленно скатиться в кармояму. Предвижу аргумент, что это должно мотивировать писать посты. Нет, мне думается, с большей вероятностью человек просто уйдет с сайта, обиженный, что его здесь не любят, примеры чего я видел, и немало. (По-моему, информации о том, что комментаторам нельзя повышать карму, и вовсе нет на сайте. Меня, по крайней мере, это удивило, когда я это впервые попытался. То есть многие незадачливые комментаторы, должно быть, и не догадываются об этом и наверняка переживают, что их так все не любят ни за что ни про что.)

Если открыть топ публикаций «Гиктаймса» за все время, то можно отчетливо видеть, что все это — публикации времен объединенного Хабра. Текущая активность на сайте не позволяет публикациям набирать столько плюсов даже близко. Промежуточным решением могло бы быть открытие еще и топа за год, но наилучшее, на мой взгляд, — способствовать созданию благоприятной среды, дружелюбной атмосферы, и тогда кумулятивный эффект пользовательской активности превзойдет все ожидания, а на «Гиктаймсе» естественным образом будет становиться все больше интересных постов, содержательных комментариев и ценных личностей, а также снизится число жалоб на карму в комментариях, выяснений отношений и т.п.

Но, так или иначе, поздравляю сайт. Как-то по ощущениям думал, что ему больше.
Знаете, что вам ответит российский суд на ваши грамотные и красивые описания того, как на сайте не хранится запрещенная информация?

Он ответит:

«Установлено, что бла-бла-бла бла-бла-бла на сайте хранится запрещенная информация».

:-D
Тут, кстати, этот критерий есть — последняя колонка. На других фильмах уже не работает.
Я пытался докопаться до этого правила — все тщетно. Это, а также рейтинг «Зеленого слоника» и пр. не выводится очевидным образом решительно из никаких цифр, присутствующих в открытом доступе.

Ну вот навскидку 5 фильмов с показателями, по порядку: «медиана» (которая не медиана) кластера (9 для 10-9-8, 8 для 9-8-7); средневзвешенное на странице голосования за фильм; классический рейтинг (взят из последнего значения на графике); рейтинг в Топ-250; процент оценок 10; процент оценок 10+9; процент оценок 10+9+8.

хатико		8	8,686	8,478	8,467	43,85	64,77	81,5
темный рыцарь	9	8,680	8,483	8,476	39,59	64,28	82,68
валли		8	8,611	8,499	8,489	37,65	61,82	81,29
запах женщины	9	8,596	8,480	8,467	32,05	59,5	82,32
одержимость	9	8,581	8,435	8,416	27,92	58,37	82,98

Какой критерий ни берешь, чтобы упорядочить, — кластеры разорваны, то бишь нет такого, что сверху все 9, снизу все 8. Бог с ним — просто есть некие «эзотерические» данные, находящие применение во внутренней кухне. Как я показал выше, скорее всего, там нет ничего представляющего интерес с точки зрения сабжа.

Про Excel — ах ты ж, как банально :) Думал, узкоспециализированное что. Привычка использовать низкоуровневый софт и избегать громадин играет злую шутку.
В этом, кстати, тоже своя доля юмора. Если в классическом рейтинге они отсекали часть голосов по какому-то принципу (я проверил — они давали около одной-двух десятых долей рейтинга, что немало; и это еще до коррекции для нужд Топа-250), то новом в расчет идут все (даром что учитываются они так, как лучше бы не). Не знаю, хорошо это или плохо.
Что-то раньше не догадался до простого способа проверить гипотезу о решающем влиянии критерия разбиения на кластеры — разбить сводную табличку на три приблизительные части — зону, где кластер 10-9-8 правит безраздельно, зону столкновения кластеров (именно там должна проявиться роль критерия) и зону кластера 9-8-7 — и посчитать все показатели роста для них раздельно, взяв за основу вторую выборку из поста. (Исходя из того, что 9,000 — явно вручную правленный рейтинг, чтобы получить чистые характеристики самого алгоритма расчета, я устранил последствия ручной правки — три фильма переместились, таким образом, на 1-е, 2-е и 4-е места (опираясь на то, что видно на вашем графике). Обновленная табличка.)

Выделены все фильмы из кластера 10-9-8:



Для начала, видно, что область «столкновения кластеров» не так велика и ей с большой долей вероятности можно найти разумное объяснение (хотя я тоже не нашел).

Сравним показатели роста (под каждой парой вычислений ↓). Крохотные выборки, но хоть какие. Средний показатель роста для всех — 0,96.

  кластер 10-9-8 безраздельно
платные
7 + 13 + 15 + 19 + 26 + 27 = / 6 = 17,83
8 + 14 + 25 + 10 + 33 + 16 = / 6 = 17,67
0,16

бесплатные
1 + 5 + 10 + 11 + 17 + 18 + 25 = / 7 = 12,43
1 + 4 + 15 + 11 + 19 + 18 + 12 = / 7 = 11,43
1

  зона столкновения кластеров
платные
29 + 30 + 31 + 33 + 34 + 37 + 38 + 50 + 53 = / 9 = 37,22
20 + 24 + 36 + 46 + 29 + 47 + 21 + 45 + 38 = / 9 = 34
3,22

бесплатные
28 + 39 + 40 + 45 + 51 = / 5 = 40,6
39 + 48 + 52 + 44 + 68 = / 5 = 50,2
-9,6

  кластер 9-8-7 безраздельно
платные
54 + 64 + 68 + 72 + 75 + 83 + 84 + 86 + 89 + 90 + 97 + 109 + 110 + 130 = / 14 = 91,07
49 + 61 + 66 + 70 + 69 + 83 + 80 + 82 + 95 + 87 + 135 + 99 + 85 + 100 = / 14 = 83,53
7,54

бесплатные
59 + 63 + 66 + 79 + 82 + 88 + 91 + 92 + 94 + 95 + 96 + 98 = / 12 = 83,58
56 + 78 + 54 + 77 + 111 + 124 + 81 + 90 + 103 + 101 + 79 + 96 = / 12 = 87,5
-3,92

Хотя в случае с бесплатными фильмами показатель зоны столкновения зашкаливает, для платных распределение более естественное (чем дальше от начала топа, тем больше должны скакать позиции). Если только это не вклад ваших 3-4-5-й справа точек из нижнего ряда. А то было бы мощным финалом.

Таким образом, вынужден согласиться — подозрения в адрес именно самих внутренностей алгоритма, скорее всего, беспочвенны. То есть это значит лишь то, что прямо прописанных повышающих/понижающих коэффициентов для платных/бесплатных фильмов в алгоритме, скорее всего, нет. Никуда не девается сам факт смены формулы на такую удивительно полезную для платных фильмов и неполезную для бесплатных (полезную/неполезную настолько, что только что посчитанная мной вероятность получения такого исхода в результате случайных флуктуаций равна порядка 2,8% (только платные) * 1,1% (только бесплатные) = 0,03%), а также факт внесения ручных правок (каковой лично для меня являются той чертой, после перехода которой поиск «заговора» и «злого умысла» перестает быть маргинальным занятием. Если кто-то на это пошел — далее возможно всё).

Впрочем, вполне достаточно и того дна, которое мы имеем в результате одного только способа расчета на основе того, что было обозначено как «медианный фильтр» (который на самом деле не очень-то похож на медианный — по страницам голосований за фильмы видно, что медиана почти всегда лежит на девятке, а восьмерка начинается где-то на 55-65% выборки). Это ставит под удар достоверность оценок и состоятельность рейтинговой системы куда больше, чем прибавки/убавки платным/бесплатным фильмам по десятой балла.

Надеюсь, тема закрыта. Тем временем «Яндекс» утверждает, что «собирается» вернуть прежние рейтинги.

P.S. Я вас чем-то смутил? Все-таки, если не сложно, хотелось бы услышать название программки для графиков. Ежели вы приняли меня за паникера или типа того, смею заверить, что я не бросаюсь громкими словами без веских на то оснований. Полученные мной в посте цифры являлись таким основанием. По их порядку можно было заключить, что это крайне маловероятно, чтобы они были произведены случайными флуктуациями. То, что сам алгоритм, судя по всему, незапятнан, меняет положение дел в частных моментах, но общая картина остается нетронутой.
С какого дуба должен был рухнуть тот, кто собрался считать рейтинги киносайта с медианным фильтром? Коли вы в теме — неужели кто-то таким образом считает показатели на единой ГЛАДКОЙ ШКАЛЕ? Она должна быть ГЛАДКАЯ, черт возьми, а не ступенчатая! Это же просто банальная некомпетентность. Какой-то, извините, клоун в их штате решил по-хитрому преобразовать рейтинг, оставим сейчас в стороне с каким умыслом, но так как, помимо того, что он был клоун, он еще и шарил в статистике, он придумал воплотить это через МЕДИАННЫЙ ФИЛЬТР. Are you kidding me?

Мой гнев не иссякнет никогда, ну вот честное слово. Один большой анекдот этот новый Кинопоиск.

Знаете что? Этим менеджерам еще очень повезет, если они на какую-то долю таки окажутся эффективными.

Так, ладно. У остальных из нижнего ряда тоже единицы? Можно узнать, что за третий, четвертый и пятый? Они входят в ту зону, которая покрывается у меня в посте. Но они в любом случае не должны делать погоды, даже если там больше 70000 голосов.

P.S. Можете подсказать, в какой программке это все делается? Графики?
В очередной раз цитирую пост, а то люди путаются:
а также скандальные 8,2 балла вместо 4,8 у треш-фильма «Зеленый слоник» (а после флешмоба пользователей, которые увидели это и решили довести до абсурда, — уже 9,1)

Не мы начали эту войну.
Ну дык! «Хатико» бесплатный. По табличке видно, что он съехал на 12 позиций по сравнению с адаптированным старым топом. Все рейтинги в среднем выросли на 0,142 (см. пост), этот упал на 0,222.

Бросьте вы — какие там подозрения в накрутке? «Бриллиантовая рука» бесплатная, «Хористы» недоступные. Пока что мое объяснение чуть выше выглядит вполне правдоподобным. Это не пользователи накручивают, а «Яндекс» / ребята из нового «Кинопоиска».
Ох, как же это все печально… То есть я понимаю, хотели повысить баллы нужным, но черт возьми! Ну что это за способ такой — считать по трем окружающим оценкам? Как измышление какого-то школьника. Вредного школьника. Которому в руки дали главную киноэнциклопедию страны, чтобы он мог срубить на ней деньжат. Не говоря уж о том, чтобы вот так, вручную подправлять баллы, и так топорно — до круглого значения. Это какие-то выборы в Чечне!

Черт, я хочу знать, кто за это несет ответственность!

Ребята, это был (и пока еще есть) серьезнейший конкурент IMDb! Ну как же можно так в лоб компрометировать. Я все подозревал какой-то изощренный умысел и алгоритм, но они даже накрутить по-человечески не могут, чтобы не палиться! Детский сад какой-то.
О, отличная работа. Ага, т.е. 9,000 таки походит на результат ручного вмешательства? А так бы они так и оставались в лидерах. Напомню, что два из них бесплатные, один недоступный для просмотра.

Промелькнула мысль, что эти три ручные правки одни могли произвести и итоговое отклонение. Но нет, ничего подобного — если брать мой второй пункт в посте, обвал двух бесплатных дает только порядка -2,5 позиции, если размазать по всем, а общее отклонение — -6. Да и там продвижение идет и по платным, и по бесплатным, и в первой половине топ-100, и во второй.

О, вот как может быть — этот вариант же возможен, так? — как-то полуавтоматически (точно не вручную — фильмов-то много) выбирали для каждого фильма, по какому из двух усреднений (для менее рейтинговых фильмов это может быть 6, 7 и 8 и т.д.) ему считаться, с лёёёгонькой пессимизацией бесплатных и «оптимизацией» платных. Что в итоге выливается в полученный мной результат.
Извините, я не вполне понимаю, как уживается одно с другим — выбирание выгодного для себя рейтинга и отсутствие заговора с онлайн-кинотеатрами, если, по фабуле поста, последний и состоит в первом.
Интересно мнение минуснувшего. Не понравилось, что я подозреваю некий «заговор»?

То есть вы согласны с первым вариантом — что «Яндекс» зачем-то хотел улучшить рейтинг, но тут по воле случая платные фильмы взмыли наверх, а бесплатные грохнулись вниз?

На мой взгляд, это тот случай, когда логика «слишком много совпадений» имеет полное право на существование. Хотя я, опять же, допускаю, что совпадения — это просто совпадения, что несколько раз подчеркивал в посте.
Крутой брейншторм тут у вас. На ночь глядя тяжело вдумываться, лучше скажите — резкое падение «Хористов» и «Бриллиантовой руки», описанное в посте, это объясняет? Округленные три одинаковых рейтинга?
Заговора нет — ой ли? Процитирую пост: «С другой стороны, сам факт того, что эти совпадения загадочным образом играют на руку коммерческим интересам компании (а не, например, против ее интересов) в любом случае не может быть оставлен без внимания публики».

Заговор же не в том, чтобы считать не по формуле. А в том, чтобы считать по правильной формуле. Это как закон, который что дышло. «Побеждает тот, кто устанавливает правила».

Есть две опции:
  1. введенный алгоритм действительно по воле случая дает такое отклонение в пользу платных и против бесплатных, а в «Яндексе» просто зачем-то хотели улучшить рейтинг и перевести все на него;
  2. либо же в «Яндексе» сначала хотели «улучшить» рейтинг (а на самом деле понятно что), испробовали разные варианты корректировки и остановились на таком-то (пусть это тот, который вы начали распутывать). Да и тогда у него остается возможность дать какое-то глубокомысленное объяснение, дескать «вполне логично», что даже вы подумали.

Первая как казалась, так и продолжает казаться мне маловероятной.
На практике — отнюдь не лучше. В классическом Топ-250 фильмов, оцененных менее чем 5000 людьми, и не было, менее чем 10000 — несколько. В классической формуле учитывается близость к этому порогу, отрезая совсем редкие таким образом. А фильтр в 70000 отрезает больше половины всех фильмов в Топ-500. Он отсеивает все, что не массово.
Нет, вы все поняли неправильно. Эта надпись там была, еще когда нового сайта с его рейтингами в помине не было. Процитирую пост: «Не исключаю, что вскоре обновится и старый топ, — может, он держится только потому, что алгоритм расчета рейтингов в нем отличается от алгоритма на страницах фильмов («в топе используются специальные механизмы, препятствующие накрутке рейтинга недобросовестными пользователями»), и этот алгоритм корректирует не новый, а старый рейтинг (в основном, в пределах пары сотых долей)». В зеленом боксе раньше был старый рейтинг, который отличался от скорректированного для нужд Топ-250 в пределах двух сотых (см. снимок из веб-архива), он не имеет ничего общего с новым.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность