Иногда я читаю статьи на Хабре. Ключевое слово здесь - иногда. Не регулярно. Бывает, с очень большими перерывами. Когда есть подходящее настроение. Или наоборот нет никакого настроения. По крайней мере, это для меня более интересное и менее пугающее занятие, чем вечерний просмотр телевизора. Но последнее время я стал ловить себя на мысли, что инструменты Хабра, с помощью которых я пытаюсь составить свой список внеклассного полезного чтения, требуют небольшой, но важной доработки. Есть идея, как находить действительно интересные, но давно забытые статьи. Мне хотелось бы, чтобы у этих статей был шанс на вторую жизнь. После забвения.
Есть ли жизнь после смерти?
Вы спрашиваете как живет мой ёж?
Мой ёж живет плохо. Он умер.Из детского письма редакторам раздела «Зеленый портфель» журнала «Юность»
По моим наблюдениям (и не только), перед тем как кануть в Лету, статья на Хабре «живет» дня три. После публикации, как правило, каждый последующий день статья набирает в два раза меньше просмотров, чем в предыдущий. В последующий месяц через неделю после публикации количество просмотров составляет от силы 10% от количества просмотров в первые три дня.
Если статье повезет, она понравится какому-нибудь поисковику и он разместит ее в первой десятке своего индекса по популярному запросу, то у статьи остаются шансы на прочтение спустя месяц после публикации. Но это сродни выигрышу в лотерею. При этом, совсем не обязательно, что контент, который понравился бездушному поисковику, так же понравится и живому человеку. Хотя иногда доступ к давно забытым материалам можно получить только благодаря тому, что на них обратил внимание какой-нибудь поисковик.
Бывает, что случайно нарвавшись на интересную статью, начинаешь перечитывать все статьи этого автора написанные давным-давно. А если автор уже не напишет новых статей? Если его статьи уже не попадут в рейтинг? Не так давно алгоритмы YouTube подсунули мне для просмотра кусочек квартирника Вени Д’ркина (Александра Литвинова) 1996 года. Ошалев от услышанного, я стал судорожно искать по Интернету все песни и сказки этого автора, которого, как оказалось, нет с нами уже четверть века. И мне не дает покоя вопрос, почему я узнал об этом явлении так поздно. Ведь даже ролик, который я случайно увидел, был опубликован более 10 лет назад.
Хабр не балует своих читателей разнообразными механизмами реанимации поиска статей, «мотивируя» посетителей на перелопачивание максимально большего количества материалов. С позиции SEO это, наверно, правильно. Чем больше страниц просмотрит посетитель, тем более интересен сайт с точки зрения ЯндексМетрики. А вот правильно ли это с точки зрения читателей?
Выбор статей по количеству лайков в рамках выбранного хаба - фактически единственный способ, который сегодня предлагает Хабр для поиска действительно интересной информации. Но насколько хорош такой способ? Лучшие статьи, по мнению Хабра, – это статьи с максимальным количеством лайков. С учетом того, что я могу выбрать только период от текущей даты, механизм поиска Хабра создает ситуацию, когда множество хороших статей с невысоким количеством лайков оказываются погребенными под толщей хайпа, который будет всегда измеряться только по отношению к сегодняшнему дню. Например, найти лучшую (даже по лайкам) статью за 2015 год в принципе невозможно.
Недавно введенный фильтр поиска статей по уровню сложности, меня, честно говоря, слегка раздражает, как бы намекая на мою умственную неполноценность. Кроме того, уровень сложности определяет сам автор статьи, исходя из собственных соображений, что в свою очередь не добавляет объективности такой оценке. Мне любопытно, какой бы уровень сложности выставил Элияху Голдрат для своего бизнес-романа «Цель»... Предполагаю, что уровень сложности сильно зависит не от автора, а от читателя. Кроме того есть подозрение, что если автор выставляет для своей статьи максимальный уровень сложности, он сам не совсем понимает то, что написал.
Наполеон говорил, что «Бог всегда на стороне больших батальонов». Как показывает мой опыт, количество просмотров благоволит оценке статьи на Хабре. По моим нехитрым наблюдениям, абсолютное количество лайков напрямую зависит от количества просмотров. Даже в случае ОЧЕНЬ успешных статей количество лайков, как правило, только в самых исключительных случаях превышает 1% (!) от количества просмотров в первый месяц после публикации (в период, когда можно оценивать статью).
В свою очередь, Фортуна, которая руководит просмотром статей, – это дама ветреная и непредсказуемая. По сведениям, полученным непосредственно от редакторов Хабра, количество просмотров статьи – это величина, которая зависит от множества факторов: от правильно выбранного названия, от времени публикации (времени года, времени суток и дня в рамках недели), от правильно подобранной картинки в анонсе, от популярности хабов, от количества статей той же темы (конкуренция за внимание читателей), от хайповости темы (например, статья про chatGPT сейчас и год назад - это две разные активности). Сюда же можно добавить множество других нюансов, технология описания которых сродни шаманству.
Поэтому интересная статья запросто может не набрать достаточного количества лайков, чтобы обратить на себя внимание. Например, из-за того, что у нее оказалось недостаточно завлекающее название. А рекламная пустышка, «ненавязчиво» раскрученная в СМИ, будет оценена толпой как прорывное открытие.
Однако, изредка нарываясь на решения, которые были опубликованы на Хабре много лет назад и зачастую невысоко оценены читателями, я понимаю, какое ОГРОМНОЕ количество ЦЕННЫХ материалов находится в хранилище Хабра. Вопрос только в том, как сепарировать эти статьи от высокооцененного «шлака»?
Особенности переработки мусора
О если б вы знали, из какого сора
Растут стихи, не ведая стыда...
Анна Ахматова
У меня есть хобби. Кое-кто из моих знакомых это хобби называет «пунктиком». А некоторые - даже «диагнозом». Мое хобби заключается в том, что иногда я пишу статьи для себя Хабра.
Началось это летом 2019. На тот момент, моя проектная команда, уже два года применяла, как позже выяснилось, нетрадиционные, но достаточно эффективные, подходы к использованию JIRA. Однако поначалу, никто, кроме нашей проектной команды, в компании ЛАНИТ так не делал. При этом для анализа ситуации на проекте были применены самописные дашборды. Постепенно применяемыми инструментами начали интересоваться сотрудники других проектных групп.
И поэтому мне приходилось снова и снова рассказывать, как работает этот комбайн из традиционной JIRA и нетрадиционных дашбордов. Со временем это стало утомлять, несмотря на то, что я даже записал несколько видосов о принципах организации проектных работ с использованием этих инструментов. Однако кроме видео коллеги хотели иметь инструкции по применению этого подхода. Подбирать слова для сухого регламента мне было честно говоря в лом. Поэтому я решил написать статью об этом подходе на Хабр, не сильно ограничивая себя в выражениях. Формат статьи позволял не только рассказать то, что надо делать, но и давал возможность описать причины, которые привели к именно таким решениям. Видимо, тогда я и заразился хабратворчеством. Подозреваю, что без дофаминовой зависимости здесь не обошлось...
Внезапно я открыл для себя, что выгруженные на Хабр мысли значительно снижают непродуктивные затраты мыслетоплива на бесконечные циклы самоанализа. Позднее узнал, что я не являюсь первооткрывателем этого метода, и у него даже есть собственное название - GTD. Как оказалось, на Хабр можно выгрузить не только описания решений задач, но и целую палитру трудно сдерживаемых эмоций, которые существенно влияют на эти решения.
Кроме этого, не секрет, что Хабр позволяет получить беспристрастную обратную связь от огромной аудитории экспертов, хейтеров и просто неравнодушных читателей, которым, однако, абсолютно безразличны все твои достижения, заслуги и регалии, полученные до публикации конкретной статьи...
Со временем выяснилось, чтобы физиотерапевтический эффект хабратворчества был полезен для здоровья, необходимо тщательно систематизировать и проработать все стороны проблемы, которая отражена в статье. А на это нужно время. Поэтому иногда от формирования первых строк до состояния, когда статью «пацанам было не стыдно показать», проходит, не поверите, несколько лет. Однако если статья хорошо «выдержана», к ней возвращаешься за помощью снова и снова при поиске решения сложных задач. А до того, статья «созревает» в облаке, постепенно обрастая все новыми нюансами, которые, с моей точки зрения, являются важными.
Я стал хорошо понимать Антона Павловича Чехова: он постоянно носил с собой блокнот, записывая мысли, которые могли прийти в голову, где угодно. Я подметил одну закономерность: наиболее интересные и вкусные формулировки появляются в статье в период начинающийся за одну неделю перед и заканчивающийся через месяц-полтора после даты публикации.
То как оценят статью читатели имеет значение для автора. И не только как пища для удовлетворения тщеславия, но и как катализатор для качественного роста ценности опубликованных идей.
И когда после публикации статьи суровая реальность начинает противоречить предварительной внутренней оценке своего опуса, при почти полном безразличии отсутствии комментариев читателей – это слегка напрягает. Поэтому в процессе накопления опыта по написанию своих статей, я нашел для себя два показателя, которые, на мой взгляд, более объективно отражают истинную ценность этих статей, чем просто количество просмотров или число лайков.
При поиске объективных метрик качества статьи я задался вопросом, а в каких случаях я лично голосую за статью, ставя лайк или помещая ее в свои закладки. И есть ли в этом разница?
По моему мнению, лайк (голос за статью, в терминологии Хабра) – это мое признание неоспоримой ценности статьи. При этом не всегда лайк совпадает с закладкой. Во-первых, хорошая статья может быть найдена после окончания срока голосования. Во-вторых, иногда я лайкаю статью, не отмечая ее в закладках, в том случае если статья принесла просто удовольствие от прочтения или подарила инсайт. Например, так было со статьей о разведении клубники. И наоборот, в случае нахождения полезной справочной статьи я могу запросто положить ее в закладки, не поставив лайк.
После осмысления причин для положительной оценки статей мне стало гораздо проще жить уточнить показатели ценности публикуемого на Хабре материала.
Первый показатель – это среднее количество лайков на 1000 просмотров в первый месяц публикации статьи (фиксируется после первого месяца публикации).
Второй показатель – среднее количество закладок на 1000 просмотров за все время публикации статьи (меняется в зависимости от количества закладок и просмотров за весь период публикации статьи).
Как оказалось, эти метрики позволяют добиться справедливого умиротворения между безответной любовью к своим хабротворениям и кажущимся безразличием читателей к ним.
Вместе с тем, в какой-то момент я понял, что для нахождения интересных материалов на Хабре мне нужны инструменты поиска по тем же самым показателям.
Как я мерил ценность
Есть ложь, есть наглая ложь и есть статистика...
Марк Твен
За почти пять лет хабратворчества, как результат, у меня появилось 12 детей статей. За это время я определился со своими основными предпочтениями – статьи посвящены одной из двух основных тем: или управлению программными проектами, или управлению образованием. Мне интересно, как можно повысить эффективность этих двух видов деятельности, и не только на основе применения компьютеров. Поэтому, как правило, эти статьи относятся к трем основным хабам Хабра:
С детства нас учат равняться на лучших. Поэтому сначала я решил посмотреть, а какие показатели имеют самые рейтинговые статьи в этих хабах. Лучших, по мнению Хабра. К сожалению, при их анализе я мог воспользоваться только общедоступной информацией. Тем не менее, это позволило оценить для каждой статьи количество закладок на 1000 просмотров.
В представленных ниже таблицах количество закладок на 1000 просмотров округлено до целого в большую сторону. Значение этого показателя является нормированным, и по нему можно оперативно сравнить статьи с разным количеством просмотров и лайков.
Как оказалось, для этих статей количество закладок колеблется от 2 до 7 на 1000 просмотров, и это количество слабо взаимосвязано с рейтингом статьи по лайкам. Выяснилось, что одна из этих статей, набравшая максимальное количество закладок относительно просмотров, также является призером конкурса Технотекст. Это натолкнуло меня на мысль сравнить нормированные показатели статей-победителей этого конкурса и статей-лидеров рейтинга по хабам Хабра.
На этот конкурс авторы Хабра в 2022 году представили более пятисот статей. А на Технотекст-2023 уже больше тысячи. При этом каждый из конкурсантов может предоставить только одну статью, наилучшую с его точки зрения. Статьи представленные на конкурс, оценивает не ветреная Фортуна, а компетентная комиссия экспертов по каждому тематическому направлению.
Статьи-победители конкурса Технотекст-2023 в категории 🏆 Senior
Что бросилось в глаза в первую очередь, это то, что количество лайков, набранных статьями-призерами Технотекста-2023, разительно отличается от лидеров рейтинга Хабра. Подумать только, комиссия экспертов признала одной из лучших в году статью, которая набрала целых 11 лайков. Артхаус какой-то... В комиссию что-ли только неформалов берут? Или нет?
Во-вторых, сравнивая количество закладок на 1000 просмотров, можно увидеть, что у призеров Технотекста этот показатель заметно отличается в большую сторону, по отношению к статьям-лидерам рейтинга по лайкам.
Кроме того, проводя это исследование я выяснил, что выставив максимальный уровень сложности для своей статьи, вы фактически убиваете просмотры этой статьи. Посмотрите рейтинг статей за все время, выставив в поиске максимальный уровень сложности. На текущий момент, в хабе «Управление проектами», при таком раскладе статья имеющая 2 (два) лайка заняла 7-е место в рейтинге. В рейтинге из 8 статей. С другой стороны, можно немного продлить агонию жизнь своей статьи, выставив максимальный уровень сложности через месяц после публикации, когда голосование за статью будет завершено. При этом, вы получаете большие шансы попасть в верхние строчки рейтинга лучших статей Хабра с максимальным уровнем сложности.
Конечно, для полноценной оценки валидности предложенных показателей надо провести множество измерений. С другой стороны, мне всегда импонировал пример Георга Менделя, который с помощью гороховой грядки в монастырском огороде ухитрился открыть основные законы генетики. Поэтому, прежде чем представлять эти метрики на суд читателей, я решил оценить, как эти показатели работают на моей «грядке». Для этого, по запросу редколлегии ЛАНИТ, редакция Хабра предоставила статистику о количестве просмотров моих статей в первые тридцать дней после публикации и по состоянию на 29.02.2024. Это дало возможность измерить не только количество закладок на 1000 просмотров, но и количество лайков на 1000 просмотров в первые 30 дней после публикации. Кроме того, получилось посчитать среднее значение просмотров статей в сутки, уже после ажиотажа первого месяца жизни статьи на Хабре.
Название статьи | Лайки | Закладки | Количество просмотров по состоянию на 29.02.2024
| Количество на 1000 просмотров | |||
на 30 день после публи-кации | всего | в сутки, позднее 30 дней после публи-кации | лай | закладок | |||
67 | 324 | 19671 | 98178 | 49 | 4 | 4 | |
52 | 132 | 7438 | 20932 | 9 | 7 | 7 | |
42 | 136 | 4839 | 27127 | 15 | 9 | 6 | |
64 | 147 | 22429 | 27040 | 3 | 3 | 6 | |
35 | 100 | 3672 | 21620 | 14 | 10 | 5 | |
9 | 15 | 27142 | 28129 | 1 | 1 | 1 | |
57 | 208 | 10988 | 40952 | 32 | 6 | 6 | |
73 | 108 | 19991 | 23848 | 5 | 4 | 5 | |
168 | 245 | 45576 | 58425 | 22 | 4 | 5 | |
108 | 162 | 13110 | 17395 | 10 | 9 | 10 | |
35 | 47 | 2371 | 2767 | 1 | 15 | 17 | |
57 | 62 | 5363 | 5450 |
| 11 | 12 |
Тяжело быть объективным, когда дело касается себя любимого, однако попытаюсь.
Значение средней частоты просмотра статей в сутки через месяц после публикации показало, что не все статьи были забыты. Полагаю, благодаря поисковым системам, поскольку, по моим наблюдениям, эти статьи довольно долго находились в топах Yandex по достаточно частотным поисковым запросам (попробуйте догадаться сами, по каким именно). Однако, на мой авторский взгляд, этот показатель больше связан с соответствием поисковых запросов названию статей, чем с их истинной ценностью.
Вместе с тем, по моему мнению, полученные значения нормированных показателей дают более адекватную оценку ценности моих статей. И более для меня ожидаемую. Очевидна высокая корреляция между нормированным количеством лайков и закладок. Вместе с тем, для отдельных статей эти значения существенно отличаются.
Кроме того, однажды сотрудник редколлегии ЛАНИТ заметил, что с набором опыта мои статьи стали более качественными. Это улучшение качества статей формально хорошо заметно по росту нормированных показателей с течением времени. Это косвенно подтверждает мой трехлетний опыт участия в конкурсе Технотекст – два последних раза удалось как-то прокрасться в шорт-листы.
Однако дело не в признании моих статей. Вместо признания мне была бы гораздо более ценна их конструктивная критика. Но я хотел бы читать интересные статьи других авторов. И при этом читать статьи, которые имеют высокие нормированные показатели, а не просто большое количество лайков.
Золотые рыбки
26 мая у Хабра был день рождения. 18 лет – совсем юный возраст. Однако, судя по ID в URL на Хабре на начало лета 2024 года собрано более 800 тыс. статей, охватывающих все сферы IT. Сложно даже представить, сколько идей и открытий спрятано в этом океане информации. Но чтобы эти идеи не оказались похороненными в архиве Хабра, для любознательного читателя нужна специальная удочка для ловли этих «золотых рыбок».
Когда-то давно поисковые системы оценивали ценность статей, исходя из соотношения количества совпадения слов в поисковых запросах и в самой статье. Создатели Google и Yandex реализовали другие алгоритмы создания поискового индекса, в основе которых лежал принцип построения индекса цитирования научных статей. Новые механизмы поиска изменили весь мир поисковых систем.
Хабр не входит в перечень научных журналов, аккредитованных Высшей аттестационной комиссией РФ. И слава Богу. Установленные правила к публикации научных статей зачастую прививают стойкое отвращение к их написанию. Хабр позволяет публиковать результаты научных исследований, почти не ограничивая автора в стиле и форме изложения. Что я собственно и делаю, публикуя результаты моих экспериментов исследований по управлению живыми людьми на программных проектах. Бывает, иногда, срабатывают старые рефлексы, и я пытаюсь выразить свои мысли, как того требовали правила публикации в научных изданиях. Однако комментарии недремлющих читателей Хабра быстро приводят в чувство реальности.
Несмотря на это, на мой взгляд, один из возможных путей совершенствования поисковых механизмов Хабра может быть основан на том же принципе цитирования научных статей. Как мне представляется, статья является более ценной, если на нее ссылаются другие статьи Хабра. При этом можно учитывать ценность отдельных ссылок с учетом кармы их авторов.
Мечта
Осознав возможность измерения ценности статей с помощью нормированных показателей, я хотел бы, чтобы поисковые механизмы Хабра позволяли мне искать статьи по этим метрикам за весь период существования этого уникального ресурса, а не только за последние неделю/месяц/год. При этом, так, чтобы начало и окончание интервала поиска я мог выбирать сам. Предвкушаю, сколько интересного и полезного нового чтения может принести такой механизм. При этом, по моему мнению, в выигрыше будут не только дотошные читатели.
Предполагаю, что введение новых метрик оценки ценности статей Хабра приведет к росту количества заинтересованных читателей и существенно увеличит глубину просмотра и среднее время нахождения этих читателей на сайте, что в свою очередь положительно отразится на репутацию Хабра в рейтинге поисковых систем.
Поэтому я прошу всех, сумевших дочитать эту статью, высказать свое мнение о необходимости введения в поисковых механизмах Хабра новых метрик оценки ценности публикуемых материалов.