Кажется логичным: если вакансия слишком длинная. Прозрачные процессы легко описать кратко. Хаос, микроменеджмент и плохую культуру приходится маскировать словесным шумом. На графике связи между длиной текста и индекса токсичности мы видим линейную зависимость.

Корреляция настолько чёткая, что хочется вывести простое правило: чем длиннее вакансия, тем выше риск.
Но это ловушка. Если мы сделаем такой вывод, то совершим главную ошибку «лимонного рынка» — примем часть правды за всю правду. Как только мы посчитали отношение длины текста к зарплате картина меняется, а значит прошлое предположение было слишком упрощенной и неверной моделью.
Это статья не про простые правила, она про то как увидеть сложность рынка труда.
А значит — и про то, что на один только Индекс Шивы ориентироваться нельзя.
Данные
Данный материал опирается на методологию и логику, описанную в предыдущей статье.
Объектом анализа стали 48 586 вакансий, агрегированных с HeadHunter и Habr Career. Подробнее о датасете можно прочитать здесь.
Технические подробности
Для анализа зависимости токсичности от длины использовался расширенный массив (146к), а для расчета самого Индекса — 48 586 вакансий с указанной зарплатой».
Для обеспечения корректности статистического анализа и устранения влияния технических факторов (HTML-разметки) на показатели объема текста, все описания вакансий прошли процедуру синтаксической нормализации .
Алгоритм обработки:
Декомпозиция DOM-структуры: исходный HTML-текст описания обрабатывался с использованием парсера
BeautifulSoup4. Теги удалялись, извлекался только плоский текст.Разрешение склеек лексем: в качестве разделителя использовался
\n. Это критично: часто текст внутри</li>и последующего тега<p>склеивается, если просто удалить теги, что нарушает семантическую целостность.Регуляризация: очистка от дублирующихся переносов строк и граничных пробелов (
.strip()).Расчет объема: итоговый показатель
desc_length— количество символов в полностью нормализованной строке.
Что такое Индекс Шивы?
Индекс Шивы — коэффициент, отражающий соотношение объема текстовой информации (символов) в вакансии к предлагаемому материальному вознаграждению (зарплате).
Количество символов «чистого» описания вакансии, которое работодатель «продает» кандидату за каждую 1000 рублей зарплаты.
Где:
Clean Text Length — количество символов в описании вакансии без мусора и тегов.
Salary — предлагаемая зарплата на руки.
1000 — коэффициент масштабирования для удобства восприятия.
Много текста — это подробные требования или бюрократический шум? Хорошо, когда он низкий или, наоборот, высокий?
Рассмотрим график, на котором каждая точка — реальная вакансия:

Зелёные точки: «Безопасные» (рейтинг 4—5, соответствует Индексу Токсичность < 22.5).
Красные точки: «Токсичные» (рейтинг 1—2, соответствует Индексу Токсичность > 27.8).
Линии тренда идут практически параллельно на всём протяжении зарплатной шкалы, и красная линия (Toxic) стабильно выше. Разрыв между ними — это в среднем 400–600 лишних символов при той же оплате. Важно отметить, что разброс точек колоссален — рынок неоднороден.
Гипотеза: Избыточный текст является не полезной информацией, а «шумом», снижающим прозрачность контракта.
В описании вакансии конечное число параметров, важных для принятия решения: что делать (задачи), чем делать (стек/инструменты), за что (условия). Всё, что сверх этого — попытка замаскировать суть.
Индекс Шивы — это метрика не качества текста, а плотности ценности на символ.
Нелинейность индекса
Проверим корреляцию Индекса Шивы с Индексом Токсичности.

График выявляет интересную структуру рынка:
1. Зона «Элита» (Индекс Шивы ~25)
Текст лаконичен, деньги серьезные. Это рынок профессионалов, где слова имеют вес. Работодатель понимает, кто ему нужен, и не тратит время на лирику.
2. Зона «Контракт»
Математика Индекса Шивы объединяет в этой категории два совершенно разных типа вакансий, имеющих одинаковое соотношение «Текст/Деньги»:
«Спецификация» (Низкая токсичность). Сложные инженерные, научные или юридические вакансии. Длинный текст оправдан регламентами и допусками.
«Бюрократия» (Высокая токсичность). Обычные вакансии, которые могли бы быть короче, но искусственно раздуты из-за плохих процессов в компании, даже при высокой зарплате. Именно наличие второй группы «обычных, но раздутых» вакансий тянет средний уровень токсичности вверх.
Нельзя только по Индексу Шивы понять, читаете вы необхо��имую техническую документацию или бюрократический спам. Нужен контекст.
3. Зона низкого индекса
Почему низкий индекс оказался токсичным?
Работает принцип: «Отсутствие информации — это скрытый риск».
Серая зона: объявления в духе «Заработок от 100к, работа 2 часа в день». Текста мало, обещаний много. Высокая токсичность здесь обусловлена мошенническим паттерном.
Мясорубка: вакансии для массового линейного персонала, где человека воспринимают как расходный материал (курьеры-однодневки, грузчики в серых схемах). Работодателю всё равно, кто придет, текучка бешеная, поэтому описание условий минимально.
C-Level и Директора: это вакансии с огромной зарплатой и очень коротким описанием. Топ-менеджеру не пишут инструкций, ему ставят цель: «Прибыль X2 за год». Однако массовый сегмент своим объемом перекрывает эти малочисленные случаи.
Карьерная лестница, культура и Индекс Шивы

Эффект грейда
Intern + Junior: самые «многословные» относительно зарплаты. Здесь работает презумпция некомпетентности. Так как новичок не имеет остаточного опыта, вакансия превращается в подробную инструкцию по эксплуатации сотрудника. Кроме того, из-за низкой зарплаты работодатель вынужден «продавать» вакансию через описание нематериальных выгод: обучение, менторство, «строчку в резюме».
Middle -> Senior: индекс слегка подрастает (с 25.87 до 26.81). Зона «Разрастания функционала». Сеньорам платят больше, но и требуют от них кратно больше. Именно здесь появляются списки стека технологий на 20 пунктов. Зарплата растет, но объем требований растет еще быстрее.
Lead / Top: Резкий обрыв вниз. Здесь парадигма меняется на презумпцию компетентности.
Джуну: «Копать от забора до обеда лопатой X».
Лиду: «Нужен ров. Бюджет такой-то».
Типы культуры в свете Индекса Шивы
Клан: отношения строятся на эмоциях и лояльности. Текст вакансии раздувается за счет описания ценностей, атмосферы и тимбилдингов.
Иерархия: описания длинные, потому что они должны соответствовать регламентам, профстандартам и внутренним нормативным актам. Это не про эмоции, это про формализм. Текст — страховка «на всякий случай».
Адхократия: ненавидит бюрократию (поэтому текста меньше, чем в Иерархии), но работа здесь часто уникальна и сложна (поэтому текста больше, чем в Рынке). Баланс: работодатель продает не «семью» и не «регламент», а «вызов». Описания сфокусированы на задачах и стеке технологий.
Рынок: «сухая конкретика». Компании рыночного типа (часто это продажи, агрессивный консалтинг) не тратят время на лирику. Транзакционная модель отношений: «Ты нам результат — мы тебе бонус». Минимум текста, максимум цифр.
Индустриальный срез

Синяя и зеленая зоны — HoReCa и Логистика:
Транзакционные рынки. Высокая текучка, быстрый найм и понятные, стандартизированные задачи. Никто не пишет эссе о миссии компании, когда нужен водитель.Желтая зона — Финансы, Стройка, B2B:
Текста ровно столько, сколько нужно, чтобы обозначить условия. Четкие KPI и условия вознаграждения. Деньги любят счет, а не лирику.Оранжевая зона — IT & Телеком:
Высокооплачиваемые сферы, но высокий индекс, который, скорее всего, связан с раздуванием функционала. «Лишний» текст — часто бессмысленный перечень технологий («знание всех версий Linux»), копипаст требований. HR часто не понимают сути работы и страхуются, добавляя ключевые слова по принципу «чтобы было».Красные зоны — Медицина и Госсектор:
Медицина и Образование: высокий индекс часто оправдан регуляторикой. Врачу или преподавателю нельзя просто написать «лечи людей». Нужно перечислить сертификаты, допуски, соответствие приказам Минздрава или ФГОСам.
Госсектор: бюрократия + низкие зарплаты
Индекс Шивы — сложный и бесполезный?

Если метрика зависит от кучи факторов (грейда, индустрии, культуры), не является ли она ещё одним бесполезным числом? Этот индекс — просто любопытное число, на которое можно только посмотреть?
Практический смысл Индекса Шивы раскрывается не в абсолютных значениях, а в контексте и сравнении.
Индекс Шивы не дает простых ответов «Иди сюда, не иди туда», но всё же имеет смысл. Его сила — не в диагнозе, а в выявлении симптомов для дальнейшего анализа.
Использование индекса:
1. Индикатор скрытой инфляции (Экономический смысл)
Если зарплаты в секторе стоят на месте, а Индекс Шивы растет (тексты удлиняются), значит, реальная стоимость труда падает. Работодатель пытается получить больше компетенций за те же деньги. Это маркер того, что рынок становится «душнее».
2. Тест на управленческую зрелость
Высокий индекс на позициях Senior/Lead — математический маркер микроменеджмента. Если вместо целей пишут инструкцию на три страницы, в этой компании не умеют делегировать результат, только контролировать процесс.
3. Укрепление переговорной позиции
В мире серьезной аналитики всегда остается место для простого человеческого любопытства. В какой-то момент жизни становится критически важно узнать, кто ты из феечек Winx... или какую «цену в буквах» ты платишь за чтение своей вакансии.
А если серьёзно: быстрый расчёт Индекса Шивы не делит предложения на «плохие» и «хорошие» — это было бы упрощением. Он даёт конкретный аргумент. Если цифра аномально высока для вашего грейда и индустрии, у вас появляется основа для вопроса на собеседовании: «Я вижу, описание задачи очень детализировано. Это связано со спецификой проекта или отражает общий уровень формализации процессов в компании?» Он помогает перевести интуитивное ощущение «что-то не так» в предметный разговор.
Получив конкретную цифру, сравните её c показателями по индустрии и грейду. Любое сильное отклонение — вверх или вниз — это не оценка, а сигнал. Выше нормы — вопрос о бюрократии и ценности вашего времени. Ниже нормы — вопрос о транзакционности и глубине контракта. Если в рамках — суровая рыночная норма.
Индекс не даёт ответа, но чётко показывает, в каком именно месте его нужно искать.
