Она всегда была, есть и будет. Наш отдел по работе с пользователями на регулярной основе работает со статьями, песочницей, пользователями - некоторый контент мы оцениваем и проверяем до публикации, даём редакторские советы (правда, увы, пока довольно медленно, потому что поток большой).
"все равны, но некоторые равнее" в отношении джинсы корпблогов и нетленки редакторов
Над этим мы и наши коллеги из комм. службы работаем - у нас постоянно проходит обучение корп. клиентов и мы прямо по пунктам разбираем "бесячие" ошибки, но вы же понимаете, что многие всё равно сделают по-своему и формально что-то сделать трудно.
С редакторами пообщаемся, передадим замечания.
Вы точно из Хабра!?
Точно, 9 лет в Хабре.
полевого работника компании
Так вижу
Модератор отбирает статьи новых авторов из Песочницы
Ищем, проверяем. Даже у меня есть несколько моих текстов разного формата (не только для Хабра), которые я скармливаю сервисам, + два текста на английском языке (тоже моих), которые позволяют оценить модель. Доходит до смешного: у некоторых сервисов две идентичные попытки дают разный результат.
Есть экспертные методики, они ручные, без API, их не подключить к потоку статей. А вручную даже просто подозрительный объём - очень много. Конечно, инструмент очень хочется и важность его пока будет расти. Но вообще ничего достойного (как, например, у антиплагиатов разных).
"Откровенный трешняк" часто видно невооружённым глазом :-) Поскольку я разгребаю тучи статей в модераторской песочнице, могу вам для коллекции добавить ещё два критерия, которые вызывают большую настороженность и характерны для нейронок:
В тексте непременно повторяется один и тот же тезис, но немного другими словами (бывает, что и три раза) - это очень характерно.
Всегда даётся базовое определение или введение. Особенно смешно читать определение чего-то совсем простого типа "тестирование - это...", "подбор персонала - это..."
Отклоняем очень много такого. Есть те, кто использует более толково. Но, конечно, ничего пока не доказуемо, просто как правило общий уровень статей тоже ниже нуля.
Мы внимательно следим за инструментами такого рода, и все они, уж простите за лексику, лажовые. И этот инструмент также может показать тренд, но не даст точности. И, например, примет за генеративный контент очень «занаученную» статью.
Или, например, я страшно люблю списки в статьях. Использую недуром. Получается, этот признак есть?
Не, ну все набрасываются на несчастный маркетинг, выживают его с Хабра минусами всего и вся, а потом статей хороших мало :-) На самом деле, отчасти шутка, отчасти правда. Так-то статьи есть, но далеко не все авторы хотят участвовать в конкурсе (и так во всех номинациях).
Ситуация не провальная, пока всё - наблюдения. У нас же тоже были соображения для деления статей и они справедливы. Но об этом мы расскажем в подробной статье-ретро (где-то в июне, когда выдохнем).
Кать, проблема в том, что если сеньор напишет для джунов, то это будет очень крутой и очень простой материал. И начинаются вопросы :-) А так да, градация задумывалась именно как "пишет сеньор".
Привет! Да вообще беда - у нас один CTO написал в джуны. А потом выяснили мотивацию некоторых авторов: не я «джун», а написано «для джунов». Идею дальше берем, а реализацию будем менять :-)
Чисто пятничная статья - иногда такая шалость вполне приемлема, тем паче, что автор очевидно знает свою тему (и проблему тоже).
А так - в модераторской песочнице уже было всё: панкейки для айтишников, ахатины, собаки , инопланетяне, новая теория НЕотносительности и даже игрушки 18+.
Списки исправляет модератор, не корректор. Из соображений общего стиля верстки. Чтобы не улучшали, можно просто сказать мне. Записала, не будем :-)
Я написала конкретно про наш блог Хабра, который мы и обсуждаем. К нему есть претензии - излагайте.
Повторять тезисы - это не писать три раза определение или, например, пояснение формулы. Жаль, я такое не скринила - встречу, сохраню.
Она всегда была, есть и будет. Наш отдел по работе с пользователями на регулярной основе работает со статьями, песочницей, пользователями - некоторый контент мы оцениваем и проверяем до публикации, даём редакторские советы (правда, увы, пока довольно медленно, потому что поток большой).
Над этим мы и наши коллеги из комм. службы работаем - у нас постоянно проходит обучение корп. клиентов и мы прямо по пунктам разбираем "бесячие" ошибки, но вы же понимаете, что многие всё равно сделают по-своему и формально что-то сделать трудно.
С редакторами пообщаемся, передадим замечания.
Точно, 9 лет в Хабре.
Так вижу
Модератор отбирает статьи новых авторов из Песочницы
Как и всё, выбрала с помощью слэша в визивиге (причём с мобильника делала даже)
Ищем, проверяем. Даже у меня есть несколько моих текстов разного формата (не только для Хабра), которые я скармливаю сервисам, + два текста на английском языке (тоже моих), которые позволяют оценить модель. Доходит до смешного: у некоторых сервисов две идентичные попытки дают разный результат.
Есть экспертные методики, они ручные, без API, их не подключить к потоку статей. А вручную даже просто подозрительный объём - очень много. Конечно, инструмент очень хочется и важность его пока будет расти. Но вообще ничего достойного (как, например, у антиплагиатов разных).
"Откровенный трешняк" часто видно невооружённым глазом :-) Поскольку я разгребаю тучи статей в модераторской песочнице, могу вам для коллекции добавить ещё два критерия, которые вызывают большую настороженность и характерны для нейронок:
В тексте непременно повторяется один и тот же тезис, но немного другими словами (бывает, что и три раза) - это очень характерно.
Всегда даётся базовое определение или введение. Особенно смешно читать определение чего-то совсем простого типа "тестирование - это...", "подбор персонала - это..."
Отклоняем очень много такого. Есть те, кто использует более толково. Но, конечно, ничего пока не доказуемо, просто как правило общий уровень статей тоже ниже нуля.
У пользователей, к счастью, другое мнение.
Нас раскусили
Я вам могу сказать: в блоге Хабра абсолютно ноль генеративного контента. Мы (авторы блога) не используем нейронки даже для проверки текста.
Мы внимательно следим за инструментами такого рода, и все они, уж простите за лексику, лажовые. И этот инструмент также может показать тренд, но не даст точности. И, например, примет за генеративный контент очень «занаученную» статью.
Или, например, я страшно люблю списки в статьях. Использую недуром. Получается, этот признак есть?
Для чистоты эксперимента - какая доля генеративного контента в блоге компании Хабр? Вот прямо табличку киньте в ответный комментарий.
Просто в каждой категории будет победитель, как и планировалось (если уж только не что-то чрезвычайное).
Не, ну все набрасываются на несчастный маркетинг, выживают его с Хабра минусами всего и вся, а потом статей хороших мало :-) На самом деле, отчасти шутка, отчасти правда. Так-то статьи есть, но далеко не все авторы хотят участвовать в конкурсе (и так во всех номинациях).
0
Ситуация не провальная, пока всё - наблюдения. У нас же тоже были соображения для деления статей и они справедливы. Но об этом мы расскажем в подробной статье-ретро (где-то в июне, когда выдохнем).
Перевели заявку в протоколах (но она была подана именно в ML).
Кать, проблема в том, что если сеньор напишет для джунов, то это будет очень крутой и очень простой материал. И начинаются вопросы :-) А так да, градация задумывалась именно как "пишет сеньор".
Привет! Да вообще беда - у нас один CTO написал в джуны. А потом выяснили мотивацию некоторых авторов: не я «джун», а написано «для джунов». Идею дальше берем, а реализацию будем менять :-)
Чисто пятничная статья - иногда такая шалость вполне приемлема, тем паче, что автор очевидно знает свою тему (и проблему тоже).
А так - в модераторской песочнице уже было всё: панкейки для айтишников, ахатины, собаки , инопланетяне, новая теория НЕотносительности и даже игрушки 18+.