Комментарии 7
Исследование было полезным и его надо было публиковать, changemyview =)
Лучше бы машины копали канавы и таскали кирпичи не хуже (и не дороже) людей. А то роботы скоро и конфеты есть за меня будут.
Reddit, добавил юрисконсульт, усиливает инструменты выявления неаутентичного контента и добивается привлечения исследователей к ответственности.
Многие, почему-то продолжают притворяться, что живут в мире, где всё понятно: вот чат джипити статья - это сразу видно, а вот сгенерированная на компьютере тётка в купальнике - очевидно же. Эта гадость заполонила интернет, но с ней просто нужно бороться - банить пользователей и удалять контент.
В подобной цепочке мыслей есть небольшая проблема - изображения неотличимые от реальности и не детектируемые человеческим глазом можно было создавать ещё до появления генеративных нейросетей, хоть и с большим трудом. А теперь это вдруг это перестало быть возможным? И по-видимому с прогрессом диффузионных и других моделей это с каждым месяцем становиться всё невозможнее и невозможнее.
Несколько лет назад появились инструменты детекции, которые по природе своей никогда не будут лучше в детектировании, относительно моделей которые генерируют тексты, потому что они и есть эти модели генерации, т.е. они не найдут некие скрытые последовательности в ряду слов или вероятностное распределение использования слов, которые точно указывают на то что это LLM, если для генерации используется самая совершенная на сегодняшний день модель. Да и люди давно уже научились писать промты, чтобы обойти все возможные косвенные признаки по которым можно даже теоретически отличить машинный текст от человеческого. Т.е. я считаю, что уже наступили времена, когда если какому-нибудь суперинтеллекту представить группу из пар текстов: человеческий и машинный сгенерированный специальным промтом, то суперинтеллект не сможет найти признаки которые позволят надёжно отделять одно от другого.
"Борьба" с генеративным контентом по большей части закончена - машины победили. Можно лишь бороться с долей совсем уж безалаберного сгенерированного контента или где понятно, что ни один художник человек не взялся бы реализовывать то или иное произведение, потому что соотношение технической сложности создания к потенциальной выгоде от произведения слишком велико, либо когда очевидно, что это физически невозможно для человека создать произведение за невероятно короткий срок от появления запроса на него до реализации этого запроса. Либо, когда контент сгенерирован легкими бесплатными моделями, но он технически сложен, т.е. опять же со стороны человека нет ровно никаких усилий, чтобы спрятать факт использования нейросети. Но мне кажется борьба с таким видом контента бессмысленна, потому что тому, кому по тем или иным причинам действительно важно, чтобы его контент не приняли за созданный нейросетями, сможет этого достигнуть и именно он потенциально нанесёт наибольший урон обществу. Т.е. например различные агенты влияния, мошенники, да и просто люди которые получают деньги за созданный контент.
Пресечь публикацию научной статьи по этому эксперименту, поскольку её выводы были получены неэтичным путём.
Неэтичные эксперименты 1930-1940 гг.: "Ну мы тут медицинские эксперименты на людях ставим, воздействие ядов и пыток смотрим, как со скотом обращаемся."
2025: "Мне на реддите, куда я сам пошел, промыл мозги не человек, а машина."
Предоставить любую компенсацию и помощь, которую университет сочтёт нужной.
Вы бы еще от телевизора за за...сорение мозга компенсации потребовали.
Вместо бана аккаунтов, надо было их заставить подписать каждый комментарий как ИИ и ссылку, ведущую на разбор этого случая, поучения по неэтичному поведению; и как натуральную выставку оставить. Но у тех, у кого наипервейшая реакция "зопретидь, да забанить!!!" разговаривать, обычно, не о чем.
А в чём ужас ужас ужас? Я исхожу из того что на какой-нибудь пикабушке, диалог с рядом собеседником будет меня полезным и достоверным чем с дипсиком. Галлюцинировать на темы которые не знают и не могут не хуже. И параметр понижения температуры не прикрепить.
И нейтральность никто не гарантирует- там может быть ципсо, троль из Ольгина, может быть вторая третья десятая учётка специалиста по управлению имиджем какого-то бренда. А может быть просто идиот соскажённой картиной мира
Четыре месяца дебатов реддиторов и ботнета на языковых моделях показали: машины спорят не хуже людей