Нейронные сети против цензуры хентая

https://motherboard.vice.com/en_us/article/43ekxg/machine-learning-algorithm-that-uncensors-hentai-porn-deepcreampy
  • Перевод


От переводчика: Этот забавный репозиторий уже с неделю находится в трендах гитхаба, и сейчас у него фееричное количество из 5000 звёздочек и 400 форков — поэтому я подумал, что было бы интересно перевести про него статью, хотя она короткая, да и тематика для хабра не очень стандартная.
Если интересно, в оригинале статьи (ссылка около заголовка) есть ссылки на примеры работы программы.

В Японии порнографические изображения с пенисами и вагинами считаются нелегальными. С начала 1980ых годов сотни людей были арестованы за распространение в сети подобных материалов.


Для того, чтобы обойти этот запрет, художники, рисующие хентай (порнографический жанр аниме и манги), обычно рисуют небольшие полоски или размытие там, где находится запретный контент. Получается, что авторы часто вкладывают много усилий в изображения гениталий, которые никогда не увидят свет в Японии (примечание переводчика: да, именно так это в оригинале и звучит).


Для того, чтобы восстановить изображения, исследователь машинного обучения под ником “Deeppomf” написал алгоритм, который использует нейронные сети для обхода цензуры. Он назвал свою программу DeepCreamPy.


Кто угодно может скачать код и попробовать эту программу — она получила большую известность на Reddit, и некоторые выкладывали там же изображения, которые у них получились в результате обработки. За неделю программа набрала свыше 500 загрузок.


На данный момент DeepCreamPy может убирать цензуру на иллюстрациях с пенисов и вагин. Она пока что не работает на видео, сосках и анусах. Перед запуском программы пользователю нужно просто отметить зелёным цветом соответствующую зону на изображении.


Deeppomf писал мне в емейле, что создание DeepCreamPy является ответом на десятилетия цензуры хентая японским правительством. Статья 175 Уголовного Кодекса Японии запрещает распространение “непристойных” материалов (и хентай явно подпадает под эту категорию) и требует, чтобы порнография была хотя бы частично закрашена чёрными полосками или мозаикой с размытием.


“DeepCreamPy сделана для того, чтобы противодействовать усиливающейся цензуре” — сказал Deeppomf. “Японское правительство, в особенности Верховный Суд Японии, показывает, что они не собираются смягчать свои требования. Так что перемены должны прийти извне”.


Он начал думать о проекте ещё летом 2016, но говорит, что не был первым в идее использовать нейронные сети для убирания цензуры.


“Но я был первым, кто оказался достаточно мотивированным для того, чтобы реализовать эту идею, достаточно умелым, чтобы собрать данные и натренировать нейронную сеть, и недостаточно карьеро-ориентированным, чтобы работать над чем-то, что лучше подошло бы к моему резюме” — так же добавил он.


Всего за несколько месяцев Deeppomf собрал выборку из более чем 100.000 хентайных изображений без цензуры для тренировки алгоритма. Выборка включает яой, юри, фута и “другие фетиши”, как он сказал. Гуро и порнография с фекальной тематикой не были включены в выборку, поскольку могли привести к нежелательным результатам.


“Я не собирал собственную коллекцию порно, поэтому мои персональные пристрастия не имеют значения. Я не видел более 95 процентов изображений, потому что изучать каждое было бы слишком долго” — прокомментировал Deeppomf.


Пока что алгоритм не всегда производит корректные результаты — по крайней мере, на тех примерах, которые предоставляли пользователи — чёрные полоски убираются достаточно легко, но с мозаикой есть проблемы. Впрочем, Deeppomf продолжает совершенствовать алгоритм, а так же хочет добавить туда новый интерфейс и возможность работы с чёрно-белыми изображениями.


“Искусственный интеллект только начал пенетрировать индустрию порно” — говорит Deeppomf. “То ли ещё будет”.


Ссылки


Поделиться публикацией
Комментарии 78
    +7
    Не стал добавлять в статью, но в тему о том «как AI пенетрирует порно идустрию» — чудесная другая статья на хабре «Как AI вставляет Николаса Кейджа в фильмы и делает порно со знаменитостями». Мопед не мой, но рекомендую, если пропустили.
      0
      Работать-то работает, но остаются непонятные зелёные разводы.

      Зацензурено

      Расцензурено

      Оригинал
        +44
        Возможно, в обучающей выборке было слишком мало эклеров.
          0
          Код открытый, данные открытые. Дообучи декодер и выложи
            0
            Дело не в модели, а в том, что зелёным цветом для программы помечаются зацензуренные места. Сама она их не ищет.
          +16
          Нельзя распространять порнографию, но можно распространять алгоритмы, создающие порнографию.
            +10
            Просто до политиков пока не дошло, что оказывается порно можно создавать по каким-то там алгоритмам. Лет через 5-6, когда технология станет массовой, запретят и её.
              +6
              Лет через 5 нейросеть будет сама рисовать порно по ключевым словам. А через 10 — еще и видео генерировать по текстовому сценарию.
                +9
                А еще через пять — генерировать законы которые все это запрещают
                  0

                  А сейчас что, не так?

                    +1
                    Там выборка так себе, которую по сути даже не выбирали.
                  +1
                  Порнодемосцена. Полнометражка для взрослых в 64 Кб.
                  0
                  Как бы из-за «по каким-то там алгоритмам» их все не запретили)
                  Правительству они и так не нужны, оно без них работает)
                  0
                  Достаточно сделать тьюринг-полный видеокодек, и можно будет совсем не париться.
                    +7
                    Говорят, в древние времена что-то такое существовало. По крайней мере, первые выпуски «Масяни» и «Магазинчика Бо» удивительным образом влезали на 1.44 дискетку. Более того, сам «кодек» мог быть завёрнут в exe вместе со всем роликом, и это всё ещё влезало на дискетку!
                    Вот это был кодек так кодек, JS+Canvas по сравнению с этим просто костыльное, кривое, прожорливое, раздутое убожество.
                      +1

                      Масяня и «магазинчик» же векторные были, их скорее можно сравнивать с SVG + @keyframes...

                        +1

                        Но ведь Масяня и Бо были векторными, не?

                          +2
                          И называлось это Flash? :)
                      +20
                      Ну хоть кто-то делом занят!
                        +30
                        Как всегда. Порно двигатель прогресса.
                          +10
                          Как ни странно — да. На реддите это активно обсуждают, материала ещё на полноценную статью…
                            +2
                            Война и порно, да именно так!
                              +1
                              Тогда уж первопричины: Зависть и Лень.
                            +12
                            Господи, ты услышал мои молитвы
                              +14
                              Всякий раз, когда вижу стоны по вопросам обязательного замыливания, не важно, лиц или других частей тела, думаю: почему не сделают алгоритм, обеспечивающий детерминированную генерацию квадративков с сохранением большей части информации? То есть смотришь глазами — картинки нет, а специальный алгоритм без проблем восстанавливает всё «как было».
                              Пример алгоритма: внутри квадратной области, скажем, 16*16, перемешиваем пиксели местами по определённому и обратимому способу. Затем, чтобы не получилось яркое пятно, все три канала цвета смещаем к белому или чёрному, а значение смещения прописываем в неиспользуемый альфа-канал. И всё.
                                0
                                обеспечивающий детерминированную генерацию квадративков с сохранением большей части информации?

                                Потому что это никому не нужно?
                                А для простого размытия по гауссу и так есть куча наработок.
                                habr.com/post/152885
                                habr.com/post/136853
                                habr.com/post/324052
                                habr.com/post/147828
                                habr.com/post/424987
                                habr.com/post/130198
                                  +1
                                  Мысль неплохая!
                                    +9
                                    Один мой знакомый видел плашки, в которых был просто инвертирован цвет.
                                      +6
                                      Давно сделали. Очень давно находил программку для «кодирования»/«декодирования» такой цензуры и именно для японии. Там даже было несколько алгоритмов. Но видимо очень мало кому охото с этим париться, поэтому не прижилось…
                                        +1
                                        думаю: почему не сделают алгоритм, обеспечивающий детерминированную генерацию квадративков с сохранением большей части информации?


                                        www.computerra.ru/180360/pixelize-it

                                        Продавать японцам лишённый пиксельной цензуры контент (такой есть, потому что его отправляют на экспорт) — самое прямое и, можно сказать, банальное решение задачи. Но признаюсь, лично я был поражён, когда узнал, что только этим дело не ограничивается. Вместе с партиями компактов у тех же торговцев часто изымают оригинального вида электронные устройства, предназначенные для… ну, вы догадались, для снятия пикселизации с картинки на экране ТВ.

                                        Заголовок спойлера
                                        image

                                          0

                                          gmask

                                            0
                                            почему не сделают алгоритм

                                            Ну я когда-то давно сделал такое расширение для G+, когда гугловские роботы стали цензурировать картинки обнажённых дам. Перед тем как выложить в группу картинку, прогоняешь её через расширение, и оно выдаёт её в перемешенном виде 16x16. Информация о том, как было перемешано, сохранялась в EXIF, который гугл не калечил при сохранении. Восстановление тоже работало, расширение само находило такие фотки в ленте и автоматически их восстанавливало.

                                            В итоге, роботы не понимали что на фотке, а пользователь с установленным расширением видел всё ).
                                            +7
                                            Вот видите, а тут у наших чиновников обнаружилась прозорливость — они запрещают аниме и хентай целиком. Попробуйте восстановить картинку из полностью зеленого квадрата!
                                              +8
                                              «Возьми ещё этих манящих чёрных квадратов, да залей зелёным»
                                                –1
                                                .
                                                  0
                                                  раржпег
                                                  +2
                                                  Как пример борьбы с этим законом внутри страны, можно рассматривать всякие пиксельные хентайные игры, которые всё набирают и набирают популярность.
                                                  Так как цензурить там нечего.
                                                  Даже на ютубе прохождение этих игр не всегда цензурят.
                                                  Tobihime (или Flying Princess другое название) например.
                                                  Этакий Angry Birds 18+
                                                    +11
                                                    Я до сих пор не сильно понимаю, зачем цензурить порно. Я еще понимаю, когда в обычном кино или мультике цензурят всякое, ну мало ли кто будет смотреть… Но цензурить порно… Зачем, какой смысл? После наложения квадратиков сразу становится непонятно, что происходит?
                                                      +2
                                                      Я бы поискал ответы, но не на рабочем же компьютере?
                                                      Возможно этому закону предшествовали какие-нибудь исследования, а возможно это просто ещё один выверт японского менталитета.
                                                      Помню читал одну статью в одном журнале околокомпьютерной тематики.
                                                      Хм… журнал точно сохранился, но с моим запасом макулатуры — это всё равно, что искать иголку в стоге сена.
                                                        0
                                                        вообще-то, 90% того, что в интернете по данной теме скачивают — это сканы с печатной продукции, а вот уже её — проверяют на предмет наличия черных плашек на типографиях (по крайней мере те типографии, которые не хотят себе иметь потом проблем).
                                                          +4
                                                          Цензура это конечно плохо. Но с другой стороны — может именно цензура виновата в том, что японское порно стало таким, каким оно сейчас является. Табу не на все эротические работы в целом, а только на изображение половых органов могло привести к тому, что стали к этому подходить максимально творчески. И мы имеем и глубокие сюжеты, и шикарные визуалы и невероятный набор всевозможных фетишей и так далее, что не особо то наблюдалось за пределами зацензуренного архипелага островов. И ведь именно особый интерес к расцензуриванию именно японского эро контента, а не какого-либо другого.

                                                            0
                                                            именно цензура виновата в том, что японское порно стало таким, каким оно сейчас является.

                                                            Я статью читал на эту тему.
                                                            Вы правы. )
                                                            +2
                                                            Но цензурить порно… Зачем, какой смысл? После наложения квадратиков сразу становится непонятно, что происходит?

                                                            Если вам действительно все понятно на порно с квадратиками — то какая вам разница цензурят или нет?

                                                            Мне вот порно с квадратиками не интересно.

                                                              +1
                                                              Не знаю как в других странах, а у японцев благодаря этому можно торговать данной продукцией хоть в ближайшем хоз. маге.
                                                                +2
                                                                Часть порно снимают понарошку и цензура даёт это скрыть, а статья в УК появилось под влиянием Запада (ханжей-пуритан) во время Реставрации Мэйдзи.
                                                                  +1
                                                                  Это просто абуз кривых формулировок в законах. То есть с квадратиками — это как бы уже не совсем порно, а всего лишь эротика, которую можно свободно продавать, если прилепить наклеечку «18+».
                                                                  Законы эти изначально были Японии навязаны, поэтому они и прописаны «на отвали» и править их никто особо не спешит, т.к. по большей части всем пофиг.
                                                                    0
                                                                    Особенно удивляет «усердие» по наложению этих квадратиков. Зачастую они вообще ничего не закрывают. Чисто для галочки квадратика.
                                                                    0
                                                                    Скажем идея хорошая.Те же гейм-погромисты из Ниппон обожают производить порно-новелы для пк. Почему собственно не подключить подобный сервис, поиграл, вытер руки от белка и дальше заниматься делами.
                                                                      +5
                                                                      на самом деле гениально… сделать сайт с порно, но нейросеть будет квадратить все «нецензурные» места. Можно спокойно пройти любую проверку любого законодательства — сайт не содержит материалов с нецензурными изображениями. А пользователям продавать или распространять приложение/плагин с отдельной фирмы «восстановления поврежденных фото и видео материалов» который будет обратным алгоритмом восстанавливать на лету все фото и видео участки, измененные нейросетью. И предъявить тут некому и нечего. Сайт не распространяет порнографию — пользователь сам «крутой хакер» и взламывает картинки (к нему они приходят зацензуренными) — все вопросы к нему, но обычно частный просмотр не запрещен, только распространение запрещено)
                                                                        +2
                                                                        Что мешает просто «перемешать» пикселы в однозначно определенном порядке, а пользователю поставить плагин, «перемешивающий» их обратно? Что-то в Вашей идее не вяжется — думаю не все так просто. Тот же JPG файл при просмотре через notepad не несет какой либо информации — но это не значит, что его можно распространять…
                                                                          0
                                                                          Можно сохранять оригинальные куски и (или) алгоритмы по их восстановлению прямо в EXIF зацензуренных картинок.
                                                                            +5
                                                                            Или просто включить фантазию!
                                                                              0
                                                                              Как это ни странно, но да. Беглый взгляд на репу показал, что NN не делает различия в контексте изображения. т.е. не учитывается, что и как изображено. Возможно автор имел ввиду совершенно другое, а сетка дорисует только то, чему обучена, а ведь могла бы дать оценочное суждение правдоподобия восстановленного изображения.
                                                                              0
                                                                              А потом кто-то прежмет/перепостит чем-то, что в EXIF не умеет, и фсьо, прощай удовольствие)
                                                                              В таком случае имхо нужно делать специальную разметку на зацензуреной области, уточняющей как это декодировать. Что-то типа цензурирующего QR.
                                                                                +2
                                                                                нужно делать специальную разметку на зацензуреной области, уточняющей как это декодировать.


                                                                                В это место просятся DRM-решения на базе блокчейна в форм-факторе «умных очков». Необходима четкая дифференциация, кому доступно расцензурить зацензуренное, а кому нет. Кому видеть мир без рекламы, а кому с ней…
                                                                                  0

                                                                                  Вот не надо тут!

                                                                          +1
                                                                          Ну наконец-то
                                                                            +10
                                                                            Надо на черный квадрат Малевича нейронную сеть натравить.
                                                                            Воссоздаст ли она битву негров ночью в пещере?
                                                                              +26
                                                                              Если её тренировали на указанной в посте выборке — скорее всего, она воссоздаст что-то совсем другое.
                                                                                +1
                                                                                Так как сеть скорее всего берет данные из картинки, то там с высокой вероятностью будут негры. Ну и слово «битва» можно интерпретировать достаточно широко, была бы фантазия. Так что вполне возможно что именно «битву негров» нейросеть и выдаст…
                                                                              +1
                                                                              Она пока что не работает на видео, сосках и анусах.

                                                                              Насколько я знаю, анусы никто не цензурирует в японских артах.
                                                                              Да и соски, я видел, не особо тоже.
                                                                                +1
                                                                                Из официальной документации — «censorship of nipples» и «censorship of anus» — так что вряд ли я ошибся. Ну разве что там было что-то про РКН. Возможно, вы смотрите слишком мало хентая.
                                                                                  0
                                                                                  В твиттере постоянно есть изображения с открытыми сосками и сфинктерами, но перечеркнутыми гениталиями. Примеры кидать не буду smh.

                                                                                  А если говорить про хентай, то там конкретно запикселенная(размытая) цензура. В переводе выше вроде говорится про рецензуру полосок EDIT: Окей, про пиксели тоже. Но пиксельную цензуру я вижу гораздо реже, чем полоски. А полоски используются в артах, додзинси и т.п.; здесь мы возвращаемся к предыдущему сообщению.
                                                                                  0
                                                                                  Она пока что не работает на видео, сосках и анусах.

                                                                                  Да сосков полно даже не в хентае, а в обычном аниме, и часто в эфире на больше части каналов их нету, а на некоторых есть. Не говоря про дисковые версии… Может им просто долго ждать выхода на дисках, а хочется прям сейчас увидеть женскую грудь без цензуры?


                                                                                  А так да, и анусов полно когда они не используются.

                                                                                    0
                                                                                    Думаю, что речь идёт о сосках и анусах в том случае, когда с ними взаимодействуют «запрещённые» члены и вагины. Ведь под полоски (или замыливание) попадает всё, что находится в области контакта.
                                                                                    0

                                                                                    Идея хороша. Если продолжить развитие — то данная программа сможет убирать любую цензуру, не только из мультфильмов, но и параноидальное закрашивание сигарет в России и подобный бред, существующий по всему миру. Когда проект достаточно разовьётся и сможет убирать цензуру в реальном времени — предсказываю данному проекту большое будущее и кучу запретов.

                                                                                      +3
                                                                                      Про статью вообще:
                                                                                      Там ссылка на тренды кидает в тренды. ИМО, лучше этот факт заменить скриншотом, а ссылку дать на саму репу. Потому что через год-два по ссылке уже может и не быть этой программы в топе.
                                                                                      Я думаю каждый в интернете натыкался на пятилетней давности посты с хабра, верно.
                                                                                        0
                                                                                        Да, лучше сделать и то и другое — скрин в качестве пруфа, и ссылку для тех, кто не знает про эту фичу. Спасибо.
                                                                                        +1
                                                                                        It does NOT work with:
                                                                                        Black and white/Monochrome image
                                                                                        Большая часть зацензуренного контента в B&W, зачем они начали с цветных изображений, они разве не заведомо сложнее?
                                                                                          0
                                                                                          Согласен с одним комментатором с реддита:
                                                                                          WHY DID WE NOT NAME THIS «OppAI»!?!?!
                                                                                          Come on man we missed a golden opportunity for this one.
                                                                                            –6
                                                                                            Плюсую!
                                                                                            (Не могу голосовать)
                                                                                              0

                                                                                              Судя по статье, до туда алгоритм ещё не дотягивается.


                                                                                              Она пока что не работает на видео, сосках и анусах.
                                                                                              +1
                                                                                              Боже… Да его канонизировать нужно.
                                                                                                0
                                                                                                Эхх, когда хочешь заняться нейросетями, но не переносишь питон, может хоть на этот раз?
                                                                                                  0
                                                                                                  Это была одна из самых величайших потерь, которые понесло искусство Возрождения. В 1857 году папа Пий X решил, что чрезмерно точное воспроизведение мужского тела может пробудить похоть у обитателей Ватикана. Поэтому, вооружившись резцом и киянкой, он собственноручно срубил гениталии у всех мужских скульптур. Папа изувечил шедевры Микеланджело и Бернини. Нанесенные скульптурам повреждения были стыдливо прикрыты алебастровыми фиговыми листками.


                                                                                                  Столько возни изза ханжей, такая прелесть а. Хотя при всем при этом у японцев есть множество вещей которых бы ввели наших и даже европейский ханжей в такой ужас…
                                                                                                    0
                                                                                                    Хоть одна хорошая новость
                                                                                                      0
                                                                                                      Вот только чтобы этой нейронной сетью воспользоваться, придётся сначала самому поработать — замазать цензуру зелёным цветом. В итоге трудов получается больше, чем пользы. Проще собственную нейронную сеть головного мозга использовать, чем эту…
                                                                                                        0
                                                                                                        Это фантазию что-ли?

                                                                                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                                                      Самое читаемое