In4in Nov 28 2024 at 02:46

Как спрятать любые данные в PNG

Easy

3 min

53K

JavaScript*Information Security*

Tutorial

+127

Comments 89

Hasumutas Nov 28 2024 at 03:11

Спасибо! Оставлю в закладки

nfire Nov 28 2024 at 05:39

Как показала практика современного интернета - лучше распечатать.

dontcheckinginfo Nov 28 2024 at 16:36

на фотоплёнку в подземное хранилище © ms

Q3_Results Nov 30 2024 at 14:47

Я взял за привычку особо ценные статьи печатать в pdf, мало ли что

Wolf4D Nov 28 2024 at 03:24

А чем ваш подход отличается от обычной стеганографии?

vis_inet Nov 28 2024 at 03:42

Это она и есть.

Технические реализации могут быть разными, естественно.

unC0Rr Nov 28 2024 at 07:13

Тем, что это не стеганография. Задача стеганографии в сокрытии самого факта существования скрытой информации, даже если известен алгоритм сокрытия. Тут ничего подобного, банальное подмешивание в младший бит, даже на хабре уже десятки статей по этому методу.

aimoroz Nov 28 2024 at 11:26

А разве есть способ отличить скрытое таким способом сообщение от шума?

In4in Nov 28 2024 at 11:27

Шум должен быть естественный. Любой шум там, где его не должно быть - уже сам как признак.

aimoroz Nov 28 2024 at 12:55

Согласен. Готовить сообщение к сокрытию тоже надо с умом.

Wesha Nov 29 2024 at 09:09

Так зипуете перед сокрытием.

HellSage Nov 29 2024 at 17:52

А как отличить шум естественный от неестественного?) А что если речь идет о пограничных значениях EbNo? Какой конкретно тип канала связи будет использоваться, какой корректирующий тип кода будет использоваться итд итп. Все это очень сложная инженерная задача, которая не решается одной идеей о замене младших битов в ргб канале.

KongEnGe Nov 28 2024 at 11:36

Ставлю на то, что энтропия наружу вылезет при простейшем статистическом анализе, показав сжатие меньшее типового.

SeanT Nov 29 2024 at 07:05

Превращение того же jpeg в png проходит по разным алгоритмам с разным размером в итоге, так что размер не демаскирующие фактор. При большом размере скрываемого размер png может быть очень большим. Сам факт наличия нескольких всегда крупных png файлов вычисляется легко и подозрителен. Перед записью в файл данные следует зашифровать, так что если пароль будет разный, то даже дни те же данные будут шуметь различно. Сам файл можно заподозрить лишь по факту существования, испортить или удалить. Но мр3 для стеганографии удобен не меньше. Да и в jpeg можно много спрятать при старании

seepeeyou Nov 28 2024 at 22:12

Задача стеганографии в сокрытии самого факта существования скрытой информации, даже если известен алгоритм сокрытия.

А это как? Если есть 100 картинок и в одной из них с помощью стеганографии скрыта информация, при известном алгоритме разве нельзя все их проверить и найти ту самую?

unC0Rr Nov 29 2024 at 07:05

Тут как в криптографии: известен алгоритм, неизвестен ключ - секретная часть, обеспечивающая скрытность. Алгоритмы в стеганографии создают таким образом, чтобы без знания ключа невозможно было не только прочитать скрытую информацию, но даже определить, в какой именно из этих ста картинок что-то спрятано.

Innominatam Nov 30 2024 at 03:20

На ум приходит, например, такое же складывание информации в младшие биты, но не операцией "or" в очищенный бит, а операцией "xor" в оригинальный. Ключом к получению информации станет оригинал картинки. Думаю, что будет достаточно сложно найти факт замешивания информации и еще сложней ее выцепить (если картинка для хранения информации была фотографией, конечно)

unC0Rr Nov 30 2024 at 09:36

Теряется смысл стеганографии - скрытый обмен информацией через открытые каналы, т.к. в такой схеме вам всё равно нужен скрытый канал для передачи оригинала картинки.

poro_ku Nov 28 2024 at 04:10

А в качестве второго дна можно использовать картинку с куаркодом.

massdriver Nov 29 2024 at 04:07

Со ссылкой на рикролл?

Vah-tang Nov 28 2024 at 04:20

Уж не знаю как с точки зрения вульгарного прагматизма, но с художественной точки зрения "это красиво". Прям напомнило, как в эпоху DOS и дефицита оперативки, восхищались, решением кешировать оперативные данные в видеопамять, которая в текстовом режиме "все равно простаивала" .

RolexStrider Nov 28 2024 at 06:49

Эх, а во времена ZX-Spectrum (вот где реальный дефицит памяти был!) некоторые программы часть своего кода и данных в видеопамяти держали! Например, ленточные копировщики. Вот на этом скриншоте под цифрами "44032" и серым фоном - часть данных копируемых файлов (но они невидимые, потому что цвет фона и "текста" в этих "знакоместах" (т.н. атрибутах) совпадают. Да еще эти данные и сжимались на лету прямо в процессе чтения с ленты. Каким-то очень простым алгоритмом, что-то вроде RLE, но в реальном времени при чтении с ленты - на 3,5Mhz это было невероятно (и цифры вот эти тоже кстати в реальном времени в процессе чтения менялись)

boulder Nov 28 2024 at 08:01

Гораздо интереснее было при изучении пентамино располагать область памяти для расклада прямо по адресу атрибутов. Таким образом удавалось видеть перебор вариантов на экране в реальном времени, совершенно не тратя дополнительные ресурсы на вывод! :)

ImagineTables Nov 28 2024 at 06:50

А принцип «видеопамять == write-only» потом появился, с аппаратными ускорителями? Видеопамять никто не проектировал для чтения, и чтение из неё тормозит, так было написано во всех учебниках по графике.

NickDoom Nov 28 2024 at 10:54

Да она и тормозила :) Всё равно лучше, чем с MFM-харда или дискетки подгружать :)

А ещё были специальные платы памяти, которые эти же адреса занимали нормальной оперативкой. Правда, всё равно через шину, но даже это лучше, чем ничего :) Текстовый режим — работаем с этой платой, графический — с видеопамятью.

Самое интересное — дровишки, вестимо. Как оно там всё работало, переключалось и т. д. Было бы неплохо отреверсить — но пока я там всплеска энтузиазма не вижу.

woodiron Nov 28 2024 at 05:05

Очень интересно. Писали, что современные копиры оставляют какие-то невидимые точки для идентификации, они шифруют свой номер, или координаты или что-то ещё?

Hangman_ru Nov 28 2024 at 06:04

на цветных аппаратах точки весьма себе видимые под определенным углом, печатаются бледно-желтым цветом

commanderxo Nov 28 2024 at 08:41

Побочные эффекты этой восхительной фичи

Xitsa Dec 4 2024 at 10:09

про побочные эффекты вспомнилось, что была программа, которая добавляла EURion constellation к печатаемому тексту, чтобы его нельзя было копировать и обрабатывать в графических программах.

Wesha Nov 28 2024 at 06:36

какие-то невидимые точки

Вам сюда.

woodiron Nov 28 2024 at 06:46

Спасибо. Вспомнил, как мне толковал один программист в далёком прошлом о том, как стереть данные об изображении: его надо распечатать и отсканировать. Оказывается, это тема не рабочая. Можно предположить, что и сканер добавляет какую-нибудь инфу в файл, а подключенный к сети сливает и сами файлы.

fivlabor Nov 28 2024 at 09:11

HP, помню, не давал сканить доллары

zuek Nov 28 2024 at 16:55

У сканеров реакции на "кольца Евриона" не встречал, хотя со сканерами знаком с начала 90-х, а вот цветные копиры - многие замечены за выдачей пустоты или чёрной плашки на месте банкноты. Лично не видел, но слышал о данной функции и у каких-то принтеров.

victor-homyakov Nov 28 2024 at 19:46

Лично видел такую функцию у цветного струйника (модель уже не помню). Самое смешное, что это было в банке, и как раз надо было напечатать цветные плакаты про новые купюры, чтобы кассиры их изучили. Когда принтер доходил до созвездия Евриона - заливал кусок образца банкноты чёрным прямоугольником.

Потом в интернетах видел рассказ про эти принтеры, там можно было в драйвере поправить пару байт (типа JE xx на NOP NOP, ЕВПОЧЯ), чтобы он игнорировал обнаруженное созвездие. Это всё было ещё под Windows XP.

Mausglov Nov 28 2024 at 13:45

полагаю, тот программист имел в виду метаданные в файле изображения.

UFO landed and left these words here

Wesha Nov 30 2024 at 00:55

Так в том и смысл, что на взгляд это никак не видно, только под синим светом и т.п.

kenomimi Nov 28 2024 at 18:47

Серийник оставляют. Сделано в древние времена для поиска утечек с предприятий, но не взлетело из-за высокой сложности поиска этих самых точек и пропиетарного кодирования, которое зависело от производителя.

Jec13 Nov 28 2024 at 05:42

Побольше таких статей!!!

Vest Nov 28 2024 at 07:20

Вы просто не умеете искать: https://habr.com/ru/companies/first/articles/676282/

wl2776 Nov 28 2024 at 06:07

А что будет при переводе из RGB в другое цветовое пространство?

Rive Nov 28 2024 at 06:10

Потеря битов на ошибках округления.

Rive Nov 28 2024 at 06:12

В png можно спрятать даже архив или воркфлоу генерации картинки нейросетью типа comfyui, просто вклеив дополнительную информацию в файл.

3Demon Nov 28 2024 at 06:14

Автор, стенография и стеганография все же разные вещи, поправьте тэги

unC0Rr Nov 28 2024 at 07:14

И название репы.

korsikanec Nov 28 2024 at 06:20

Эм.. Берёшь нужные файлы, добавляешь в запароленный архив. Открываешь его в hex-редакторе, открываешь картинку тоже в hex. Копируешь код картинки в конец кода архива и сохраняешь. Меняешь расширение на картиночное - картинка, меняешь на архивное - архив ;)

FF_hunter Nov 28 2024 at 06:51

Не всё так просто. Некоторые хостинги уже научились вычислять rarjpg и отсекать архивную часть от картинки. Склеиваешь, заливаешь, скачиваешь - а там пусто...

запрятать все свои пароли в фотографию с любимым ~~вождем~~ котом.

Поправил, так душевнее)

А вообще статья огонь! Реквестирую что-либо подобное про преобразования text-2-text (особенно eng в rus).

korsikanec Nov 28 2024 at 07:01

Ого. Отстал от технологий)

nixtonixto Nov 28 2024 at 09:56

Total Commander умеет склеивать/резать файлы кликами мышкой, без hex-редакторов. И лучше приклеивать архив к картинке - тогда архиватор (по крайней мере WinRAR) открывает такой архив даже без смены расширения, а картинка видна во всех браузерах и просмотрщиках.

ADVek Nov 28 2024 at 11:32

А можно поподробней?

rafaelpro Nov 28 2024 at 17:21

copy /b cat.jpg + Arhive.rar cat_new.jpg в командной строке, после чего файл можно открывать и как jpg, и как архив.

RolexStrider Nov 28 2024 at 06:35

А мне вот интересно: фотография PNG-24 (без потерь) была до этого JPEG/AVIF/JXL более высокого разрешения. И при сжатии и уменьшении больше всего страдает (сглаживается) как раз этот самый LSB (как самый невидимый, но добавляющий при этом кучу энтропии в данные, сильно мешая сжатию). И по идее отделив этот самый LSB и увидев что там "белый шум" сразу закрадутся подозрения, что "это-жж-ж неспроста"?

UFO_01 Nov 28 2024 at 06:50

Да, так и есть, когда меняется LSB изображения в каждом канале, при анализе это очень заметно. На самом деле техник для внедрения информации в изображение огромное множество. Я как раз в универе занимаюсь опытами с внедрением информации на основе субполосных преобразований (метод по сути аналогичен jpeg2000, только вместо вейвлет используется субполосная матрица).

victor-homyakov Nov 28 2024 at 19:54

Я 25 лет назад похожей штукой в универе занимался. DCT или какое другое преобразование, потом в средних частотах внедрял что нужно, потом обратное DCT. В итоге информация размазывается по пикселям блока изображения, хотя в спектре блока остаётся сосредоточена в одной полосе.

UFO_01 Nov 29 2024 at 09:28

В том и проблема, что это остаётся заметно на спектре, в то время как при этом методе информация равномерно размазывается на все субполосы изображения, и отследить её довольно трудно. Но честно говоря, я бы вместо этого лучше бы чем-нибудь более практичным после работы занимался :)

victor-homyakov Nov 29 2024 at 13:38

это остаётся заметно на спектре

Это смотря как менять спектр :)

NickDoom Nov 28 2024 at 10:59

Можно взять сам жпег и при квантовании все «граничные случаи» округлять не в честную сторону, а в коварно заинтересованную. Псевдошумовой паттерн плюс достаточно большая статистика…

Хотя нет, не нужно. Сейчас все уроды пережимают картинки, убивая то, что казалось вечным. «Цифровой износ», да. Не надо давать уродам дополнительную мотивацию быть уродами.

Somepony0 Nov 28 2024 at 07:00

Старенькая игра Spore использует данный метод для сохранения пользовательских творений (существ/зданий/транспорта и т.д.) в виде PNG картинки этого творения.

Wijey Nov 28 2024 at 07:24

И японские игры 18+, где таким же образом созданные пользователями персонажи передаются

ValeryIvanov Nov 28 2024 at 09:43

А зачем так извращаться? PNG поддерживает текстовые чанки и туда можно запихать любые данные

m0tral Nov 28 2024 at 14:56

Вообще любые пользовательские бинарные чанки, смысла статьи не пойму, ну в RSA это загони и все, привет.

In4in Nov 28 2024 at 17:10

Важно не столько скрыть информацию, сколько скрыть факт сокрытия информации :)

При кодировании данных в LSB у вас даже вес картинки не изменится. Чанки же сразу привлекают внимание.

unC0Rr Nov 29 2024 at 07:12

Шум в LSB привлекает внимание в не меньшей степени.

Wesha Nov 29 2024 at 09:14

Снимаете известную картину "негры ночью уголь грузят" — и вот уже на фоне естественного шума матрицы там слона спрятать можно.

perfect_genius Nov 28 2024 at 08:57

Меня действительно удивило предельно малое кол-во информации на данную тему.

Потому что вы ошиблись в слове "стеганография". Если бы не ошиблись, то увидели бы, что нет смысла писать очередной такой материал на Хабр, их десятки уже.

RenatSh Nov 28 2024 at 09:41

Если автор искал не то что надо то получилась reverse steganography - в лесу не нашел деревьев

DartPelmen Nov 28 2024 at 11:34

Спасибо за короткий и понятный материал!

Я бы еще отметил, что LSB позволяет делать хрупкий водяной знак. Например, если попробуем перегнать картинку из PNG и JPG, то все, спрятанный контент потеряется.

3036662 Nov 28 2024 at 12:06

Вот еще вариант,интересно, насколько он хорош в плане криптостойкости:
https://github.com/DanilShein/secret

deliro Nov 28 2024 at 13:27

Спасибо! Делал такую же штуку, пока тренировался в Rust. Выглядит как идеальная задача для его комбинаторов итераторов — склеить, разделить на чанки и т.п.

https://github.com/deliro/injet

azTotMD Nov 28 2024 at 14:42

К сожалению (или к счастью), при попытке проделать что-то подобное с картинкой из другого домена немедленно напарываешься на CORS

mr_kani Nov 28 2024 at 18:13

Писали такое на первом курсе для изучения C и стеганографии. Вообще был интересный случай с трояном, который управлялся через мемы в твиттере. Там выкладывался мем со вшитой внутрь командой, а твиттер не обрезал метаданные и не сжимал картинку, в итоге все данные оставались неизменными. И трояну надо было только скачать картинку, извлечь команду и исполнить. Ну и следовательно задетектить такого трояна было сложнее

timursergeevich Nov 28 2024 at 19:35

Самое интересное, что после всех манипуляций у картинок даже отличие в весе будет минимальным.

Так отличий в весе и не должно быть

berez Nov 29 2024 at 12:21

Ну вообще не факт.

В реальных картинках LSB довольно детерминистичен - целые области могут быть залиты одним "цветом". Мы добавляем довольно много шума (особенно если скрытые данные сжаты/зашифрованы). Шум сжимается хуже, поэтому в общем случае размер картинки увеличится.

arokettu Nov 28 2024 at 19:55

Этот способ даже на ithappens был в свое время как история из чьего-то глубокого детства

victor-homyakov Nov 28 2024 at 20:05

Самое интересное, что после всех манипуляций у картинок даже отличие в весе будет минимальным

Попробуйте ради интереса проделать эти манипуляции с монотонной картинкой PNG.

Если картинки - скриншоты экрана компьютера или рисунки, на которых много залитых одним цветом областей, то отличие в размере/весе будет заметно.

PNG хорошо умеет сжимать однородные или регулярные области, а при отличиях в каждом пикселе коэффициент сжатия получится намного хуже.
Количество цветов увеличится. Особенно заметно будет, если придётся вместо 256-цветной палитры перейти на 24-битный RGB - размер файла сильно вырастет.

Revolt-or-die Nov 28 2024 at 20:09

Конкретно PNG формат позволяет просто добавлять чанки данных каких угодно без потери работоспособности.

makssof Nov 28 2024 at 22:24

Правильно я понимаю, что любые сервисы (в частности соц.сети) делают подобные способы - бесполезными из за пережатия/оптимизации?

stepagrus Nov 29 2024 at 02:21

Правильно

unC0Rr Nov 29 2024 at 07:16

А разве существуют сервисы, пережимающие PNG с потерей качества? Но вообще, в стеганографии существуют алгоритмы и на такие случаи.

victor-homyakov Nov 29 2024 at 13:50

Существуют. Пример - https://tinypng.com/, они пытаются менять цвета пикселей и уменьшать количество цветов, чтобы и не очень заметно для человеческого глаза получилось, и в PNG лучше жалось.

victor-homyakov Nov 29 2024 at 14:07

У внедрения информации в изображения/видео кроме скрытной передачи большого массива информации есть ещё две области применения.

Первая - скрытая передача метки об авторе или о конкретном владельце изображения. Тогда, например, из утёкших сканов документа будет понятно, у кого конкретно из имевших допуск этот скан увели. Или автор фотографии сможет предъявить иск к тем, кто спиратил фото и не заплатил. При этом способ внедрения может предусматривать какую-то устойчивость к повороту, обрезке и масштабированию картинки (условно, алгоритм подписи автора сможет пережить поворот на ±5 градусов, обрезку на 10% и масштабирование сторон с коэффициентом от 0.8 до 1.2). Закономерно, что чем выше устойчивость - тем меньше информации удастся записать.

Вторая область применения специально использует хрупкость и неустойчивость к изменению даже одного пикселя картинки как пруф, что никто не модифицировал изображение на пути от источника к получателю. То есть такой себе невидимый контроль целостности картинки.

В общем, это аналогия "обычным" ЭЦП с их функциями подписи и контроля целостности.

stepagrus Nov 29 2024 at 02:20

В далёком 2004 году в институте у нас были лабораторные работы по стеганографии. Мы прятали текст в младшие биты цветов файла формата bmp.

Vasya1209 Nov 29 2024 at 12:26

вы интересное начали. скрывать трафик от снифферов и блокираторов это полезно. но нужно в комплексе апи создать: 1) поиск рандеву сервера через специальные, нерелевантные запросы через яндекс и гугл, и нахождение нужных данных в поисковой выдаче по какому-то ключу в нмх спрятанному. 2) обмен данными через передачу файлов png, jpg 3) ввод вывод системных денег через выигрыш или проигрыш на какой-либо популярной бирже. задача - создать инструмент для написания секретных чатов и приложений. чтоб например роскомнадзор думал что вы чёрный страпон с кисточкой ищете , и картинки всякие смотрите, а вы коннектитесь к секретному чату и ставки на события всякие делаете, и никто не может ваши протоколы запретить или сервак забанить , потому что тогда надо будет весь хттп и все форматы картинок банить в принципе.....

vova9110 Nov 29 2024 at 13:52

Но эту пикчу никуда не выложить, так как какая-нибудь телега возьмёт да пережмёт и всё

AlexVamp Nov 29 2024 at 17:52

Во времена Windows 98, если не 95, была программка которая это делала, ещё и пароль ставила. Если пароль не знаешь текст из картинки вытащить было невозможно.

strungtheory Nov 29 2024 at 17:52

берешь wav файл, пихаешь туда производьный чанк (главное, чтоб не data назывался) и прячь туда что попало.

Часть мудозвонов таким образом наращивала объем своих продоваемых звуковых библиотек, чтоб поувесистей казалось.

AndrewBond Nov 29 2024 at 21:30

В древние времена узнал о стеганографии из статей Fravia. Чтобы до них дойти, нужно было взломать его же сайт. Этому он учил на предыдущих уроках.

Во времена были....

emelyagr Dec 7 2024 at 05:24

Ну и комментариев здесь... А я без сторонних библиотек сделал. На чистом JS

Somepony0 Dec 9 2024 at 18:52

Потенциальные 5мб спонтанных данных разместятся на 5000х5000

Подожди, а как ты это посчитал? Это 25000000 пикселей, и если каждый может хранить 3 бита, получается 75000000 бит. Переводим в байты - 9375000 байт или чуть менее 9 МБ. Откуда у тебя вышло только 5?