Comments 4
Современные генеративные модели обучаются на гигантских массивах реальных изображений. Они не просто учатся рисовать котиков, они "учатся" фундаментальному-распределению пикселей и их взаимосвязям. Фактически, они "учатся" симулировать саму «естественность», в том числе и ее статистические проявления, такие как распределение частотных коэффициентов.
Они не просто копируют картинки, они повторяют принципы, по которым эти картинки устроены. И закон Бенфорда, судя по всему, является одним из таких фундаментальных принципов, который успешно «впитывается» моделью в процессе обучения.
Кажется очевидным, что распределение DCT-коэффициентов фотореалистичного изображения будет в целом близким к настоящим фотографиям. Также как и сгенерированный нейросеткой текст будет подчиняться закону Ципфа. Вы просто взяли неподходящую метрику.
Когда знал результат эксперимента до конца прочтения статьи
Но метрика интересная. Если придумать как-то адекватно переводить текст в подобные блоки, и смотреть распределение, возможно получится. Люди действительно любят фальсифицировать, в то время как нейронка обучена на "идеальных" текстах, а значит и выдавать будет реалистичные значения
Очень интересно! Но я бы вам порекомендовал использовать преобразование фурье вместо DCT. По той причине, что результат DCT не очень подходит для аналитики. Он неплох для, например, преобразования данных, эквализации. или квантизации, как в JPG. Но там очень трудно понять, что происходит, даже если вы уберете знаки и сделаете все позитивным. Лучше всего для аналитики делать преобразование фурье и найти амплитуды. даже визуально, попробуйте нарисовать амплитуды от FFT или результат вашего DCT. Сразу увидите, насколько приятно и правильно выглядит результат фурье и насколько зубасто даже абсолютные значения DCT будут выглядеть.
Сразу было понятно, что у автора ничего не получится. Плохо, когда закон Бенфорда воспринимается, как какая-то магия, без понимания, откуда он взялся.
Так что нет, пока никакого "диалога и совместных исследований" – для того, чтобы их начать, надо хоть немного подтянуть автора в теории.
Оцениваем «естественность» изображений по первой цифре