Идею поддерживаю. Но есть два момента:
1. Автор вообще-то говорит о другой задаче - установить общее авторстово, а не общую суть. Разница существенная.
2. Есть говорить об затронутой вами проблеме поиска дублей, то увы, обычно задача определения схожести не приходит одна. Если оригинал неизвестен, подобный метод теряет актуальность из-за своей ресурсовемкости.
Похоже, что как раз маркетинговые цели и будут составлять пресловутые 2 раза в два года.
А пройдет еще 10-15 лет, слоев будет под сотню и всплывут следующие проблемы.
Сателлиты плодят со страшной силой... (Если бы Яндекс и Рамблер не отдавали зоне RU предпочтение в индексации, то первый миллион отметили бы года через 3 наверное, не раньше)
Насчет изображения, содержащего цифровую копию самого себя.
Для простоты возьмем ч/б (иллюстрацией может служить последнее фото). Судя по механизму кодирования - выжать там можно 1 бит на пиксель. И не забываем про два момента:
1. Белым пикселем "фиг что закодируешь", как и абсолютно черным.
2. А самые светлые и самые темные пиксели дают большой процент ошибок. Кроме того возможны просто повреждения изображения. Т.е. нужна избыточночть кодирования.
Это значит что ч/б изображение в RAW, имеющее размер 1 Мб (1024x1024 точек) понесет в себе максимум 128кб информации, а с учетом вышеназавнных факторов - отсилы 50-80кб. Т.е. в лучшем случае цифровая копия - это JPEG, причем с целой тележкой артефактов.
В цвете, имхо, ситуация будет почти такая же (цветное изображение визуально "жмется" лучше, но, уверен, шумов и ненагружаемых областей будет куда больше, чем на ч/б).
P.S. из революционных применений я вижу, прежде всего, хранение кодированной информации о товаре.
Раньше она занимала определенное место (штрихкод), что немного отнимало время кассира, а теперь может содержаться чуть ли не в каждом квардатном сантиметре упаковки.
поризводители, кто-от
Word рулит :)
1. Автор вообще-то говорит о другой задаче - установить общее авторстово, а не общую суть. Разница существенная.
2. Есть говорить об затронутой вами проблеме поиска дублей, то увы, обычно задача определения схожести не приходит одна. Если оригинал неизвестен, подобный метод теряет актуальность из-за своей ресурсовемкости.
А пройдет еще 10-15 лет, слоев будет под сотню и всплывут следующие проблемы.
> справляться с одной важной проблемой
> — относительно высокой загрузкой ЦП.
Ясен пень, процессоры продавать тоже нужно !...
Для простоты возьмем ч/б (иллюстрацией может служить последнее фото). Судя по механизму кодирования - выжать там можно 1 бит на пиксель. И не забываем про два момента:
1. Белым пикселем "фиг что закодируешь", как и абсолютно черным.
2. А самые светлые и самые темные пиксели дают большой процент ошибок. Кроме того возможны просто повреждения изображения. Т.е. нужна избыточночть кодирования.
Это значит что ч/б изображение в RAW, имеющее размер 1 Мб (1024x1024 точек) понесет в себе максимум 128кб информации, а с учетом вышеназавнных факторов - отсилы 50-80кб. Т.е. в лучшем случае цифровая копия - это JPEG, причем с целой тележкой артефактов.
В цвете, имхо, ситуация будет почти такая же (цветное изображение визуально "жмется" лучше, но, уверен, шумов и ненагружаемых областей будет куда больше, чем на ч/б).
P.S. из революционных применений я вижу, прежде всего, хранение кодированной информации о товаре.
Раньше она занимала определенное место (штрихкод), что немного отнимало время кассира, а теперь может содержаться чуть ли не в каждом квардатном сантиметре упаковки.
P.S. Все-таки почти 10 лет с Оперой вместе :)