Комментарии 72
У меня только один вопрос, присутствовали ли указанные лица (в данных примерах) в обучающей выборке?
Если да, то это не рисование а фактически поиск в базе по индексу в виде нейросети.
Потому как слишком уж выглядит неправдоподобно.
Если да, то это не рисование а фактически поиск в базе по индексу в виде нейросети.
Потому как слишком уж выглядит неправдоподобно.
Угу. А то по такому алгоритму «смогут восстанавливать» изображения из случайно сгенерированных картинок.
Был куча случайных кубиков, стала Памела Андерсон.
Был куча случайных кубиков, стала Памела Андерсон.
Ну, или некое средне взвешенное лицо, плавали — знаем…
… меня удивляет другое, зачем плодить такие бестолковые работы, понты дороже денег, честное слово!
Эта байда не имеет отношения к реальному апскейлу, тк условия тут не менее синтетические чем результат, на входе не фрагмент реального изображения с шумами и артефактами, а чистинький даунскейл, и на выходе не полезные в хозяйстве линии и градиенты, а такая-же мелочь, по которой не возможно судить об адекватности реконструкции и тех диких «артефактах» которые порождаются таким подходом в больших масштабах.
… короче это игра на далёкую от темы публику, для которой не нужны не супер умы, не супер компьютеры
… меня удивляет другое, зачем плодить такие бестолковые работы, понты дороже денег, честное слово!
Эта байда не имеет отношения к реальному апскейлу, тк условия тут не менее синтетические чем результат, на входе не фрагмент реального изображения с шумами и артефактами, а чистинький даунскейл, и на выходе не полезные в хозяйстве линии и градиенты, а такая-же мелочь, по которой не возможно судить об адекватности реконструкции и тех диких «артефактах» которые порождаются таким подходом в больших масштабах.
… короче это игра на далёкую от темы публику, для которой не нужны не супер умы, не супер компьютеры
улучшайзер качества фоток с ойфона как например, сможете фоткать с бодуна в темноте, а результат будет как на проф зеркалку, ещё через meitu-подобное что-то пропустить и всё, хит продаж, лучшая камера в сегменте.
вот — вот, зафотить все население и захешировать
: Ждем когда придет кто-нибудь неленивый и подставит случайные фото в первое изображение.
Да это ладно… можно будет смотреть фильмы 70-х годов в 8K+ разрешении. Правда, после такого upscaling, это будут уже совсем другие фильмы (причем, разные даже от каждого производителя TV)
Наконец-то узнаю, как выглядит Missingno.
При таком подходе, например, при задаче определения автомобильного номера — в любой непонятной ситуации будут подставляться цифры и буквы с высокой частотой встречаемости. Владельцы номеров O111OO пострадают :)
И это всего лишь начало. Представьте себе перспективы.
«Восстановление» фотографии по кучке пикселей — ерунда. Вот когда начнут восстанавливать людей, в том числе вымышленных персонажей, это будет куда интересней. Да, их воспоминания окажутся аппроксимацией, не полностью соответствующей реальности, но это будут реальные живые люди, которые будут вести себя примерно так же, думать примерно так же, говорить примерно так же, как и давно умершие оригиналы.
Максимальный цифровой след оказывается нашим шансом получить бессмертие, даже если мы умрём задолго до своего воскрешения.
«Восстановление» фотографии по кучке пикселей — ерунда. Вот когда начнут восстанавливать людей, в том числе вымышленных персонажей, это будет куда интересней. Да, их воспоминания окажутся аппроксимацией, не полностью соответствующей реальности, но это будут реальные живые люди, которые будут вести себя примерно так же, думать примерно так же, говорить примерно так же, как и давно умершие оригиналы.
Максимальный цифровой след оказывается нашим шансом получить бессмертие, даже если мы умрём задолго до своего воскрешения.
Насколько я предоставляю, наши воспоминания тоже работают по похожему принципу :) А ещё по тому же принципу из усиленного шума изолированных областей головного мозга формируются такие реалистичные сны :)
Как обычно, перспективы колоссальные, а использоваться будет только для «де-цензуризации» японских фильмов для взрослых.
Предвижу полное восстановление видеозаписи преступления по одному пикселю…
del
Может, я чего-то не понял, но — откуда такое различие в общем тоне губ в первом и третьем примере на КДПВ? Видно, что хоть картинка, подобранная нейросетью, похожа по положению пикселей, но цвет губ подобранной картинки отличается от цвета пикселей на 8*8 и от «оригинала».
Эта сеть не восстанавливает изображение, она придумывает его на основе кучки пикселей. Я тоже делал аналогичную нейросетку несколько месяцев назад, и да, она неплохо придумывает детали по минимуму пикселей, но выход далеко не всегда сильно похож на оригинал.
Это понятно, мне интересно почему результат «придумывания» так сильно отличается по цвету.
Потому что большинство лиц в обучающем наборе имеют подобные цвета, а сеть не очень успешно или совсем не разделила кластеры «розовые губы» и «красные губы»?
Можно ли генерировать правдоподобные картины на основе 64 пикселей? Логика подсказывает, что это невозможно.
Логика подсказывает, что нельзя восстановить исходное. А нарисовать новое — да пожалуйста, в любом разрешении.
По сути это просто машина случайных картинок, генерирующая их по определенному правилу и заданному начальному зерну. Об "улучшении" говорить трудно, особенно учитывая, что с разными параметрами на одной картинке получаются совершенно разные лица. Единственное что угадывается — это овал лица и расположение дырок на лице. Законы природы тяжело обмануть — нельзя просто так разжать без потерь, сжатое с потерями :)
«Можно ли генерировать правдоподобные картины на основе 64 пикселей?»
«Логика подсказывает, что это невозможно»
У вас какая-то поломанная логика. Вопрос про правдоподобные изображения, а она вам возвращает ответ о достоверных :-)
«Логика подсказывает, что это невозможно»
У вас какая-то поломанная логика. Вопрос про правдоподобные изображения, а она вам возвращает ответ о достоверных :-)
Не хватает исходного изображения в хорошем качестве, чтобы понять, насколько точно нейросеть угадала.
А что за колонка NN в списке примеров? Картинки там сильно отличаются от остальных.
Полагаю, что на ней обучали сеть
Тогда немного странно. Некоторые примеры очень сильно отличаются по цвету.
Цитирую из текста:
«Поиск ближайшего соседнего элемента (NN), который ищет в базе учебных образцов пониженного разрешения наиболее схожее изображение по близости пикселей в евклидовом пространстве, а затем возвращает соответствующую картинку высокого разрешения, из которой был сгенерирован этот учебный образец»
«Поиск ближайшего соседнего элемента (NN), который ищет в базе учебных образцов пониженного разрешения наиболее схожее изображение по близости пикселей в евклидовом пространстве, а затем возвращает соответствующую картинку высокого разрешения, из которой был сгенерирован этот учебный образец»
Размывание изображения необратима теряет информацию, нейросеть при обратном процессе добавляет информацию, так чтобы она реалистично выглядело.
Вспоминается та сеть, которую на собаках обучали, и она потом везде собак рисовала.
Deep Dream

Я так понимаю, что восстановление выброшенной информации происходит за счёт информации набранной в процессе обучения.
Но что я действительно не понимаю — так это то, зачем телевизионщики закрывают инкогнито пискельными масками. Они в движении дают достаточное количество информации для восстановления личности, я предполагаю.
Но что я действительно не понимаю — так это то, зачем телевизионщики закрывают инкогнито пискельными масками. Они в движении дают достаточное количество информации для восстановления личности, я предполагаю.
Если приглядеться повнимательней, то получаемые изображения вообще не похожи на оригинал. По ним не возможно будет найти кого-то, а те изображения которые окажутся очень похожи в результате такого «восстановления» — скорей статистическая погрешность, чем результат.
Подскажите софт на андроид, который может склеивать несколько макроснимков в один большой документ. Хочу чтобы у телефона качество сканирования было как у планшетного сканера.
Пока весь софт, что я пробовал работает примитивно: делаем одну фотку, изменяем у ней пропорции и баланс белого — готово. Без слез на такой скан не посмотришь, печатать потом стыдно.
Пока весь софт, что я пробовал работает примитивно: делаем одну фотку, изменяем у ней пропорции и баланс белого — готово. Без слез на такой скан не посмотришь, печатать потом стыдно.
У меня с одной фотки разрешение получается выше, чем у гугла из пяти.
Как по мне, склеить такую панораму — довольно простая задача по сравнению со всякими нейросетями, которые сами дорисовывают, а никто не сделал почему-то.
Пробовал в фотошопе автовыравнивание слоев — не получилось ничего, да и неудобно.
В идеале нужен софт, который записывает видео. Поводил над листом телефоном, а потом из этого видео максимум полезной информации выжимается в один JPG.
Как по мне, склеить такую панораму — довольно простая задача по сравнению со всякими нейросетями, которые сами дорисовывают, а никто не сделал почему-то.
Пробовал в фотошопе автовыравнивание слоев — не получилось ничего, да и неудобно.
В идеале нужен софт, который записывает видео. Поводил над листом телефоном, а потом из этого видео максимум полезной информации выжимается в один JPG.
Здесь просто обязана появиться эта картинка, я считаю.
По мне результаты регрессионного анализа в среднем больше похожи на оригинал. Нейросети много додумывают))
Если не ошибаюсь, человеческий мозг проделывает аналогичный фокус. Читал где-то, что «разрешение» человеческого глаза довольно посредственное и бОльшую часть деталей изображения того, что у нас в поле зрения, мозг достраивает сам.
«Zoom and enhance» не за горами? :)
Какая глубина цвета у ужатых картинок? Если мы пропорционально увеличиваем разрядность цвета при уменьшеннии разрешения, повлияет ли это на результат?
Есть даже короткое и ёмкое название для подобной техникик — hallucination.
Какая практическая польза от этого алгоритма, кроме как для синтеза реалистичных изображений?
Для видео алгоритм без серьёзных модификаций не подойдёт — будет высокая неустойчивость, на каждом кадре будет «галлюцинироваться» что-то своё. Для анализа изображений — и подавно: информации больше не стало.
Какая практическая польза от этого алгоритма, кроме как для синтеза реалистичных изображений?
Для видео алгоритм без серьёзных модификаций не подойдёт — будет высокая неустойчивость, на каждом кадре будет «галлюцинироваться» что-то своё. Для анализа изображений — и подавно: информации больше не стало.
Для видео алгоритм без серьёзных модификаций не подойдёт — будет высокая неустойчивость, на каждом кадре будет «галлюцинироваться» что-то своё.Переносите веса из скрытых слоёв от обработки предыдущего кадра в веса текущего (конкатенация, не сложение), и будет Вам счастье.
Переносите веса из скрытых слоёв от обработки предыдущего кадра в веса текущего (конкатенация, не сложение), и будет Вам счастье.
И получим в итоге старческое слабоумие. Если человек пропадёт из видео на несколько секунд, нейросеть забудет про него, и при следующем появлении человек уже станет другим.
Молодцы, придумали тест Роршаха для нейросети )
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Вероятностное улучшение фотографий по нескольким пикселям: модель Google Brain