Вообщем, суть была найти фигуры (прямоугольник, треугольник, линия, пиксель), покрывающие наибольшую площадь в каждом изображении с разрядом (8битное цветное - это 24 разрядное, то есть 24 монохромных), где все пиксели обращаются в 0 или 1 (смотря что в итоге выходит меньше по размеру - координаты фигур), потом фигуры сортируются по количеству углов, потом в каждой группе фигуры сортируются по координатам (по очереди - в итоге мы знаем, что следующая фигура имеет последнюю координату больше, чем предыдущая, или такую же, но тогда для следующей координаты то же самое), таким образом можно писать не сами координаты, а их разницы, что снижает размер, и потом пройтись дефлейтом
Например, для базы ImageNet [1000 различных классов объектов], несмотря на то, что каждое изображение содержит 224 × 224 × 3 = 150528 пикселей, оценка внутренней размерности лежит [всего] между 26 и 43
Огроменное спасибо, попробую в будущих анализах, но пока что кажется, что это просто улучшает визуальное восприятие, как нейросети, и ухудшает точность
Unsharp Mask с предположительными параметрами и одинаковой величиной по всему изображению на примере кубической интерполяции
Да, осталось автоматом определять класс и стиль исходного изображения с максимальной точностью и применять для него метод, дающий максимальную точность для этого вида изображений (в идеале 100%, если нет мелких элементов между пикселами ужатого изображения). Может Вас смутило название статьи - здесь "точный" означает максимально точный насколько это возможно. Понятие вида "идеальный газ"
Думаю, ответ на вашу задачу будет тривиален - максимально точно - вместо доп инфы взять дополнительно побольше пикселей (можно разных в разное время) - быстро - ближайший сосед или интерполяция. Моя задача возникает и в реальном мире - фото/кадр с камеры низкого разрешения или объект на нём вдалеке - и вот уже уменьшенная картинка без доп. информации
Может, но если это действительно необходимо какому-либо человеку и не существует более лучшей фотографии, то какой метод использовать, чтобы минимизировать ошибку? А вообще с текстами немного другая ситуация - если он не рукописный, и мы знаем язык, шрифт, кегль, кернинг, расстояние то до определённых пределов (например один символ - хотя бы 2х2 пикселя) можно достаточно точно подобрать символы
Но, конечно, прибегать к этому всему нужно только тогда, когда достать изображение большего разрешения невозможно или ошибка не так критична, как время, затраченное на получение более детальных данных
К сожалению, бывают случаи когда это нужно - например, медленная скорость интернета, но желание посмотреть видео прямо сейчас и без лишнего мыла.
Качественно апскейлит Upscayl, но обсуждаемая тема - не качество, а точность. Нейросети выдают много качества за счёт галлюцинаций/допущений, снижающих точность, то есть вместо вероятности (информации у нас недостаточно для определения конкретной реализации) выдают одну реализацию, зато качественную.
Вообщем, суть была найти фигуры (прямоугольник, треугольник, линия, пиксель), покрывающие наибольшую площадь в каждом изображении с разрядом (8битное цветное - это 24 разрядное, то есть 24 монохромных), где все пиксели обращаются в 0 или 1 (смотря что в итоге выходит меньше по размеру - координаты фигур), потом фигуры сортируются по количеству углов, потом в каждой группе фигуры сортируются по координатам (по очереди - в итоге мы знаем, что следующая фигура имеет последнюю координату больше, чем предыдущая, или такую же, но тогда для следующей координаты то же самое), таким образом можно писать не сами координаты, а их разницы, что снижает размер, и потом пройтись дефлейтом
тут пусто
нет, там действительно имя фамилия
Круто, это на какой картинке читается, я просто кроме ст ничего разобрать не могу, а почему имя фамилия читать не следует?
https://alphacephei.com/ru/lecture12.pdf
Что говорит о том, что у нас заранее НЕ произвольные данные (само понятие изображения - не то же самое, что данные)
По моему, пока что лучше всего справляется scaleFurry, ну, у кого здесь как получится прочитать нижнюю строчку?
Кажется, я его и использовал
Огроменное спасибо, попробую в будущих анализах, но пока что кажется, что это просто улучшает визуальное восприятие, как нейросети, и ухудшает точность
Да, но это слишком специфический случай, никак не относящийся к практическому повседневному использованию и тем более к фото
Больше примеров и наглядности - здесь
Да, осталось автоматом определять класс и стиль исходного изображения с максимальной точностью и применять для него метод, дающий максимальную точность для этого вида изображений (в идеале 100%, если нет мелких элементов между пикселами ужатого изображения). Может Вас смутило название статьи - здесь "точный" означает максимально точный насколько это возможно. Понятие вида "идеальный газ"
Думаю, ответ на вашу задачу будет тривиален - максимально точно - вместо доп инфы взять дополнительно побольше пикселей (можно разных в разное время) - быстро - ближайший сосед или интерполяция. Моя задача возникает и в реальном мире - фото/кадр с камеры низкого разрешения или объект на нём вдалеке - и вот уже уменьшенная картинка без доп. информации
Спасибо, в следующей части использую для уменьшения точное усреднение, как на фото - то что в фокусе, но вдалеке
Может, но если это действительно необходимо какому-либо человеку и не существует более лучшей фотографии, то какой метод использовать, чтобы минимизировать ошибку? А вообще с текстами немного другая ситуация - если он не рукописный, и мы знаем язык, шрифт, кегль, кернинг, расстояние то до определённых пределов (например один символ - хотя бы 2х2 пикселя) можно достаточно точно подобрать символы
Всё верно, но другие картинки и модели waifu будут в следующей части
К сожалению, бывают случаи когда это нужно - например, медленная скорость интернета, но желание посмотреть видео прямо сейчас и без лишнего мыла.
Качественно апскейлит Upscayl, но обсуждаемая тема - не качество, а точность. Нейросети выдают много качества за счёт галлюцинаций/допущений, снижающих точность, то есть вместо вероятности (информации у нас недостаточно для определения конкретной реализации) выдают одну реализацию, зато качественную.