All streams
Search
Write a publication
Pull to refresh
19
0
Артём Музагафаров @smile_artem

Программист

Send message

Вообщем, суть была найти фигуры (прямоугольник, треугольник, линия, пиксель), покрывающие наибольшую площадь в каждом изображении с разрядом (8битное цветное - это 24 разрядное, то есть 24 монохромных), где все пиксели обращаются в 0 или 1 (смотря что в итоге выходит меньше по размеру - координаты фигур), потом фигуры сортируются по количеству углов, потом в каждой группе фигуры сортируются по координатам (по очереди - в итоге мы знаем, что следующая фигура имеет последнюю координату больше, чем предыдущая, или такую же, но тогда для следующей координаты то же самое), таким образом можно писать не сами координаты, а их разницы, что снижает размер, и потом пройтись дефлейтом

Наглядная демонстрация проблемы нейросетей - даже то, что можно было раньше разобрать - исковеркано, увеличилось качество, но понизилась точность
Наглядная демонстрация проблемы нейросетей - даже то, что можно было раньше разобрать - исковеркано, увеличилось качество, но понизилась точность

нет, там действительно имя фамилия

Круто, это на какой картинке читается, я просто кроме ст ничего разобрать не могу, а почему имя фамилия читать не следует?

Например, для базы ImageNet [1000 различных классов объектов], несмотря на то, что каждое изображение содержит 224 × 224 × 3 = 150528 пикселей, оценка внутренней размерности лежит [всего] между 26 и 43

https://alphacephei.com/ru/lecture12.pdf
Что говорит о том, что у нас заранее НЕ произвольные данные (само понятие изображения - не то же самое, что данные)

По моему, пока что лучше всего справляется scaleFurry, ну, у кого здесь как получится прочитать нижнюю строчку?

Кажется, я его и использовал

Огроменное спасибо, попробую в будущих анализах, но пока что кажется, что это просто улучшает визуальное восприятие, как нейросети, и ухудшает точность

Unsharp Mask с предположительными параметрами и одинаковой величиной по всему изображению на примере кубической интерполяции
Unsharp Mask с предположительными параметрами и одинаковой величиной по всему изображению на примере кубической интерполяции

Да, но это слишком специфический случай, никак не относящийся к практическому повседневному использованию и тем более к фото

Больше примеров и наглядности - здесь

Да, осталось автоматом определять класс и стиль исходного изображения с максимальной точностью и применять для него метод, дающий максимальную точность для этого вида изображений (в идеале 100%, если нет мелких элементов между пикселами ужатого изображения). Может Вас смутило название статьи - здесь "точный" означает максимально точный насколько это возможно. Понятие вида "идеальный газ"

Думаю, ответ на вашу задачу будет тривиален - максимально точно - вместо доп инфы взять дополнительно побольше пикселей (можно разных в разное время) - быстро - ближайший сосед или интерполяция. Моя задача возникает и в реальном мире - фото/кадр с камеры низкого разрешения или объект на нём вдалеке - и вот уже уменьшенная картинка без доп. информации

Спасибо, в следующей части использую для уменьшения точное усреднение, как на фото - то что в фокусе, но вдалеке

Может, но если это действительно необходимо какому-либо человеку и не существует более лучшей фотографии, то какой метод использовать, чтобы минимизировать ошибку? А вообще с текстами немного другая ситуация - если он не рукописный, и мы знаем язык, шрифт, кегль, кернинг, расстояние то до определённых пределов (например один символ - хотя бы 2х2 пикселя) можно достаточно точно подобрать символы

Всё верно, но другие картинки и модели waifu будут в следующей части

Но, конечно, прибегать к этому всему нужно только тогда, когда достать изображение большего разрешения невозможно или ошибка не так критична, как время, затраченное на получение более детальных данных

К сожалению, бывают случаи когда это нужно - например, медленная скорость интернета, но желание посмотреть видео прямо сейчас и без лишнего мыла.

Качественно апскейлит Upscayl, но обсуждаемая тема - не качество, а точность. Нейросети выдают много качества за счёт галлюцинаций/допущений, снижающих точность, то есть вместо вероятности (информации у нас недостаточно для определения конкретной реализации) выдают одну реализацию, зато качественную.

Information

Rating
Does not participate
Location
Россия
Registered
Activity