it_history Apr 25 2021 at 21:22

Профессор Яаков Зив: автор метода сжатия данных без потерь

7 min

20K

CloudMTS corporate blogData compression*History of ITPopular scienceBiography of geeks

+60

Comments 24

KYuri Apr 26 2021 at 00:23

Каким боком mp3 затесался в ряды «lossless data compression»?

+12

mapron Apr 26 2021 at 02:50

Пометили бы статью «перевод», написали бы комментарий от переводчика что автор перепутал lossless и lossy, была бы зачетная статья для Хабра

www.haaretz.com/israel-news/tech-news/.premium-the-man-who-actually-made-the-world-a-better-place-with-data-compression-1.9497904

You’ve probably never heard of him, but you have certainly used technology based on his mathematical inventions — most famously lossless compression of data which enables us to use files like PDF, GIF, MP3 and countless others.

(есть вообще какие-то санкции для тех кто не оформляет посты-переводы как перевод? хотя это корп блог. им всё можно.)

+12

optemist Apr 26 2021 at 05:58

Лично мне не мешает, что статья — перевод. Главное, чтобы читалось хорошо.

KvanTTT Apr 26 2021 at 13:19

Проблема не в самом переводе, а оформлении — как минимум некрасиво выдавать переводы за свои статьи.

mapron Apr 26 2021 at 06:02

Я ошибся.
en.wikipedia.org/wiki/LZ77_and_LZ78
Это действительно lossless алгоритмы.

Soffort Apr 26 2021 at 03:31

У меня есть подозрение, что в сжатии с потерями используют в том числе алгоритмы сжатия без потерь на каких-то этапах.

x86128 Apr 26 2021 at 06:43

Да, коэф-ты после FFT (что в MP3 что в JPEG) квантуются и ужимаются методом Хаффмана, но не LZW.

be52 Apr 26 2021 at 04:24

так в мп3 потери не от сжатия, там просто отбрасывается то что человеческое ухо не слышит а остальное сжимается уже без потерь

vladkorotnev Apr 26 2021 at 05:16

А в жпеге потери тоже не от сжатия, там просто дискретным косинусоидальным преобразованием отбрасывается всё то, что человеческий глаз не слышит, а остальное сжимается уже без потерь? :-)

x86128 Apr 26 2021 at 06:50

Да, остальное сжимается без потерь.
Полученные коэффициенты после ДКП квантуются (вот тут как раз потери возникают) и потом сжимаются методом Хаффмана (который lossless) и укладываются в файл.

vladkorotnev Apr 26 2021 at 08:15

Тут вопрос терминологии, в таком случае надо делать ремарку отделять понятия "кодек" и "компрессор", тогда да — можно сказать, что в кодеке мп3 из-за именно компрессии потерь не возникает. Иначе исходный коммент звучит слегка нелепо.

Понятно, что в основе многих систем сжатия с потерями будет лежать сжатие без потерь на каком-то этапе — просто потому что раз уж жмём, почему бы и не дожать, раз уж можем.

x86128 Apr 26 2021 at 10:09

Кодек — это сокращение от кодер/декодер, компрессор это и есть кодер.
Сжатие достигается путем отбрасывания младших бит у коэффициентов ДКП высокочастотных составляющих + дополнительное уменьшение числа бит на коф-т за счет кодирования методом Хаффмана (арифметическое сжатие).

RomanArzumanyan Apr 26 2021 at 21:36

Сжатие достигается путем отбрасывания младших бит у коэффициентов ДКП высокочастотных составляющих

Сначала режут высокочастотные компоненты преобразования ДКП, а потом квантуют низкочастотные. Грубо говоря, из 64 коэффициентов ДКП преобразования 8х8 оставляют 5-6, остальные обнуляют. Потом оставшиеся 5-6 квантуют. После квантования бинаризация строк, затем уже сжатие бинарных строк без потерь различными методами: это может быть и алгоритм Хаффмана, а может быть и простое Run-Length кодирование.

Арифметическое сжатие — это уже другой, более сложный алгоритм. Применяется начиная с H.264.

Для преобразования двумерной матрицы коэффициентов в одномерную используют порядок обхода зигзагом (см. логотип ffmpeg).

nochkin Apr 26 2021 at 06:12

Очень просто: при переводе предложение было ужато и там потерялась немного информации.

astronom1 Apr 26 2021 at 00:44

Он пришел в футболке с надписью «Пришел, увидел, купил»

вот ведь… тролль ))))

vis_inet Apr 26 2021 at 05:46

Будущий математик и изобретатель родился уже в Израиле

Поправьите — тогда это был ещё не Израиль, а Подмандатная Палестина.

lasalas Apr 26 2021 at 09:43

Уже почти 30 лет минуло, как я реализовывал LZW на C (генерация сжатого TIFF для первого отечественного слайд-сканера). Алгорит простой и элегантный. Спасибо дедам!

victor79 Apr 26 2021 at 12:23

Вот я придумал (изобрел?) алгоритмы улучшения качества прогноза на текстовых данных (та же суть, что GPT, но без нейронных сетей). Может некторые из них уже где-нибудь и обсуждались, но не суть. Интересно, что мне нужно сделать, что бы их запатентовать? Если я их просто на хабре опишу, то их просто начнут другие использовать, а обо мне даже не вспомнят.

KvanTTT Apr 26 2021 at 13:21

Пробуйте обратиться в патентное бюро. Но вообще если вы выкладываете в открытый доступ с нужной лицензией, то украсть это сложно.

victor79 Apr 26 2021 at 14:01

Предполагаю, что с одной стороны при этом будет много бумажной волокиты, которую под силам разгрести только опытным юристам или тем кто с университетских кругов общается с такими бюро и имеет там знакомства. Как минимум нужно быть где-нибудь рядом с таким бюро, занимающимся именно таким направлением, а не по электронной или почтовой переписке это делать.

А с другой стороны, это существенно не простое взаимодействие разных алгоритмов, и будут ли там вникать в такие сложности? В общем, думаю что при этом просто потону в разбирательствах и до регистрации не дойдет, а описания где-нибудь останутся.

tm1218 Apr 26 2021 at 15:37

Родоначальником методов сжатия данных без потерь был Дэвид Хаффман

InterceptorTSK Apr 26 2021 at 20:40

Должно быть, Зив сказочно богат? Увы, нет.

А разве должен быть сказочно богат? Извините, а за что?
Аналогия: найдите того кто решил квадратное уравнение и сделайте его сказочно богатым.

При этом премии у Зива имеются, к каждой премии идут гонорары, иногда приличные иногда так себе.
Премия Израиля… 75 тысяч шекелей
Медаль Ричарда Хэмминга… хз
Премия Маркони… 100 тысяч долларов США
Фонд Эдуарда Рейна
Премия за фундаментальные исследования. Гонорар 25 тысяч евро.
Технологическая премия. Гонорар 30 тысяч евро.
Культурная премия. Гонорар 10 тысяч евро.
Премия Шеннона… хз
Премия Париса Канеллакиса… $10 тыс.
Ротшильдовская премия… хз
BBVA Foundation Frontiers of Knowledge Awards… 400 тыс. евро
Медаль почёта IEEE… хз

там где стоит «хз» — сходу ценник найти не удалось, ищите сами кому не лень
однако же поверхностное нагугленное позволяет сходу оценить масштаб «трагдии» этого наибеднейшего деда ибо ага, похоже он совсем чютка так и не дотянул до нобелевских сумм, какое горе!!! очень жаль бедного дедушку, ну очень жаль

SantaCluster Apr 27 2021 at 00:06

можно зарабатывать моного денег, но при этом не быть богатым. пропивать, например :) или вести научную/благотворительную деятельность «на свои».
Зато дед — уважаемый человек с большой семьёй, позитивно вошедший в историю.

Mike-M Apr 28 2021 at 23:19

«Ну до чего ж на нашего ~~Буншу~~ Ланового похож!» к/ф «Иван Васильевич меняет профессию».