Антивирус Бабушкина



    Молодой студент-третьекурсник из АлтГТУ разработал компьютерную антивирусную программу под названием “Иммунитет”. По словам АП, эту программу сейчас устанавливают в некоторых школах Барнаула. На данный момент продано уже более тысячи копий этого антивируса! В основном ее устанавливают на персональных компьютерах, но уже приобрели несколько школ и компаний краевого центра.

    Интервью с гением:



    По его словам он отлаживал и писал код для Windows 8, а в данный момент трудится над алгоритмом, который будет сжимать фильм размером в 2Gb всего лишь до 2-3kb! Ну что же, пожелаем удачи этому юному таланту в его начинаниях.

    Посмотреть текущие обсуждения можно здесь и тут.

    P.S. Если Вы вдруг заинтересовались данным кадром и хотите себе его в штаб, вот контакты для связи с ним: Вконтакте

    И, чуть не забыл, еще одно его изобретение:



    UPD Пикантные подробности
    Поделиться публикацией

    Комментарии 1261

    • НЛО прилетело и опубликовало эту надпись здесь
        +53
        Вам смешно, а парня в сколково возьмут ) инновации, прогресс…
          +7
          И папенька проректор ему в этом поспособствует…
          +2
          того, который доктор? зеленое «изобретение» это видимо высокотехнологичная замена огурца )
            +4
              +11
              Молодежь…
              Вот правильная ссылка: quadregus
                0
                Какое шикарное значение кармы!
                +1
                Да и доктора возьмут… огурцы выращивать — программисты ведут сидячий образ жизни, знаете ли
              +9
              Кстати Дениску Попова затравили до того, что он «ушел в искусство») Вроде как учится в каком-то муз.училище… Не состоялась у него блистательная карьера в IT…
                +1
                Да ну? Он же на Лоре отписывался в прошлом году, народ даже его не троллил совсем, код там какой-то ему правили…
                  0
                  quadregus.livejournal.com/ вот его блог, там даже где-то была запись «с посвящения в школе искусств»)
                  0
                  На бокс ходит, вроде
                    +2
                    да, отвратительно играет на фортепиано
                      +3
                      Это принципиально новый стиль игры на фортепиано.
                        0
                        кто-то сравнивал звук гитары издаваемый Поповым, Удивительно но он оказался также принципиально новым, пик в пик совпадающим с некоторыми записями других пользователей интернета, выложенных на youtube.
                    –21
                    image
                    Или Вы не о нем? :)
                      +1
                        –6
                        Они, часом, не родственники? :)

                        И да, минусующие, неужели Вы правда думаете, что Денис Попов и Бол^wг[ж]енос нуждается в представлении на айти-ресурсе?
                          0
                          Мне кажется, это просто конвергенция. :)
                    • НЛО прилетело и опубликовало эту надпись здесь
                        0
                        скорее уж его брат
                        +58
                        BolgenOS второе пришествие?

                        Второе пришествие Попова. :D

                        Мда. Сейчас соберется 100+ комментариев про Дениса Попова
                          +11
                          P.s. это я не переспросил. А всего лишь написал комментарий несколькими секундами позже. Так уж случилось. Потом вставил цитату комментария выше (когда его увидел). Не нужно минусовать.
                            +64
                            Прошу прощения за баян, но анекдоты становятся реальностью:
                            Разговаривают как то Потапов и Бабушкин:
                            — Слушай, вчера написал новый архиватор. Любой файл сжимает в 5 байт!
                            — Ну, просто рулез!..
                            — Ага. Сейчас работаю над разархиватором…
                              +9
                              Это известный продукт, кстати. Архиватор Лыщенко. Причем, он еще более эффективен, чем в анекдоте.

                              PS
                              Ссылка как-то странно отображается, продублирую: www.lapsha.ru/articles/tech/2004/01/06/150700.html
                                +1
                                39344 в двоичной системе будет 0b1001100110110000 а не 0b1001100110100110
                                  0
                                  И хоть бы какой то намек, на то как это разжать потом.
                                  И ведь опубликовали где то.
                                    +1
                                    35 ГБ в 100 кб. utorrent — лучший архиватор!
                                    +10
                                    Ну, я давно знаю такой архиватор MD5, благодаря этому у меня коллекция видео на 3.5 дискете )))))))))))))

                                    и тоже с разархивацией туго ))))

                                      –8
                                      Разархивировать можно через Rainbow table. Таблицы, правда, будут огого какие, но ведь можно!
                                        +4
                                        Нет, представьте себе что нельзя
                                          +8
                                          Еще как можно. Спросите ведущего специалиста в этой области Бабушкина.
                                      –3
                                      Архивирую файлы встроенным в Windows архиватором. Вызывается по Shift+del, потом Enter. Очень сильно экономит место на диске.
                                    +1
                                    Одному мне кажется, что выпуск новостей подозрительно похож на скандально известный? Даже фразы практически те же, не говоря уже о голосах пацана и ведущей :)
                                      +1
                                      Это фейк!
                                    +10
                                    Сначала BolgenOS, теперь это…

                                    И у всех первая мысль с Поповом связана.
                                      +48
                                      Немного погуглив, нашел уникальный код программы:
                                      "

                                      Да и вот тут побольше инфы будет.
                                        +6
                                        Всё оказалось намного интересней. Благодарю, добавил в пост.
                                          +39
                                          Ничего-ничего. Вот доведёт свой «проект» «Флешка-маркер» и однозначно в Сколково поедет. xD
                                            +14
                                            Действительно, пока у «флешки-маркера» есть один небольшой недостаток. Она является только флешкой, но не маркером.
                                              +7
                                              Можно доделать, главное не выкидывать всю вату.
                                                +2
                                                Он просто с другого конца засунул флешку
                                              +7
                                              как пишут на одном ресурсе — ждём ебилдов! :)
                                                +27
                                                ебигусейлдов
                                                +6
                                                var 98 = «Еби гусей» ??? 0_o
                                                  +18
                                                  Пароли ему уже везде поменяли, а то «Alexey456215» выглядит как то небезопасно.
                                                    +5
                                                    Теперь я понял, почему Попов выбрал ник quadregus.
                                                    Quadregus <- квадрегусь <- четыре гуся.
                                                    С ним, оказывается, не только мысленная связь, но и половая.
                                                      –2
                                                      Жили у бабуси два весёлых гуся…
                                                        +2
                                                        Четыре
                                                          0
                                                          Из-за рифмы пришлось сделать несоответствие.
                                                        +1
                                                        А я один на картинке про гусей увидел логин и пароль от сервера? O_o
                                                        +31
                                                        А на болгенос встанет, интересно? А то Антивирус Попова скучен, да и обои надоели. Надеюсь, что аффтар сделает набор фанатских рулонов обоев.
                                                        +29
                                                        … но уже приобрели несколько школ и компаний краевого центра.

                                                        Чей он там сынок?
                                                          +72
                                                          Вот тут написано, что
                                                          Название программы Алексею помог придумать его отец — проректор по учебной работе медицинского университета.
                                                          +74
                                                          image
                                                            +3
                                                            Я бы даже это facefoot`от назвал
                                                              +109
                                                              image
                                                              +35
                                                              Как такое можно пускать в эфир?
                                                              Неужели Попов еще не научил консультироваться у специалистов?
                                                                +34
                                                                24 Февраля 2013 года. Где-то глубоко в Kaspersky Lab…



                                                                ИТАР-ТАСС: Студент Алтайского государственного политехнического университета создал антивирус. Его продукт, активно уничтожающий вирусные программы и занимающий скромный объем в ресурсах компьютера…
                                                                .


                                                                +18
                                                                Эфир — пофигу, там и не такое есть. Но мои деньги, которые я отдал в виде налогов, на это тратить уже слишком.
                                                                  +3
                                                                  кстати, можно задать вопрос этой милой девушке.
                                                                  +197
                                                                  «всего лишь до 2-3kb»
                                                                  ну это не сложно, сложнее сделать так, чтобы еще и «разжимал»
                                                                    +174
                                                                    Такой алгоритм давно уже придуман, формат архива — *.torrent :D
                                                                      0
                                                                      Можно так же «архивировать» создав ярлык, разархивация «на-лету» :)
                                                                        +38
                                                                        Вам смешно, а мне так в 13 лет файлы друг на флопике принёс…
                                                                          +17
                                                                          Не ты один такой =(
                                                                            +6
                                                                            Мне брат когда-то в далеких 90ых игр 50 на дискете скинул ярлыками :)) думал поиграю я :)
                                                                              +23
                                                                              Все через это прошли…
                                                                                0
                                                                                Нет. Мы с кассетами бегали. Слава богу, на тот момент уже бобины отошли…
                                                                            0
                                                                            Скорее Magnet-ссылка. *.torrent может и мегабайт занимать)
                                                                            +56
                                                                            Он явно изобрел md5. Только вот разархивацию не сделал еще.
                                                                              +15
                                                                              Ага, сжатие с потерей информации.
                                                                                +7
                                                                                Зато правообладатели не страшны.
                                                                                  0
                                                                                  Я когда-то предлагал такое — искать содержимое файла в /dev/urandom. Вопрос был в том, насколько это легально — тогда мне сказали, что это всё равно считается копией.
                                                                                  Про хэши вопрос остаётся в силе — ведь можно сделать специально «слабый» алгоритм шифрования и доставать из его хэшей файлы как кроликов из шляпы.
                                                                                    +3
                                                                                    >>Про хэши вопрос остаётся в силе — ведь можно сделать специально «слабый» алгоритм шифрования и доставать из его хэшей >>файлы как кроликов из шляпы.

                                                                                    Так нельзя же. Придется фильтровать все коллизии, попутно с нужным файлом, вам выгребет миллионы копий с тем же хэшем.
                                                                                      –24
                                                                                      Ничто не мешает сделать слабый алгоритм хэширования, не имеющий коллизий. Да и коллизий на фиксированной длине сообщений не так уж и много.
                                                                                        +35
                                                                                        Математика мешает. Не сможете вы биекцию в любое подмножество сделать при фиксированном размере хеша. Да и биекция — это уже не хеширование, это уже шифрование будет.
                                                                                          +1
                                                                                          Ну формально можно же хешировать файл блоками размером с сам хеш, для пущей надёжности. :)
                                                                                            +3
                                                                                            А в чем суть? Мы же говорим про сжатие, а у вас тогда никакого сжатия не будет. Кроме того — даже в случае преобразования 1к1 по размерам — вам все равно нужна биекция, а это уже не тянет на хеш.
                                                                                              +4
                                                                                              Тут по моему обсуждение плавно перетекло в тему «как лицензионно тырить нелицензионные фильмы» и просто если «какбы-хэшировать» фильм, а потом когда никто не видит — налету его доставать из этого псевдохэша. В итоге все довольны, фильма у меня нет, есть только его хэшь, а посмотреть я его могу
                                                                                                +1
                                                                                                Вопрос в том, насколько это юридически обоснованно. На LOR'е «анонимные аналитики» «убедили» меня, что этот трюк в судах США шансов не имеет.

                                                                                                Вопрос остался открытым, в общем-то.
                                                                                                0
                                                                                                Разговор про «вытаскивание файлов из корзины» и сразу не был ни про шифрование, ни про хэширование.
                                                                                                –3
                                                                                                А можно вообще блоками размером в один байт. Или в пару байтов. Или сколько-там-не-жалко процессорного время.
                                                                                                  0
                                                                                                  Лучше в ноль байт и битов. Если нет разницы зачем платить больше )))
                                                                                                    0
                                                                                                    Ааа, так вот о каком циклическом нуле речь!
                                                                                                –21
                                                                                                Извините, разве, например, SHA1 на размере его блока (20 байт, 160 бит), имеет коллизии? И имеет ли коллизии (самый слабый) алгоритм «хэширования» — XOR?

                                                                                                В конце концов, никто не мешает разбивать сообщение на части (хоть по байтам) и хэшировать именно их, «подбирая» в последствии эти блоки.

                                                                                                Вопрос тут в том, является ли это с юридической точки зрения копированием.
                                                                                                  +12
                                                                                                  1) имеет.
                                                                                                  2) XOR не имеет и это не хеширование
                                                                                                  3) для чего это?
                                                                                                    +6
                                                                                                    Вы сводите множество А к множеству B, причём B гарантированно во много раз меньше А.
                                                                                                    Вопрос: возможна ли взаимная однозначность?
                                                                                                    • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                        +5
                                                                                                        А если множества бесконечные то «во много раз меньше» не определено (либо определено через невозможность взаимной однозначности).
                                                                                                        • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                            +1
                                                                                                            Между множествами разной мощности все-равно не существует взаимно-однозначного отображения.
                                                                                                          • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                              0
                                                                                                              Множество результатов хэш-функций в любом случае ограничено из-за фиксированной длинны.
                                                                                                              А — бесконечное, согласен. Тем более =)
                                                                                                  +12
                                                                                                  >Я когда-то предлагал такое — искать содержимое файла в /dev/urandom.

                                                                                                  Зачем вам тогда хэш? Вы ведь в /dev/urandom уже и так все фильмы имеете, даже которые еще не сняли.
                                                                                                    0
                                                                                                    Я как то озадачился в школе еще математикой. Если файл — это набор чисел, то в теории перебором можно получить любой файл картинку книгу. Начал считать количество переборов. Потом прикинул скорости текущих процессоров. Расстроился.
                                                                                                      +5
                                                                                                      А если генерировать страницы текста, то там когда-то проскочит как создать лекарство от рака. Дело останется за малым – выбрать правильный вариант!
                                                                                                        +11
                                                                                                        Будет трудно, потому что миллионы страниц будут озаглавлены «Лекарство от рака» и начинаться со слов «Возьмите свежий огурец и засуньте его...». Еще столько же будут описывать такое же применение соленого орурца. Миллиарды страниц вообще будет невозможно прочесть из-за того, что они будут написаны на древних языках в плохом транслите, а еще столько же — на русском с кучей ошибок.
                                                                                                          +3
                                                                                                          Я ж и говорю: останется только выбрать правильный вариант :)
                                                                                                            +3
                                                                                                            Слушайте, Вам с Вашим слогом надо фантастику писать. Попробуйте, я уверен: получится захватывающе и увлекательно :)
                                                                                                                0
                                                                                                                Короче, я опоздал.
                                                                                                                +1
                                                                                                                Волей судеб, пан Станислав тему тоже разрабатывал: dtskpl.ru/work/1076/,
                                                                                                                «Путешествие шестое, или Как Трурль и Клапауций Демона Второго Рода создали, дабы разбойника Мордона одолеть»
                                                                                                              0
                                                                                                              Это было следующее что я понял. Надо фильтровать. Следующей идеей было представлять данные как архив и проверять на целостность. Но потом успокоился ))
                                                                                                                0
                                                                                                                Кроме шуток: многие проекты вида @home занимаются в том числе и Монте-Карло-подобным моделированием, либо «доставанием» случайных данных и их проверкой на пригодность.

                                                                                                                Монте-Карло моделирование вообще довольно хорошо прижилось в науке, особенно в ядерной физике. Типично проводят набор моделирований и зависимость их результатов от входных параметров в дальнейшем используют как входные данные для машинного обучения: так работают LHC@home, Cosmology@home и т.д.
                                                                                                          +2
                                                                                                          я прям представил правообладателей с рулоном хэшей
                                                                                                        +6
                                                                                                        Работает по принципу торрентов, но с использованием /dev/astral:

                                                                                                        echo "md5sum=0373980cd6f270e1172067b86c044633 type=iso9660 size=4448059392" > /dev/astralctl
                                                                                                        dd if=/dev/astral of=openSUSE.iso

                                                                                                        Тут аж 4 Гб до 16 байт «упаковано» :)
                                                                                                        +26
                                                                                                        Алексей Бабушкин
                                                                                                        Про архивацию, вынудили:
                                                                                                        Алгоритм архивации таков: любой файл представляет собой HEX-последовательность символов, переводим этот HEX в DEC, получаем неебически-большое число, дописываем перед этим число 0, — получаем число в диапазоне от 0 до 1 с огромным числом знаков после запятой, а дальше всё просто — подбираем 2 таких целочисленных числа, частное которых даст нам искомое число в диапазоне от 0 до 1 с точностью совпадений до последнего знака. Беда в подборе чисел, которое может идти и 2 часа, а может идти и 2 недели. Есть опытные образцы и работающая программа, и всё это работает.


                                                                                                        В приннципе, что-то в этом есть. Сразу вспомнил статью, где нашли очередное самое большое простое число — может и не зря, в итоге, ищут :-).
                                                                                                          +26
                                                                                                          Судя по алгоритму, любой файл у него должен представлять НЁХ-последовательность.
                                                                                                            –48
                                                                                                            Я, возможно, не в теме, но в чем проблема представить набор единиц и ноликов в виде HEX-поседовательности?

                                                                                                            Парень, конечно, зря про «восьмерку» заговорил в интервью, но нестандартные идеи у него есть — этого не отнять. А значит может выйти толк, главное мыслить outside of the box. А то налетели сразу, коршуны, лишь бы пообсасывать кому-то косточки.
                                                                                                              –17
                                                                                                              все равно где-то будет прокол, будет два таких самых числа или подобное… потом распакованое видео «кубиками» будет )))
                                                                                                                +86
                                                                                                                А ничего, что для большинства файлов оно найдёт два числа лет этак через пять, причём их запись будет длиннее исходного файла?
                                                                                                                  –47
                                                                                                                  Касательно сроков — железо развивается (не вижу здесь препона: сегодня долго, завтра сможет делать ваш мобильник). Касательно того, что будет длиннее: я не математик, оспорить не могу (проще говоря, не знаю). Вы можете как-то доказать, что эти два числа «длиннее»?
                                                                                                                  • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                      –17
                                                                                                                      Если честно, вообще вас не понял («если некоторые меньше, значит некоторые больше»). Мне правда не очевидно, что запись этих двух чисел обязательно будет занимать, как минимум, тот же объем памяти (а то и больший) — может кто-то на пальцах объяснить?
                                                                                                                        –19
                                                                                                                        О, пошла тяжелая артилерия по убиванию кармы — я бы, все-таки, был благодарен за человеческое объяснение, почему запись займет больше места, чем за молчаливый минус.
                                                                                                                          +18
                                                                                                                          Вы серьезно?! o_O
                                                                                                                            –54
                                                                                                                            Хотите бейджик тролля заработать с своими −73 кармы? Простите, но вам еще далеко до «толстоты» — держите плюсик:



                                                                                                                              +10
                                                                                                                              Довыпендривался.
                                                                                                                          • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                              0
                                                                                                                              www.compression-pointers.ru/compress_21.html

                                                                                                                              Попробуйте почитать что-то по теории информации.

                                                                                                                            • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                +16
                                                                                                                                В двух словах: есть ровно 2^31 разных 2-гибибайтных файлов (по определению количества информации). Им соответствует как минимум 2^31 разных архива (2 разных файла не могут быть представлены одним архивом). Если они разного размера, то есть как большие, так и меньшие (все архивы не могут быть меньше: не существует стольких разных файлов размером менее 2 гибибайт). В алгоритме нет никакой оптимизации под любой из часто встречающихся типов файлов, да и обещанное сжатие видео — нереально, следовательно, архив случайно взятого файла будет скорее больше исходного, чем меньше.
                                                                                                                                  0
                                                                                                                                  А архивы не могут быть одинакового размера?
                                                                                                                                    +2
                                                                                                                                    Они не могут быть одинакового содержания. А разных архивов размера N — конечное число, причём всех архивов размера строго меньше 2ГБ меньше, чем разных 2ГБ-файлов.
                                                                                                                                      +1
                                                                                                                                      Нет, если хоть один файл жмется — то математически невозможно чтобы все архивы были меньше или равны по размеру. см. мой коммент ниже.
                                                                                                                                        0
                                                                                                                                        Ваш коммент прочитал чуть позже, чем написал
                                                                                                                                      +6
                                                                                                                                      2^(2^31)
                                                                                                                                        +3
                                                                                                                                        Может туплю, но: ГБ — это 2^30 байт = 2^30 * 8 бит = 2^33 бит. Выходит всего вариантов 2 ^ (2^33).
                                                                                                                                          +3
                                                                                                                                          ГиБ
                                                                                                                                        0
                                                                                                                                        Мне кажется, такое док-во не катит, т. к. про существующие алгоритмы сжатия аналогично можно доказать, что они не работают, но они ведь работают. Да, они учитывают особенности/избыточности существующих форматов, некоторые сжимают с потерями, но и этот странный алгоритм с делением может работать для каких-то наборов данных. Проще сказать, что «очевидно», что он почти никогда работать не будет)
                                                                                                                                          +2
                                                                                                                                          Ну именно в том и дело, что каждый архиватор работает с конкретным типом данных (точнее, с данными имеющими характерные особенности). Белый шум ни один архиватор не сожмет, выйдет только больший файл.
                                                                                                                                            –1
                                                                                                                                            Так тогда и доказывать надо, что этот алгоритм не подходит именно для какого-то типа данных, а не общий случай, что архиваторы не работают на белом шуме. Это неудачная попытка доказать умозрительную очевидность.
                                                                                                                                              0
                                                                                                                                              Понятно, когда такой алгоритм эффективен — когда данные периодичны с небольшим периодом, либо оканчиваются на много нолей. Понятно также, что это ужасно неуниверсально, и не может работать и на фильмах, и на документах. Непонятно совершенно, для какого типа данных оно предназначается, и на каком вообще может быть теоретически эффективно, по крайней мере без дополнительной обработки данных. (Не могу представить себе формат, в котором нельзя бы было поменять последний байт; к такому формату архиватор уже не подходит).
                                                                                                                                                0
                                                                                                                                                Да это всё понятно… другими словами: сомнительно, что это может сработать (по крайней мере, пока не показано обратное на каких-то данных). Но приведённое выше док-во к данному методу не имеет никакого отношения и «строго» оно ничего не доказало по отношению к этому методу. Я лишь про это.
                                                                                                                                          0
                                                                                                                                          Но согласно вашей логике любой алгоритм сжатия — плохой. Если рассматривать его идею, не как идею архиватора, а как идею только алгоритма сжатия, то ваш контраргумент не работает.
                                                                                                                                            0
                                                                                                                                            В двух словах: есть ровно 2^31 разных 2-гибибайтных файлов (по определению количества информации). Им соответствует как минимум 2^31 разных архива (2 разных файла не могут быть представлены одним архивом)...

                                                                                                                                            Звучит очень логично. Но теперь я, от недосыпа, не могу понять, как другие алгоритмы обходят эту логику.
                                                                                                                                              0
                                                                                                                                              Никак не обходят. Просто дело в том, что реально используемые алгоритмы архивации используют свойства реальных данных, например повторяющиеся последовательности.
                                                                                                                                                +2
                                                                                                                                                Они хорошо работают на каком-то подмножестве входных файлов. Например, PPM — на текстах, JPEG — на фото, PNG — на графике и т. д.

                                                                                                                                                Метод в сабже может сработать, скорее всего, на очень небольшом наборе искусственно сконструированных данных. Пример: если исходные файлы хранят десятичные представления дробей с большой точностью. Например, файл с 1 миллионом знаков после запятой дроби 23/713. Логично, что проще будет сохранить 23 и 713, чем мегабайт вида 0.0322580645161290032258064516129003225806451612900322580645161290…
                                                                                                                                                  0
                                                                                                                                                  JPEG тут вообще ни при чём, там сжатие с потерями, исходный файл из него не восстановить. Как и из mp3/mpeg4.
                                                                                                                                                    0
                                                                                                                                                    Да как же не причём — тоже алгоритм компрессии (если конечно сабж можно к ним вообще отнести)), хоть и с потерями, тоже работает на определённых частных случаях данных (фото). Дробями тоже можно приближать исходные данные с потерей точности (1/31 для числа выше), если это допустимо для конкретного вида данных.
                                                                                                                                                      0
                                                                                                                                                      Архивация = сжатие без потерь. Поэтому lossy-сжатие тут ни при чём.
                                                                                                                                                        +2
                                                                                                                                                        Это лишь спор о терминах, сути это не меняет. В сабже топика речь про «сжатие». К тому же JPEG умеет сжимать и без потерь ru.wikipedia.org/wiki/JPEG-LS
                                                                                                                                              +24
                                                                                                                                              Все просто. Предположим что у нас есть множество всех файлов объемом до 2Гб. Любой архиватор без потери — это биекция. Теперь мы утверждаем, что существует хотябы один файл, который архиватором «жмется».
                                                                                                                                              Рассмотрим исходное множество как набор множеств (файлы в 1 байт, файлы в 2 байта, файлы в 3 байта и т.д. до 2Гб).
                                                                                                                                              Пусть сжимаемый файл имеет размер K и сжимается до L. Тогда получается что в исходном пространстве количество всех файлов размера до L — больше чем осталось свободных ячеек размера до L в целевом пространстве (т.к. там находится архив файла размером K). Но т.к. архивация — это биекция, то мощность конечных множеств должна совпадать, а это значит что невозможно отобразить подмножество файлов размера до L в архивы размера до L, обязательно будут архивы больше размера L. Т.е. архиватор какие-то файлы сделает больше, чем они были до архивации.

                                                                                                                                              Немного коряво вышло, но думаю идея математики понятна.
                                                                                                                                                +1
                                                                                                                                                Я правильно понял, что это относится к любому архиватору?
                                                                                                                                                  +9
                                                                                                                                                  Да, это общие суждения, относящиеся к совершенно произвольному архиватору.
                                                                                                                                                    +2
                                                                                                                                                    Это математическая модель, ей вообще параллельно до всяких архиваторов :)
                                                                                                                                                    –1
                                                                                                                                                    Хех, я матан с первого курса вспомнил благодаря комменту)
                                                                                                                                                      +2
                                                                                                                                                      теория множеств же
                                                                                                                                                        +3
                                                                                                                                                        Вообще — это не матан. В данном случае это мат. аппарат теории множеств.
                                                                                                                                                          +1
                                                                                                                                                          Ну у меня это было в курсе матанализа. Так как я не математик, а физик, то, надеюсь, мне это простительно)
                                                                                                                                                            +3
                                                                                                                                                            По-моему, это на уровне бытовых рассуждений можно понять, очень простая вещь.
                                                                                                                                                              –3
                                                                                                                                                              Скажите это МГУ, в СУНЦе которого, на вполне математических направлениях, множества, почему-то, объясняются на матане.
                                                                                                                                                                +2
                                                                                                                                                                Ну так это их ошибка. Я не могу быть ответственнен за это.
                                                                                                                                                                  0
                                                                                                                                                                  Я не обвиняю вас, я объясняю причину заблуждения о принадлежности множеств даже среди посетителей Хабра.
                                                                                                                                                                  +1
                                                                                                                                                                  В СУНЦе всего три математики в расписании: геометрия, мат. ан и алгебра. Это не мешает затронуть куда больше разделов в пределах этих «официальных названий» курсов.

                                                                                                                                                                  Взять и ввести пару или полпары ТМ, ТГ или ещё чего-нибудь? Получить дополнительные экзамены, бардак в расписании? Проще рассказать в рамках каких-нибудь основных курсов и/или спецкурсов.

                                                                                                                                                                  Это, правда, совсем не освобождает от необходимости понимать к какому разделу относится тот или иной кусок курса.
                                                                                                                                                              +35
                                                                                                                                                              То же самое языком для человеков.
                                                                                                                                                              Предположим, что есть архиватор, который сжимает абсолютно любой файл, то есть размер архива всегда меньше размера исходного файла.
                                                                                                                                                              Тогда применяя этот архиватор много раз подряд, мы можем сжать любой файл до 0 байт.
                                                                                                                                                              Но такой файл нельзя распаковать:)
                                                                                                                                                              • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                  +2
                                                                                                                                                                  ну меньше байта ведь есть величины да? :)
                                                                                                                                                                    +7
                                                                                                                                                                    Более того, в архиваторах, использующих арифметическое кодирование, есть величины меньше одного бита :)
                                                                                                                                                                      0
                                                                                                                                                                      Расскажите подробнее.
                                                                                                                                                                  +1
                                                                                                                                                                  Там немного более сильное условие было. В вашем случае архиватор, который не увеличивает файлы — прокатил бы. Но даже такое невозможно. Если что-то сжали, что-то надо увеличить.
                                                                                                                                                                    0
                                                                                                                                                                    архиватор, который не увеличивает файлы — прокатил бы. Но даже такое невозможно.
                                                                                                                                                                    Нет, необязательно. Просто несжимаемые данные вставляются неизменными.
                                                                                                                                                                    • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                        +1
                                                                                                                                                                        Можно просто оставлять файл неизменным и называеть его архивом ;)
                                                                                                                                                                        0
                                                                                                                                                                        Формально так нельзя поступать, т.к. тогда мы не отличим файл архива от распакованных данных.
                                                                                                                                                                          0
                                                                                                                                                                          тогда мы не отличим файл архива от распакованных данных
                                                                                                                                                                          В условии об этом ничего, тащемта, не было.
                                                                                                                                                                            0
                                                                                                                                                                            Просто тогда архиватор будет некорректно работать в общем случае. Так что в условии это было, т.к. подразумевалась рабочая модель.
                                                                                                                                                                              0
                                                                                                                                                                              Можно имя менять. Дописывать .out к «сжатому». Кстати, этот чит подойдёт и для сжатия с реальным сжатием — несжимаемым файлам в имя «архива» будет дописываться спец. метка.
                                                                                                                                                                                0
                                                                                                                                                                                Ну такими темпами можно первые несколько символов файла вообще удалять и дописывать к его имени. Тогда архиватор будет все что угодно сжимать. Только это неправильно.
                                                                                                                                                                                  0
                                                                                                                                                                                  Ну, имя файла тоже не бесконечно увеличивать можно.
                                                                                                                                                                                • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                    0
                                                                                                                                                                                    Так только один раз же. Я имею в виду: если файл не сжимается, то метка дописываться больше уже не будет, а если сжимается, то вместо «сэкономленных» при сжатии данных можно вписать служебные.
                                                                                                                                                                                    • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                        0
                                                                                                                                                                                        Равнозначно потере данных при смене расширения у любого другого файла.
                                                                                                                                                                                    0
                                                                                                                                                                                    А что тогда делать с файлом имя которого уже 256 символов (или сколько там максимально в данной фс).
                                                                                                                                                                                      –1
                                                                                                                                                                                      Не трогать, очевидно же! Файл с расширением, не совпадающим со стандартным для архива, считается сжатым с коэффициентом 1:1.
                                                                                                                                                                          +5
                                                                                                                                                                          Вы жестоки, но я осмелюсь оспорить это: «Архиватором Алексея — Можно!!!!»
                                                                                                                                                                            +2
                                                                                                                                                                            Вы ошиблись, в слове «можно» все буквы должны быть заглавными:) Иначе не сработает.
                                                                                                                                                                              +1
                                                                                                                                                                              Не обязательно. Универсальный критерий рекламного текста, который продает хрень, уже соблюдается. В Нем Есть Предложение В Котором Все Слова Написаны С Заглавной Буквы!
                                                                                                                                                                            0
                                                                                                                                                                            Много раз нельзя, обычно уже после первой итерации вся информация, поддающая алгоритмическому «сжатию» уже закодирована. Все следующие итерации сжатия будут лишь незначительно увеличивать «архив» за счет добавления служебной информации от архиватора. Даже при использовании разных алгоритмов на итерациях, ситуация особо не изменится, так как все они сводятся к уменьшению информации благодаря кодированию повторяющихся данных или предсказуемых последовательностей.
                                                                                                                                                                              +2
                                                                                                                                                                              То же самое языком для человеков.
                                                                                                                                                                              Предположим, что есть архиватор, который сжимает абсолютно любой файл, то есть размер архива всегда меньше размера исходного файла.
                                                                                                                                                                              Тогда применяя этот архиватор много раз подряд, мы можем сжать любой файл до 0 байт.
                                                                                                                                                                              Но такой файл нельзя распаковать:)

                                                                                                                                                                              У нас таким алгоритмом, некоторые умельцы, в университете конспекты (лекции) сжимали, в 0-байт информации! Причем к алгоритмам такого сжатия были допущены только избранные, в принципе если тетрадку не теряли в течении всего учебного процесса в ВУЗе, то ее хватало ровно на 5-ть лет!
                                                                                                                                                                              +1
                                                                                                                                                                              доказали, что zip/rar/.… не могут работать)
                                                                                                                                                                                0
                                                                                                                                                                                Они и не работают, точнее работают в очень редких случаях) Например в тексте 17% объема занимают пробелы и поэтому тексты хорошо сжимаются.
                                                                                                                                                                                  –1
                                                                                                                                                                                  Например в тексте 17% объема занимают пробелы и поэтому тексты хорошо сжимаются.

                                                                                                                                                                                  На сколько я понимаю, при сжатии последовательности байтов заменяются на более короткие. На что заменить отдельностоящий пробел? Он же и так один байт занимает?
                                                                                                                                                                                    +2
                                                                                                                                                                                    на 1-7 битов (http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%B4_%D0%A5%D0%B0%D1%84%D1%84%D0%BC%D0%B0%D0%BD%D0%B0), можно заменять и большие группы, например, «if (» (http://ru.wikipedia.org/wiki/LZW).
                                                                                                                                                                                  0
                                                                                                                                                                                  Могут, но существуют такие файлы (например, те же архивы), результат работы архиватора на которых будет больше, чем входной файл.
                                                                                                                                                                                  • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                      0
                                                                                                                                                                                      Естественно. Но это прекрасно укладывается в описанную выше математическую модель.
                                                                                                                                                                                        0
                                                                                                                                                                                        причём это можно закодировать 1 битом, ну или 1 байтом, для круглой цифры
                                                                                                                                                                                        • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                            0
                                                                                                                                                                                            Не обязательно она будет неуспешной. Существует вариант, когда по случайности конец файла будет совпадать с контрольной суммой. И тогда архиватор некорректно работает.
                                                                                                                                                                                            • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                                0
                                                                                                                                                                                                  0
                                                                                                                                                                                                  Потому что по сути — это часть информации, необходимая для разархивирования, только вынесенная в имя. Просто костыль, мат. модель от этого не изменилась. Если удалить эту информацию — однозначность теряется, мы не можем разархивировать файл. Не следует путать эту ситуацию с просто знанием о том, что файл — архив.
                                                                                                                                                                                                0
                                                                                                                                                                                                Для несжимаемых проверка контрольной суммы всегда будет неуспешной


                                                                                                                                                                                                Почти всегда) Если исходный файл был как раз данные+контрольная_сумма (намеренно или случайно) и его заархивировали (без сжатия, т. к. алгоритм его не смог сжать), то операция разархивирования будет пытаться его разархивировать, т. к. найдет верную контрольную сумму. Только это всё уже далеко от сабжа)
                                                                                                                                                                                      +12
                                                                                                                                                                                      Вообще не ожидал от вас таких вопросов. ИМХО конечно, но программист, позиционирующий свою зарплату в $8К — всетаки должен знать математику на таком уровне.
                                                                                                                                                                                        –20
                                                                                                                                                                                        Я боюсь, у нас с вами разные представления о задачах программистов (а также необходимых навыках). Да, действительно, не получится мне поддержать разговор о непрерывности по Дедекинду.
                                                                                                                                                                                          +23
                                                                                                                                                                                          Дело не в хардкоре, это достаточно базовые вещи с точки зрения Computer Science.
                                                                                                                                                                                            –26
                                                                                                                                                                                            Просто я не только программист (к слову, давно уже не программист в обычном понимании этого слова), который оправдывает свой ценник другим набором навыков (отличным от знания теории групп и т. д.).
                                                                                                                                                                                              +10
                                                                                                                                                                                              Ну, а можете расшифровать набор навыков этот и объяснить, почему в него не входят базовые вещи из Computer Science и математики?
                                                                                                                                                                                              • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                                  +2
                                                                                                                                                                                                  Не факт, $8K — это прайс, который уже пол года висит в его резюме на hh.ru. Скорее попытка наняться в фирму, где начальство не соображает в IT, а IT отдел еще не создан. Тогда полный профит, никто и не укажет на его некомпетентность. Мы его приглашали к себе в уже существующий отдел — он отказался даже приходить на собеседование.
                                                                                                                                                                                                  • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                                      +1
                                                                                                                                                                                                      Возможно, хотя, наверняка, бывают и исключения. Ну тем не менее такой персонал обычно подбирается через кадровые агенства, а они друг с другом сотрудничают в плане обмена данными о кандидатах, так что можно с большой долей вероятности говорить что конкретно данный кандидат теперь станет широко известен в этих кругах.
                                                                                                                                                                                                +5
                                                                                                                                                                                                Понятно. Возможно я не прав, но был уверен, что важно знать пусть немного вещей — но на глубоком и хорошем уровне, чем знать много чего, но на посредственном.
                                                                                                                                                                                                  –3
                                                                                                                                                                                                  Edited: ошибся веткой (ответ выше).
                                                                                                                                                                                                    +17
                                                                                                                                                                                                    Это ответ на этот комментарий. Просто когда я отвечал, каменты выше еще не был отредактирован и был копией камента по ссылке.
                                                                                                                                                                                                    Эффект Даннинга — Крюгера — когнитивное искажение, которое заключается в том, что «люди, имеющие низкий уровень квалификации, делают ошибочные выводы и принимают неудачные решения, и не способны осознавать свои ошибки в силу своего низкого уровня квалификации». Это приводит к возникновению у них завышенных представлений о собственных способностях, в то время как действительно высококвалифицированные люди, наоборот, склонны занижать свои способности и страдать недостаточной уверенностью в своих силах, считая других более компетентными.


                                                                                                                                                                                                    Ваш комментарий:
                                                                                                                                                                                                    Просто я не только программист (к слову, давно уже не программист в обычном понимании этого слова)

                                                                                                                                                                                                    По моему тут есть расхождения.
                                                                                                                                                                                                      –1
                                                                                                                                                                                                      У нас поменялся порядок комментариев (подумал, что ответил в другую ветку и стер комментарий, опубликовав еще раз а оказалось, что достигнут предел вевления комментариев): получилось, что это вы написали про эффект Даннига, а я глупо оправдываюсь, говоря, что знаю, что это такое (опять с вами покормим троллей).
                                                                                                                                                                                                      0
                                                                                                                                                                                                      Даблпост, запутался в комментариях, тут был вот этот ответ.
                                                                                                                                                                                                      –7
                                                                                                                                                                                                      Все верно (но и последнее отлично для выбора стратегии и направления движения, так сказать, helicopter view). Я знаю на глубоком, хорошем уровне другие вещи, которые нужны для задач, которые передо мной встают (плюс важно помнить, что помимо навыков есть другие вещи, на тему хватки, видения продукта, понимания ситуации и т. д.).

                                                                                                                                                                                                      Просто то, что здесь сейчас обсуждают — не из их числа. Да, я не знаю этого, я осознаю это и мне не стыдно это признать (хотя бы потому, что я прекрасно знаю, в том числе, и такие вещи как эффект Даннинга-Крюгера).
                                                                                                                                                                                                      • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                                                                                                          +3
                                                                                                                                                                                                          >Я знаю на глубоком, хорошем уровне другие вещи, которые нужны для задач, которые передо мной встают (плюс важно помнить, что помимо навыков есть другие вещи, на тему хватки, видения продукта, понимания ситуации и т. д.).

                                                                                                                                                                                                          Йес! Я знал, знал!
                                                                                                                                                                                                          У вас офигенная хватка. Из двух бездарей (Попов, Бабушкин) вы выбрали того у которого папа круче. Какой же эффективный менеджер пройдёт мимо возможности отката. Хватка!
                                                                                                                                                                                                          Продукт видите и ситуацию понимаете не в бровь, а в глаз! Пока ботаны расчехляют теорию множеств вы так проницательно поняли ситуацию с теми двумя файлами, которые можно пожать за время чуть меньшее половины бесконечности (и восстановить за время чуть меньшее трети бесконечности). Какое потрясающее виденье продукта!
                                                                                                                                                                                                            0
                                                                                                                                                                                                            Знаешь, иногда мне кажется что он прав и зачастую людям нужна супер мегасистема хранения с дикими скоростями записи. А то сроду они пишут пишут пишут, все равно потом никто ничего не читает. Тут главное правильно предложить /dev/null. Вот вы, ботаны, не сможете. А такие как Бабушкин и Попов запросто. И ведь продадут, и ведь потом за техподдержку попросят. А то что если вдруг понадобиться данные таки прочитать так «вы не правильно записали» или «а где файлик волшебный на ftp» или «у вас злобный вирус все удалил».
                                                                                                                                                                                                              0
                                                                                                                                                                                                              Безусловно смогут. Они ведь «не халявщики, а партнёры» :)
                                                                                                                                                                                                    +1
                                                                                                                                                                                                    Какие с Вашей точки зрения знания (и допущение незнания смежных технологий, необходимые навыки ) должны быть, чтобы позиционировать желаемую компенсацию на таком уровне, основываясь на реалиях рынка?
                                                                                                                                                                                                    +13
                                                                                                                                                                                                    Ну и, разумеется, я не вижу ничего зазорного не знать что-либо. Стыдно должно быть не задавать вопросов.
                                                                                                                                                                                                      +3
                                                                                                                                                                                                      Ну а выше мы наблюдаем локальный эффект такой любознательности.
                                                                                                                                                                                                    +3
                                                                                                                                                                                                    На примере частного случая: скажем, мы хотим закодировать число 1 таким способом. Дробь 0,1 получается путем деления 1 на 10. Таким образом, чтобы «заархивировать» всего одну цифру, нужно сохранить 3 цифры. Мне это уже кажется сомнительным.
                                                                                                                                                                                                      0
                                                                                                                                                                                                      Это частный пример: он не показывает, что подобное применимо всегда. На пальцах хорошо объяснили тут habrahabr.ru/post/170487/#comment_5914109