Квайн на Brainfuck, тьюториал

    На Хабре уже есть множество статей о квайнах и технологиях их написания. Любителям квайнов может стать скучно — есть шаблон, следуешь ему, получаешь квайн. Мультиязыковой квайн, даже с участием эзотерических языков тоже написать несложно и об этом тоже есть по меньшей мере три статьи. Вот тут то и приходят на помощь квайны целиком написанные на эзотерических языках, возвращая заскучавшему программисту интерес.

    Попробую рассказать о процессе написания квайнов на Brainfuck.


    Процитирую свою статью Мультиязыковые квайны

    Квайноподобную конструкцию (здесь и далее речь только о языках, где можно разделить данные и код) можно поделить на две части:
    1) сегмент данных (важный момент, эта часть остаётся незаполненной до того момента, когда код будет завершён, после этого он кодируется).
    2) сегмент кода
    Сегмент данных — это некий шифр, который можно расшифровать двумя способами, в результате расшифровки первым способом получится строковое
    представление собственно сегмента данных, при расшифровке вторым способом получится строковое представление сегмента кода. Объединив результаты этих расшифровок, мы получим строку, в которой содержится весь исходный код программы.


    Обратите внимание на выделенный текст. В брейнфаке нет переменных, есть только и исключительно исполняемый код. С другой стороны, есть лента, которой можно и нужно пользоваться для хранения информации.
    Поэтому, для брейнфака схема квайна будет выглядеть так.

    1) Код, который записывает на ленту данные
    2) Код, который читает с ленты данные и выводит код из п.1
    3) Код, который читает с ленты данные и выводит код из п.2 и п.3

    Соответственно код из п.1 можно получить «шифрованием» кода из п.2 и п.3, когда он будет написан.

    В каком виде записывать данные на ленту? Напрашивается запись в виде ascii-кодов символов.

    Напишем функцию на Питоне, которая получает строку и возвращает программу на брейнфаке, записывающую эту строку на ленту.
    def to_brainfuck(st): return '>'+''.join('+'*ord(c)+'>' for c in st)
    


    >>> print to_brainfuck('ku')
    >+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++>
    +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++>
    


    Обратите внимание на ">" в начале программы, пустая ячейка в начале ленты нужна на тот случай, если туда придётся возвращаться. Пустая ячейка это единственный способ остановить цикл в Брейнфаке. Если реализация брейнфака работает с бесконечной в обоих направлениях лентой, ">" в начале можно опустить.

    Теперь вернёмся в начало ленты

    <[<]


    и распечатаем её содержимое:

    >[.>]


    Программа выведет на экран «ku»

    Как написать код для п.1 и п.3 нашей схемы мы уже примерно знаем.
    Теперь п.2, самая сложная часть.

    Итак, нужно написать программу, которая используя содержимое ленты выведет ту строчку, которую вывела комманда print to_brainfuck('ku'), фактически аналог питоновской функции to_brainfuck на брейнфаке.
    Печатать брейнфак умеет только те символы, которые есть на ленте. Комманда "." печатает содержимое ячейки на которой стоит каретка. Следовательно нам нужно записать символы "+" и ">" на ленту.

    >+++++++++++++++++++++++++++++++++++++++++++>
    ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++.


    Обратите внимание на ">" в начале — оставляем пустую ячейку-маркер между тем, что уже есть на ленте и всякой служебной информацией, которую мы туда записываем. Так же обратите внимание на "." в конце. Помните ">" в самом начале программы? Вот тут её и выведем.

    вернёмся на начало ленты

    [<]<[<]>


    теперь напишем вложенный цикл. внутренний цикл «отщипывает» по одному от содержимого очередной ячейки и при каждом таком отщипывание выводит "+", внешний цикл выводит ">" и переходит к следующей ячейке

    [
        [
            [>]>                 доходим до того места на ленте, где лежит "+"
            .                      печатаем "+"
            <<[<]>-            возвращаемся к обрабатываемому символу и отнимаем единицу
        ]      
        >[>]>>                 после того, как символ кончился, доходим до места, где лежит ">"
        .                          печатаем ">"
        [<]<[<]>               возвращаемся к следующему символу
    ]
    


    итак, мы можем написать программу А, заполняющую ленту и программу Б, бегущую по заполненной ленте и выводящую программу А.
    Правда у программы Б есть один недостаток, после её деятельности на ленте ничего не остаётся, а нам содержимое ленты нужно для последующей печати.

    Изменим программу Б так, чтобы при каждом уменьшении содержимого ячейки на одном конце ленты, она увеличивала содержимое ячейки на другом конце. Новый код ставлю под старым и выравниваю, чтобы были видны проделанные изменения:
    [[[>]>. <<        [<]>-]>[>]>>.      [<]<[<]>]   было
    [[[>]>. [>]<+[<]< [<]>-]>[>]>>. [>]+ [<]<[<]>]   стало
    


    После выполнения программы, содержимое ячеек с копией на 1 больше чем нужно. Не будем ничего переделывать, просто поправим и распечатаем

    >>>[->]<<[<]>>>[.>]
    


    этот код мне не очень нравится, кажется можно сильно короче, что-то вроде:

    >>>[-.>]
    


    только без выведения ascii-0 в конце, но сходу не придумывается.
    Соединяем всё вместе

    вносим символы "k" и "u" на ленту
    
    >+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++>
    +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++>
    
    вносим символы "+" и ">" на ленту, а так же выводим ">"
    
    >+++++++++++++++++++++++++++++++++++++++++++>
    ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++.
    
    отмечаем начало области, в которую будем копировать символы
    
    >+
    
    возвращаемся на начало ленты
    
    [<]<[<]>
    
    описанный выше вложенный цикл, основная часть программы
    
    [[[>]>.[>]<+[<]<[<]>-]>[>]>>.[>]+[<]<[<]>]
    
    отнимаем по единице от каждого символа и выводим символы
    
    >>>[->]<<[<]>>>[.>]
    


    итак, у нас есть программа, которая забивает на ленту коды символов «k» и «u», затем распечатывает ту свою часть, которая их забивает, затем распечатывает сами символы. Т.е. в данный момент это уже почти квайн, программа распечатывает свою первую часть, а вместо второй она распечатывает «ku». А всё почему? Потому что именно строку «ku» мы скормили вначале питоновской функции to_brainfuck. А должны были текст программы. Но его тогда ещё не было. Зато теперь есть!
    Теперь самый приятный момент. Берём ту часть программы, которую мы написали руками и скармливаем функции to_brainfuck. Объединяем две части и квайн готов:

    >>> s=""">+++++++++++++++++++++++++++++++++++++++++++>++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++.>+[<]<[<]>[[[>]>.[>]<+[<]<[<]>-]>[>]>>.[>]+[<]<[<]>]>>>[->]<<[<]>>>[.>]"""
    >>> print to_brainfuck(s)+s
    


    Код квайна

    



    Получившийся квайн не слишком компактен из за выбранного способа кодирования, на каждый символ «сегмента кода» приходится около 50 символов «сегмента данных». Можно значительно уменьшить сегмент данных если прибегнуть к другим способам кодирования, разумеется, в этом случае сильно увеличится та часть программы, которую нужно писать руками.

    Да, ещё один забавный момент. Т.к. брейнфак игнорирует все символы, кроме тех восьми, которые являются его коммандами, можно перед шифрованием как-нибудь интересно отформатировать код и/или добавить туда какие-нибудь надписи. Квайн от этого не перестанет быть квайном.

    >+++++++++++++++++++++++++++++++++++++++++++>
    +                                           +
    +             Quine for Habrahabr           +
    +                                           +
    +                                           +
    +++++++++++++++++++++++++++++++++++++++++++++
    +                                           +
    +                                           +
    +                                           +
    +                                           +
    +                                           .
    >                                           +
    [                                           <
    ]                                           <
    [                                           <
    ]                                           >
    [                                           [
    [                                           >
    ]                                           >
    .                                           [
    >                                           ]
    <                                           +
    [                                           <
    ]                                           <
    [<]>-]>[>]>>.[>]+[<]<[<]>]>>>[->]<<[<]>>>[.>]
    


    Внутри квадрата можно ещё чего-нибудь добавить. Полный текст квайна не привожу, т.к. такие игры с форматированием в разы увеличивают размеры «сегмента данных» и квайн становится совсем уж огромным. Спасибо за внимание.
    Кто-нибудь до конца дочитал? :) Апдейт: ничего себе! кому-то даже нравится! Спасибо!
    Похоже, мне удалось написать статью, которая может претендовать на звание самого бесполезного тьюториала Хабра (и возможно не только Хабра)!
    • +24
    • 13.9k
    • 9
    Share post
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 9

      –8
      Мсье знает толк…
      +2
      Как насчет квайна-палиндрома на брейнфаке?
        +2
        Я после Вашей статьи и решил эту написать :)
        Смотрю, опять про квайны вспомнили, а такого тьюториала ещё не было вроде :)
        Что касается квайна-палиндрома, я подумаю, но это заведомо сложнее чем на «нормальных» языках, т.к. в брейнфаке нет комментариев. Точнее комментариями являются любые символы, кроме собственно +-<>[].,
          +2
          Если «палиндромом» на BF считать симметричную строку (когда при симметрии квадратные скобки переходят друг в друга, уголки — тоже, а остальные 4 символа не меняются), то написать палиндромную программу легко:
          +[- какой-то код [-]][[-] док от-йокак -]+
          

          Первый «цикл» всегда выполняется ровно 1 раз, а второй — никогда.

            0
            Точно! Здорово! Сам бы долго думал…
            Честно говоря, этот квайн — моя первая программа на BF. До только делал пару программок, которые код на BF генерировали, а «ручками» — первый раз :) Язык оказался гораздо проще и приятней, чем я о нём думал.
              +1
              Кстати, интересно смотреть, как менялось отношение к BF на Хабре.

              Здесь — habrahabr.ru/post/49209/ любовь и обожание, хотя кроме исходника в посте практически ничего нет. 2009й год
              Здесь — habrahabr.ru/post/113252/ (Ваш пост) зашкаливающая ненависть. 2011й год
              Этот пост — спокойное, ровное отношение :)
          0
          Ничего не понимаю в brainfuck'е, но выглядит действительно красиво!

          image

          Only users with full accounts can post comments. Log in, please.