ashagraev 3 фев 2020 в 07:59

Примитивно-рекурсивные функции и функция Аккермана

7 мин

39K

Функция Аккермана — одна из самых знаменитых функций в Computer Science. С ней связан как минимум один фундаментальный результат и как минимум один просто важный. Фундаментальный результат, говоря аккуратно и непонятно, таков: существует всюду определённая вычислимая функция, не являющаяся примитивно-рекурсивной. Важный результат заключается в том, что лес непересекающихся множеств (также известный как disjoint set union) работает очень быстро.

Мне очень нравится изучать функцию Аккермана, т.к. всё, что с ней связано, очень красиво и изящно. Вот и записанный выше фундаментальный результат понять намного проще, чем это может показаться.

Из текста ниже вы узнаете, что такое примитивно-рекурсивные функции и как выяснить, что функция Аккермана к таковым не относится. И, конечно, этот текст убедит вас в том, что это невероятно красивая конструкция и невероятно красивое рассуждение!

1. Почему это может быть интересно

Рассуждение о связи между примитивно-рекурсивными функциями и функцией Аккермана является примером решения стандартной в теории вычислимости задачи: дана некоторая модель вычислений, некоторая функция, и необходимо определить, является ли эта функция вычислимой в данной модели.

Другие подобные примеры связаны, например, с алгоритмической разрешимостью, эквивалентностью различных моделей вычислений (машин Тьюринга, частично-рекурсивных функций, нормальных алгорифмов Маркова и так далее). А через них мы связываемся уже с совершенно практической областью определения Тьюринг-полноты языков программирования, эквивалентных преобразований текстов программ и прочих интересностей.

Функция Аккермана как будто специально создана для того, чтобы быть изящным примером решения такого рода вопросов. Скоро вы в этом убедитесь.

2. Функция Аккермана

Определение из Википедии для наших целей подходит плохо, поэтому я использую определение из книжки Верещагина и Шеня «Вычислимые функции». Эта конструкция и идейно, и технически несколько отличается от изначальной, придуманной Аккерманом, но сейчас это не так важно.

Введём последовательность функций $inline$ одного аргумента. Определим их рекурсивно:

$display$

$a_{i+1}(x) = a_{i}[x+2](x)$

Здесь $f[n](x) = f\Big(f(...(f(x))...)\Big)$ — в квадратных скобках записывается число $inline$ , и тогда ровно $inline$ раз функция применяется к своему аргументу. Таким образом, значение каждой следующей функций из нашей последовательности определяется так: возьмём предыдущую функцию, $inline$ раза применим её к числу $inline$ — получится значение следующей функции на числе $inline$ .

Кстати, все аргументы здесь натуральные либо ноль — довольно типичный расклад для теории алгоритмов, да и для дискретной математики вообще.

Такое определение набора функций проще всего записать следующим кодом:

def Foo(number, argument):
    if number == 0:
        return argument + 1

    result = argument
    for i in range(argument + 2):
        result = Foo(number - 1, result)

    return result

Для определения значения $inline$ достаточно вычислить значение Foo(i, x).

Так определённый набор функций обладает полезными свойствами монотонности. Во-первых, по аргументу: $inline$ для любых $inline$ и $inline$ . Ну, действительно, $inline$ , а функции со следующими номерами многократно применяют $inline$ к своему аргументу.

Во-вторых, по номеру функции: $a_{i+1}(x) \gt a_i(x)$ для любых $inline$ и $inline$ . Раз все функции строго монотонны по аргументу, а функция со следующим номером применяет функцию с предыдущим номером к этому же аргументу более одного раза — стало быть, итоговое значение получится больше. Чуть подробнее:

$a_{i+1}(x) = a_i[x+2](x) \ge a_i[2](x) = a_i\Big(a_i(x)\Big) > a_i(x)$

Отдельно стоит запомнить, что

$a_{i+1}(x) \ge a_i\Big(a_i(x)\Big)$

3. Примитивно-рекурсивные функции (ПРФ)

ПРФ являются примером «математического исчисления». Исчисление — это способ определять множества объектов через набор аксиом и правил вывода из этих аксиом. В современной математике такой подход распространён широко: его можно встретить и в теории алгоритмов, и в математической логике, и в теории групп, и в куче других мест.

Что такое примитивно-рекурсивная функция? Начнём с «аксиом». Примитивно-рекурсивными функциями являются:

Функция, тождественно равная нулю: $inline$
Функция прибавления единицы: $inline$
Функция-проекция: $inline$

Назовём эти функции базисными. Теперь о «правилах вывода»:

Подстановка. Если $inline$ — функция $inline$ аргументов, а $inline$ — функции $inline$ аргументов, то из них можно собрать функцию $inline$ аргументов $inline$ : берём $inline$ аргументов, подставляем их в каждую из $inline$ функций $inline$ , получившиеся значения используем как аргументы функции $inline$ . Типичная подстановка!

$F(x_1,...,x_n)=f\Big(g_1(x_1,...,x_n),...,g_k(x_1,...,x_n)\Big)$

Примитивная рекурсия. Если $inline$ — функция $inline$ аргументов, а $inline$ — функция $inline$ аргументов, то из них можно собрать функцию, определённую следующим образом:

$display$

$F(x_1,...,x_k,y+1)=g\Big(x_1,...,x_k,y,F(x_1,...,x_k,y)\Big)$

В случае примитивной рекурсии легко угадать признаки того, что мы обыкновенно называем рекурсией. Тут есть конец рекурсии: он происходит, когда последний аргумент обращается в ноль. Есть рекурсивный вызов: для вычисления значения функции с последним аргументом, отличным от нуля, необходимо вычислить значение с уменьшенным значением последнего аргумента. Такое определение является достаточно общим, т.к. в процессе вычислений доступна и сама переменная, по которой осуществляется рекурсия.

Итак, ПРФ — это базисные функции, а также любые функции, полученные из базисных при помощи операций композиции и примитивной рекурсии.

В терминах ПРФ легко построить описания простых всем известных функций.

Например, сложение двух чисел сделаем через рекурсию по второму слагаемому. Если к числу прибавить ноль, то надо вернуть само это число. В противном случае надо к результату прибавить единицу, из второго слагаемого вычесть единицу и запустить рекурсию:

$display$

$Sum(x,y+1)=S\Big(P_3^3(x,y,Sum(x,y))\Big)$

Теория алгоритмов — часть математики, а поэтому требует строгости. В данном случае оператор примитивной рекурсии требует, чтобы при нулевом втором аргументе вызывалась некоторая функция одного аргумента. Хотелось бы написать $inline$ , но я не могу, т.к. просто $inline$ не является функцией. Это вынуждает меня использовать функцию $inline$ . В случае же рекурсивного вызова правила требуют, чтобы в правой части равенства стояла функция трёх конкретных аргументов: $inline$ . Из них всех мне нужен только третий аргумент, поэтому я достаю его при помощи функции $inline$ , а уже затем прибавляю единичку.

Похожим образом можно определить умножение:

$display$

$Mult(x,y+1)=Sum\Big(P_3^1(x,y,Mult(x,y)),P_3^3(x,y,Mult(x,y))\Big)$

Ну и давайте определим что-нибудь поинтереснее. Скажем, последовательность Фибоначчи! Напомню, что она определяется следующим образом:

$inline$
$inline$
$Fib_{n+2} = Fib_n + Fib_{n+1}$

В данном случае придётся помнить два предыдущих значения, а не одно; значит, придётся выкручиваться!

Введём не одну функцию, а сразу две. Первая функция, пусть это будет $inline$ , будет производить искомые числа Фибоначчи. А вторая функция, пусть это будет $inline$ , будет производить числа Фибоначчи со следующим номером, то есть:

$inline$
$G(n) = Fib_{n+1}$

В таком случае первые несколько значений функции $inline$ должны равняться 0, 1, 1, 2, 3, 5; функции $inline$ , соответственно, 1, 1, 2, 3, 5, 8. Тогда рекурсия должна выглядеть следующим образом:
$inline$
$inline$

Осталось только записать это строго:

$display$

$F(y+1)=P_2^1\Big(G(y),F(y)\Big)$

$G(y+1)=Sum\Big(F(y),G(y)\Big)$

Соответствующая реализация выглядит следующим образом:

def G(x):
    if x == 0:
        return 1
    return G(x - 1) + F(x - 1)

def F(x):
    if x == 0:
        return 0
    return G(x - 1)

Итак, мы только что доказали, что сложение, умножение, вычисление $inline$ -го числа Фибоначчи являются примерами примитивно-рекурсивных функций!

4. Функция Аккермана и ПРФ, часть первая

Оказывается, примитивно-рекурсивные функции не могут «безгранично быстро» расти. Точнее говоря: для любой примитивно-рекурсивной функции $inline$ аргументов $inline$ найдётся такое $inline$ , что:

$display$

Доказывать такие утверждения для исчислений — одно удовольствие. Вначале докажем его для базисных функций, а затем проверим, что свойство сохраняется при применении операций.

Что же, для базисных операций всё понятно:

$display$

$P_k^i(x_1,...,x_k)=x_i\le max(x_1,...,x_k)<a_0\Big(max(x_1,...,x_k)\Big)$

В первом случае используем то, что тождественный ноль всегда меньше единицы, а даже функция $inline$ прибавляет к своему аргументу единицу (помним: мы в дискретном мире, тут все аргументы либо натуральные числа, либо ноль). Во втором случае прибавление единицы — в точности результат применения функции $inline$ , которая по монотонности меньше функции $inline$ . В третьем случае функция-проекция возвращает один из своих аргументов, который точно меньше, чем максимальный из всех аргументов, увеличенный на единицу.

Теперь займёмся правилами вывода. Здесь используем математическую индукцию: в предположении, что утверждение верно для функций, из которых составляется результирующая, покажем, что утверждение верно и для результирующей функции.

Пусть функция $inline$ получена операцией композиции из функций $inline$ , и все эти функции в совокупности ограничены некоторой функцией $inline$ . Докажем, что тогда и функция $inline$ тоже ограничена. И действительно:

$F(x_1,...,x_n)=f\Big(g_1(x_1,...,x_n),...,g_k(x_1,...,x_n)\Big)<$

$<a_M\Big(max(g_1(x_1,...,x_n),...,g_k(x_1,...,x_n))\Big)<$

$<a_M\Big[max\Big(a_M(max(x_1,...,x_n)),...,a_M(max(x_1,...,x_n))\Big)\Big]$

$<a_M\Big(a_M(max(x_1,...,x_n))\Big) \le a_{M+1}\Big(max(x_1,...,x_n)\Big)$

Здесь вначале использована ограниченность функции $inline$ , затем ограниченность каждой из функций $inline$ , после чего внешний максимум оказывается применён к набору из $inline$ одинаковых чисел, а поэтому может быть исключён. В итоге оценка сводится к двукратному применению функции $inline$ к своему аргументу, а такой результат ограничивается значением следующей фукнции $a_{M+1}$ .

Пусть теперь функция $inline$ получена операцией примитивной рекурсии из функций $inline$ и $inline$ , каждая из которых ограничена функцией $inline$ .

Посмотрим для начала, что будет, когда аргумент рекурсии равняется нулю. Тут всё просто: можем использовать оценку для функции $inline$ :

$F(x_1,...,x_k,0)=f(x_1,...,x_k)<a_M\Big(max(x_1,...,x_k)\Big)$

Теперь посмотрим, что будет, если последний аргумент равен единице:

$F(x_1,...,x_k,1)=g\Big(x_1,...,x_k,0,F(x_1,...,x_k,0)\Big)<$

$<a_M\Big(max(x_1,...,x_k,0,a_M(max(x_1,...,x_k))\Big)<$

$<a_M\Big(a_M(max(x_1,...,x_k)\Big)=a_M[2](max(x_1,...,x_k))$

Здесь сначала используется уже полученная оценка для $inline$ , а также оценка для $inline$ . После этого используется монотонность функции $inline$ : ясно, что

$a_M\Big(max(x_1,...,x_k)\Big)>max(x_1,...,x_k, 0)$

Продолжая это рассуждение по индукции, получим, что

$display$

А свойства введённой последовательности функций гарантируют, что

$a_M[y+1](max(x_1,...,x_k))<a_{M+1}\Big(max(x_1,...,x_k,y)\Big)$

Окончательно:

$F(x_1,...,x_k,y)<a_{M+1}\Big(max(x_1,...,x_k,y)\Big)$

И на этом наше доказательство закончено. Забавно, что получилось, что каждое применение композиции или примитивной рекурсии увеличивает необходимый по условиям утверждения номер функции на единицу.

5. Функция Аккермана и ПРФ, часть вторая

Итак, мы знаем, что для любой примитивно-рекурсивной функции найдётся функция $inline$ , которая будет расти быстрее. Теперь можно определить следующую функцию:

$display$

Фактически, вводя последовательность функций одного аргумента, мы ввели функцию двух аргументов: первый из них задаёт номер функции в последовательности, второй — собственно аргумент. Приравняв номер и аргумент, получим функцию одного аргумента.

Теперь верно следующее утверждение: введённая функция $inline$ не является примитивно-рекурсивной.

Действительно, предположим, что эта функция является примитивно-рекурсивной. Тогда по доказанному в пункте 4 существует такой номер $inline$ , что $inline$ для всех $inline$ . Но это точно не так, например:

$A(M+1)=a_{M+1}(M+1)>a_M(M+1)$

Таким образом, новая функция не является примитивно-рекурсивной. Этого-то мы и добивались, ура! Её и будем называть функцией Аккермана.

6. А насколько она в действительности велика?

Возвращаясь к практике, нам может быть интересно знать, насколько же всё-таки быстро растёт функция Аккермана, с чем её вообще можно сравнить. Выше мы уже видели, что суммы и произведения определяются некоторыми ПРФ. Через ПРФ можно определить операцию возведения в степень и даже функцию $inline$ . Более того, любая функция вида

$n^{n^{...^{n^n}}}$

с наперёд заданным количеством возведений в степень, является примитивно-рекурсивной. Не поленюсь и докажу это. Для начала построю функцию $inline$ :

$display$

$Pow(n,y+1)=Mult\Big(P_3^1(n,y,Pow(n,y)),P_3^3(n,y,Pow(n,y))\Big)$

Теперь использую её для определения функции $inline$ :

$display$

Как видите, это делается простой подстановкой. Теперь нет сложности с тем, чтобы определить функцию $n^{n^n}$ :

$display$

Действуя по аналогии, можно построить функцию, в которой $inline$ возводится в степень $inline$ пять раз, десять раз, сто раз, миллион раз. Функция Аккермана растёт быстрее любой из этих функций. Вот насколько быстро она растёт!

Хабы:

Примитивно-рекурсивные функции и функция Аккермана

1. Почему это может быть интересно

2. Функция Аккермана

3. Примитивно-рекурсивные функции (ПРФ)

4. Функция Аккермана и ПРФ, часть первая

5. Функция Аккермана и ПРФ, часть вторая

6. А насколько она в действительности велика?

Публикации

Ближайшие события