Пишем «калькулятор». Часть II. Решаем уравнения, рендерим в LaTeX, ускоряем функции до сверхсветовой / Хабр

Привет!

Итак, в первой части мы уже неплохо поработали, сделав производную, упрощение, и компиляцию. Так, а что еще должен уметь наш простенький калькулятор? Ну хотя бы уравнения вида

$(x - b)(\tan(\sin(x))^2 - 3\tan(\sin(x)) + c) = 0$

точно должен решать. А еще красиво нарисовать это дело в латехе, и будет прямо хорошо! Погнали!

Дисклеймер

И хотя код приведен здесь на C#, здесь его так мало, что незнание языка или ненависть к нему не должны сильно затруднить чтение.

Ускорение компиляции

В прошлой части мы сделали компиляцию функции, чтобы можно было один раз скомпилировать, и в дальнейшем много раз запускать.
Итак, введем функцию

$\sin(x^2) + \cos(x^2) + x^2 + \sin(x^2)$

На окончание первой части скорость этой функции была такой:

Метод	Время (в наносекундах)
Substitute	6800
Наша скомпилированная функция	650
Эта жа функция, написанная прямо в коде	430

Что?

Substitute — классический способ подсчета значения выражения, то есть например

var x = MathS.Var("x");
var expr = x + 3 * x;
Console.WriteLine(expr.Substitute(x, 5).Eval());
>>> 20

Наша скомпилированная функция — это когда мы делаем так же, но предварительно скомпилировав ее

var x = MathS.Var("x");
var expr = x + 3 * x;
var func = expr.Compile(x);
Console.WriteLine(func.Substitute(5));

Функция, написанная прям в коде, это когда мы делаем

static Complex MyFunc(Complex x)
            => x + 3 * x;

Как мы могли заметить, в этой функции есть повторяющиеся части, например, $inline$ , и неплохо было бы их закешировать.

Для этого введем еще две инструкции PULLCACHE и TOCACHE. Первая будет класть в стек число, лежащее в кеше по адресу, который мы ей передаем. Вторая будет копировать(stack.Peek()) последнее число из стека в кеш, тоже по определенному адресу.

Остается сделать таблицу, в которую при компиляции мы будем записывать функции для кеширования. Что мы не будем кешировать? Ну во-первых то, что встречается один раз. Лишняя инструкция обращения к кешу — нехорошо. Во-вторых, слишком простые операции тоже смысла кешировать не имеет. Ну например обращение к переменной или числу.

При интерпретации списка инструкций у нас будет заранее созданный массив для кеширования. Теперь инструкции для этой функции выглядят как

PUSHCONST (2, 0)
PUSHVAR 0
CALL powf
TOCACHE 0       #здесь мы посчитали квадрат, и так как он нам нужен более одного раза, закешируем-ка мы его.
CALL sinf
TOCACHE 1         #синус от квадрата нам тоже понадобится
PULLCACHE 0     # Оп, встретили использование квадрата. Тащим из кеша
PULLCACHE 0
CALL cosf
PULLCACHE 1
CALL sumf
CALL sumf
CALL sumf

После этого мы получаем уже явно более хороший результат:

Метод	Время (в наносекундах)
Subtitute	6800
Наша скомпилированная функция	330 (было 650)
Эта жа функция, написанная прямо в коде	430

В репе и компиляция, и интерпретация инструкций реализованы тут.

LaTeX

Это известнейший формат записи математических формул (хотя и не только их!), который рендерится в красивые картинки. На хабре он тоже есть, и все формулы, которые я пишу, как раз написаны в этом формате.

Имея дерево выражений сделать рендеринг в латех очень просто. Как сделать это с точки зрения логики? Итак, у нас есть вершина дерева. Если это число или переменная, тут все просто. Если эта вершина, например, оператор деления, нам больше хочется $\frac{a}{b}$ , чем $inline$ , поэтому для деления мы пишем что-то типа

public static class Div
{
    internal static string Latex(List<Entity> args)
    => @"\frac{" + args[0].Latexise() + "}{" + args[1].Latexise() + "}";
}

Все очень просто, как мы видим. Единственная проблема, с которой я столкнулся при реализации такова, что непонятно, как расставлять скобки. Если мы просто на каждый оператор будем их пихать, то будем получать такую ерунду:

$\left(\left(\left(\left(x + 3\right) + \left(a + b\right)\right)\right) + c\right)$

Однако внимательный человек сразу (а не как я) заметит, что если их убрать совсем, то при построения выражения вида $inline$ , у нас будет печататься

$display$

Решается просто, вводим приоритеты операторов а-ля

args[0].Latexise(args[0].Priority < Const.PRIOR_MUL) + "*" + args[1].Latexise(args[1].Priority < Const.PRIOR_MUL);

И вуаля, вы прекрасны.

Латексиризация сделана тут. И слова latexise не существует, я его сам придумал, не надо пинать меня за это.

Решение уравнений

Вообще-то, с точки зрения математики вы не можете написать алгоритм, который находит все решения какого-то уравнения. Поэтому нам хочется найти как можно больше разных корней осознавая недостижимость конечной цели. Тут две составляющих: численное решение (тут все максимально просто) и аналитическое (а вот это уже история).

Численное решение. Метод Ньютона

Он предельно простой, зная функцию $inline$ мы будем искать корень по итеративной формуле

$x_{n+1} = x_n - \frac{f(x)}{f(x)'}$

Так как мы все решаем в комплексной плоскости, можно в принципе написать двумерный цикл, который будет искать решения, а затем вернуть уникальные. При этом производную от функции мы теперь можем найти аналитически, а затем обе функции $inline$ и $inline$ скомпилировать.

Ньютон сидит тут.

Аналитическое решение

Первые мысли довольно очевидны. Так, выражение, корни уравнения $inline$ равны совокупности корней $inline$ и $inline$ , аналогично для деления:

internal static void Solve(Entity expr, VariableEntity x, EntitySet dst)
{
    if (expr is OperatorEntity)
    {
        switch (expr.Name)
        {
            case "mul":
                Solve(expr.Children[0], x, dst);
                Solve(expr.Children[1], x, dst);
                return;
            case "div":
                Solve(expr.Children[0], x, dst);
                return;
        }
    }
...

Для синуса это будет выглядить чуть по-другому:

case "sinf":
    Solve(expr.Children[0] + "n" * MathS.pi, x, dst);
    return;

Ведь мы хотим найти все корни, а не только те, что равны 0.

После того, как мы убедились, что текущее выражение — не произведение, и не прочие легко упрощаемые операторы и функции, нужно пытаться найти шаблон для решения уравнения.

Первая идея — возпользоваться паттернами, которые мы сделали для упрощения выражения. И на самом деле примерно это нам понадобится, но сначала нам нужно сделать замену переменной. И действительно, к уравнению

$\sin(x)^2 + \sin(x) - 0.4 = 0$

не существует никакого шаблона, а вот к паре

$\begin{cases} t^2 + t - 0.4 = 0\\ t=\sin(x) \end{cases}$

еще как существует.

Поэтому мы делаем функцию что-то типа GetMinimumSubtree, которая вернула бы самую эффективную замену переменной. Что такое эффективная замена? Эта такая замена, в которой мы

Максимизируем количество употреблений этой замены
Максимизируем глубину дерева (чтобы в уравнении $\sin(\sin(x))^2 + 3$ у нас была замена $\sin(\sin(x))$ )
Убеждаемся, что этой заменой мы заменили все упоминания переменной, например если в уравнении $\sin(x)^2 + \sin(x) + x$ мы сделаем замену $t=\sin(x)$ , то все станет плохо. Поэтому в этом уравнении лучшая замена по $inline$ это $inline$ (то есть нет хорошей замены), а вот например в $\sin(x)^2 + \sin(x) + c$ мы можем смело делать замену $t=\sin(x)$ .

После замены уравнение выглядит много проще.

Полином

Итак, первое, что мы делаем, мы делаем expr.Expand() — раскроем все скобочки, чтобы избавиться от гадости вида $inline$ , превратив в $inline$ . Теперь, после раскрытия у нас получится что-то типа

$display$

Неканоничненько? Тогда сначала соберем информацию о каждом одночлене, применив «линейных детей» (есть в прошлой статье) и развернув все слагаемые.

Что у нас есть о одночлене? Одночлен — это произведение множителей, один из которых — переменная, либо опетатор степени от переменной и целого числа. Поэтому мы заведем две переменных, в одной будет степень, в другой — коэффициент. Далее просто идем по множителям, и каждый раз убеждаемся, что либо там $inline$ в целой степени, либо без степени вовсе. Если встречаем бяку — возвращаемся с null-ом.

бяка

Если мы вдруг встретили какой-нибудь $x^{3.2}$ , $inline$ и прочие штуки, в которых упоминается $inline$ , но не подходит под паттерн одночлена — это плохо.

Окей, мы собрали словарик, в котором ключ — это степень (целое число), а значение — коэффициент одночлена. Так выглядит он для предыдущего примера:

0 => c
1 => 1
2 => 3
3 => 1 - a

Вот, к примеру, реализация решения квадратного уравнения

if (powers[powers.Count - 1] == 2)
{
    var a = GetMonomialByPower(2);
    var b = GetMonomialByPower(1);
    var c = GetMonomialByPower(0);
    var D = MathS.Sqr(b) - 4 * a * c;
    res.Add((-b - MathS.Sqrt(D)) / (2 * a));
    res.Add((-b + MathS.Sqrt(D)) / (2 * a));
    return res;
}

Этот момент еще не доделан (например, нужно правильно сделать для кубических полиномов), но вообще происходит это тут.

Обратная развертка замены

Итак, вот мы сделали какую-нибудь замену типа $t=\arcsin(x^3 + a^2)$ , и теперь нам хочется получить оттуда x. Здесь у нас просто пошаговое развертывание функций и операторов, типа

$t = \arcsin(x^3 + a^2)$

$\sin(t) = x^3 + a^2$

$\sin(t) - a^2 = x^3$

$(\sin(t) - a^2)^{\frac{1}{3}} = x$

Отрывок кода выглядит примерно так:

switch (func.Name)
{
    case "sinf":
        // sin(x) = value => x = arcsin(value)
        return FindInvertExpression(a, MathS.Arcsin(value), x);
    case "cosf":
        // cos(x) = value => x = arccos(value)
        return FindInvertExpression(a, MathS.Arccos(value), x);
    case "tanf":
        // tan(x) = value => x = arctan(value)
        return FindInvertExpression(a, MathS.Arctan(value), x);
...

Код этих функций здесь.

Все, конечное решение уравнений (пока!) выглядит примерно так

Если знаем ноль функции или оператора, отправляем Solve туда (например, если $inline$ , то запустим Solve(a) и Solve(b))
Найти замену
Решить как полином, если это возможно
Для всех решений развернуть замену, получив конечное решение
Если как полином оно не решилось и у нас только одна переменная, решаем методом Ньютона

Итак, за сегодня мы:

Ускорили работу скомпилированной функции благодаря кешу
Отрендерили в LaTeX
Решили небольшую часть случаев уравнений

Рассказывать про численный подсчет определенного интеграла я наверное не буду, так как это очень просто. Про парсинг я не рассказал, так как получил критику по этому поводу в предыдущей статье. Идея была в том, чтобы написать свой. Но тем не менее, нужно ли рассказывать про то, как мы парсили выражение из строки?
Проект тут.

В следующей части...

Если еще хоть кому-то интересно, попробуем усложнить решение уравнений, добавив кубическую и четвертую степени, а так же более умную сворачивалку. Может быть будем подбирать паттерны, ведь любой школьник решит

$1 - \sin(x)^2 + \cos(x) + 0.5$

Но только не наш алгоритм. Более того, может быть будет неопределенный интеграл (начало). Расширение числа в кватернионы или матрицы пока смысла не имеет, но как-нибудь тоже можно будет. Если есть конкретная идея для части III, напишите в личные сообщения или комментарии.

О проекте

Те, кто посмотрели код, могли заметить, насколько же он сырой и не отрефакторенный. И, разумеется, я буду рефакторить, поэтому основная идея этой статьи — донести информацию теоретически, и уж потом подглядывая в код. А еще приветствуются pull-реквесты, хотя наверное до wolfram.alpha нам все равно не добраться. Проект открытый.

А вот парочка примеров того, что мы сегодня сделали

var x = MathS.Var("x");
var y = MathS.Var("y");
var expr = x.Pow(y) + MathS.Sqrt(x + y / 4) * (6 / x);
Console.WriteLine(expr.Latexise());
>>> {x}^{y}+\sqrt{x+\frac{y}{4}}*\frac{6}{x}

${x}^{y}+\sqrt{x+\frac{y}{4}}*\frac{6}{x}$

var x = MathS.Var("x");
var expr = MathS.Sin(x) + MathS.Sqrt(x) / (MathS.Sqrt(x) + MathS.Cos(x)) + MathS.Pow(x, 3);
var func = expr.Compile(x);
Console.WriteLine(func.Substitute(3));
>>> 29.4752368584034

Entity expr = "(sin(x)2 - sin(x) + a)(b - x)((-3) * x + 2 + 3 * x ^ 2 + (x + (-3)) * x ^ 3)";
foreach (var root in expr.Solve("x"))
    Console.WriteLine(root);
>>> arcsin((1 - sqrt(1 + (-4) * a)) / 2)
>>> arcsin((1 + sqrt(1 + (-4) * a)) / 2)
>>> b
>>> 1
>>> 2
>>> i
>>> -i

Спасибо за внимание!

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

83.82%Да (с парсингом)57

7.35%Да (без парсинга)5

8.82%Нет6

Проголосовали 68 пользователей. Воздержались 19 пользователей.