Limpich12 фев 2019 в 10:29

Простой парсер арифметических операций

6 мин

8.9K

Алгоритмы * Математика *

Комментарии 22

mayorovp 12 фев 2019 в 10:44

Что-то ваш парсер получился ничуть не простой...

                        char[] buffer = new char[functionEnd - functionStart - 1];
                        expression.CopyTo(functionStart + 1, buffer, 0, functionEnd - functionStart - 1);
                        string functionParametrs = new string(buffer);

Кто-нибудь, расскажите автору о существовании метода Substring!

                        result.RemoveRange(result.Count - 1, 1);

И о методе RemoveAt тоже нужно напомнить...

lair 12 фев 2019 в 10:47

Это же C#, да?

В интернете не нашел готовых и подходящих для меня решений

Чем вас не устроил Sprache?

Limpich 12 фев 2019 в 10:54

Боюсь, это не получится сдать в качестве домашней работы)

retran 12 фев 2019 в 13:24

Ваше нормальному преподавателю — тоже сдать не получится.
Ну можно же погуглить, почитать про рекурсивный спуск или сортировочную станцию, и не изобретать неработающее непонятно что.

m03r 12 фев 2019 в 10:47

Вы почти изобрели Алгоритм сортировочной станции.

mayorovp 12 фев 2019 в 11:08

Он даже близко не подобрался к его изобретению.

playermet 15 фев 2019 в 05:31

Shunting-yard это алгоритм для инфиксной нотации. Автор же просто отказался от попытки ее разбора в пользу польской нотации, где порядок выполнения операций определяется их порядком в записи.

Yermack 12 фев 2019 в 10:54

julia> str = "(2 + 2) * ((2 * 2) + ((2 * 2) * (2 * 2)))" # строка с арифметикой
"(2 + 2) * ((2 * 2) + ((2 * 2) * (2 * 2)))"

julia> Meta.parse(str)
:((2 + 2) * (2 * 2 + (2 * 2) * (2 * 2)))

julia> eval(ans)
80

julia> str2 = replace(str, '*' => "+ 2 +")
"(2 + 2) + 2 + ((2 + 2 + 2) + ((2 + 2 + 2) + 2 + (2 + 2 + 2)))"

julia> str2 |> Meta.parse |> eval # цепочка функций
26

masai 13 фев 2019 в 09:12

Решать через аналог eval можно и в C#. Но все такие решения плохи по нескольким причинам:

ты привязан к грамматике своего языка, не можешь её расширить,
пользователь может вместо арифметического выражения отправить что-то с побочным эффектом (если eval полноценный).

Vantela 12 фев 2019 в 11:05

Не смог прочитать ваш код. Впрочем, у меня и свой не всегда получается читать.:-)

Когда то на меня произвел большое впечатление курс по компиляторам.
Т.е. как классно и гладко распарсивается синтаксис программы.
Арифметическое выражение это явно проще чем программа.
Рекурсивное чтение будет на ура проходить.

Уверен, в инете много примеров, и если вы хотите сделать действительно красиво — попробуйте посмотреть в эту сторону.
((((((((((((((((((И скобки считать не придется...))))))))))))))))))))))

Vantela 12 фев 2019 в 13:37

Рекурсивный спуск! Вот как это назвалось.
Спасибо напомнили выше.

tyomitch 13 фев 2019 в 12:14

Не обязательно рекурсивный спуск, можно и классический LALR: web.tecnico.ulisboa.pt/~david.matos/w/pt/index.php/The_YACC_Parser_Generator/Example:_Calculator_with_Variables

mayorovp 12 фев 2019 в 11:07

Теперь про ошибки в алгоритме.

"Естественно, если мы встретили знак "+" или "-" не после цифры, значит этот знак обозначает положительность или отрицательность числа, соответственно." — нет, не естественно. Смотрите: sin(1) - 2
С каких пор у функции sqrt есть второй аргумент? Напоминаю, что название этой функции — аббревиатура от "square root", что переводится как "квадратный корень"
В польской нотации можно записывать не только "простые" формулы, а вообще любые, и без скобок. Так, ваш пример sqrt(2*2; log(4;2)) может быть записан как 2 2 * 4 2 log sqrt. Отсюда вопрос: зачем вам вообще понадобилась большая часть алгоритма? Зачем все эти поиски парных скобок, нахождение параметров и прочее?

Limpich 12 фев 2019 в 11:16

Спасибо! Обязательно учту Ваши замечания!

НЛО прилетело и опубликовало эту надпись здесь

mapron 2 мар 2019 в 13:35

Надо бы мне свой курсовичок залить с генератором компиляторов чисто на Qt без внешних зависимостей вроде бизона)
А так да, тортовость падает

lxsmkv 12 фев 2019 в 14:59

Понимаю, что это учебный проект. Однако ведь пользователю интересен не код, а результат. Чтобы проверить выпоняет ли код ожидания пользователя — нужны юнит-тесты. Тогда хоть как-то можно будет понять для каких конкретных случаев этот код работает. А так это черный ящик. С неопределенным количеством багов внутри. От этого есть и побочный положительный эффект для разработчика. Начнете писать тесты — лучше станете понимать логику приложения. Ну и если захотите поменять реализацию — с тестами будет куда проще убедиться что оно все еще делает то что должно.

gdt 12 фев 2019 в 15:40

А чем вас рекурсивный спуск не устроил? Просто и элегантно, если не разбирать гигантские выражения — то и с памятью тоже будет всё в порядке.

AlexXYZ 12 фев 2019 в 16:04

Antlr, вроде, как один из самых популярных. И nuget-пакет для него есть даже. Понятно, что любой парсер требует порог вхождения, но поверьте, что самостоятельная обработка ошибок намного сложнее самописного парсера.
Я однажды сам попытался написать простой парсер типа вашего. Больше таких глупостей не делаю. )))
Как способ посмотреть, насколько это сложное и неблагодарное занятие подходит, но для чего-то в продакшен не пойдёт. Попробуйте добавить хоть одну «переменную» и все придётся переписать.
Почитайте что-нибудь по грамматикам.

morincer 13 фев 2019 в 07:51

Вытеки мои глазоньки… Действительно, решение — «оригинальное» — в том смысле, что второго такого вряд ли найдете. Если целью учебного задания было научить вас работать со строками и стандартными структурами данных в C#, то, наверное, все ок, а если — научиться писать парсер, то так парсер не пишется.

Вы допустили несколько ошибок — методологических в основном.

1. Любой парсер начинается с юнит-тестов! Для начала хотя бы пары выражений, но в идеале — чем больше, тем лучше. Потратьте полчаса времени придумывая самые извратные варианты — потом это окупится с лихвой.
2. За юнит-тестами идет грамматика. Честно говоря, я был удивлен, не увидев её в статье — может, вам её уже дали в условиях задания? Если нет — обязательно нужно описать грамматику и отладить её на юнит-тестах — в инете есть для этого средства, ну или написать свои.
3. Далее — лексер. Он разбивает выражение на токены, затем парсер работает уже с ними. Одновременно токенизировать и парсить как минимум неудобно.
4. Наконец — сам парсер. Изобретать велосипед — дело, конечно, интересное, но в вопросе парсинга математических выражений — мягко говоря, неблагодарное. Все уже было украдено до нас. Задолго. Просто реализуйте алгоритм рекурсивного спуска или сортировочной станции и радуйтесь результату.

michael_v89 13 фев 2019 в 12:00

Ну у нас например на втором курсе был преподаватель, который давал это задание как «желательно сделать», для математических лабораторных с построением графиков. А грамматики были на четвертом.

Rusk-gm 2 мая 2023 в 06:17

Если это С#, то можно воспользоваться методом Compute класса DataTable

static Double Eval(String expression) 

{ 

 System.Data.DataTable table = new System.Data.DataTable(); 

 return Convert.ToDouble(table.Compute(expression, String.Empty)); 

} 

...

Double result = Eval("(2 + 2) * ((2 * 2) + ((2 * 2) * (2 * 2)))");

...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий