Virviil Sep 8 2016 at 18:21

Elixir: Готовим парсинг правильно — yecc и leex

9 min

13K

Elixir/Phoenix * Erlang/OTP * Functional Programming *

Tutorial

Translation

+17

Comments 22

pengyou Sep 8 2016 at 18:52

А вот какой парсер проще получается, декларативный на функциональном ЯП или императивный на обычном ЯП?

Virviil Sep 8 2016 at 19:05

Мне кажется, впринципе суть парсера в том, что он декларативный — во всех языках. А если нет — то это то, что автор статьи называет "велосипедом". А вот велосипеды уже разные — декларативный в ФП и императивный в ИП)

zzzcpan Sep 8 2016 at 19:07

Обычный человек боится использовать лексеры и парсеры, а вместо них пишет велосипед на регулярных выражения.

На самом деле обычный человек очень правильно делает, что избегает сложно понимаемые LR парсеры, lex, yacc и подобные пережитки прошлого. Гораздо проще, легче и важнее начинать с самописных recursive descent парсеров. Потом может посмотреть на PEG, которые такие парсеры генерируют.

К теории по компиляторам вообще стоет очень скептически относиться, слишком много там наследия прошлого.

pengyou Sep 8 2016 at 19:54

> это то, что автор статьи называет «велосипедом»

Кажется, теперь парсером можно называть только результат обработки инструкций для yacc и пр.

zagayevskiy Sep 8 2016 at 21:12

Почему?

pengyou Sep 9 2016 at 19:08

Есть представление об ИТ как практическом применении накопленных другими знаний, то есть, любые знания от других людей, если они известны, считаются проверенными и применимыми. Дальше эта идея развивается до уровня «кто не переиспользует, тот велосипедостроитель», то есть позитивная концепция переиспользования используется для обоснования негативного отношения к не-переиспользующим. При этом предполагается, что 95% айтишников серая масса и в принципе не имеет достаточных знаний для того, чтобы делать что-то иначе, чем большинство.
Дальше на догму об единственности известного уже навешивают интересы разных интересантов, что закрепляет догму.
Иногда целые страны (см. РФ) руководствуясь принципом «don't repeat yourself» устраняются от занятия в предметных областях, которые уже кем-то освоены.
То есть, отвечая на ваш вопрос, для компиляторов уже 10 лет есть yacc, а кто использует что-то другое, или, не дай бог, пишет от руки, тот лох и вон из профессии.

zagayevskiy Sep 9 2016 at 20:05

Это вы всё хорошо и правильно говорите. Но к определению парсера это имеет весьма отдаленное отношение, так что с первым утверждением позвольте не согласиться.

pengyou Sep 9 2016 at 20:20

Не позволю.
Про определение вообще речь не шла. Речь шла про то, что профессионалы ИТ называют парсером сейчас.

zagayevskiy Sep 9 2016 at 20:22

Okay

KvanTTT Sep 8 2016 at 19:21

Я просмотрел статью. И если сравнивать с ANTLR, то в последем используются более чистый формат для описания грамматик, без лишнего мусора в фигурных скобочках. А вы сравнивали?

Virviil Sep 8 2016 at 20:00

Нет. На сколько я понимаю, ANTLR не работает в erlang?

KvanTTT Sep 10 2016 at 11:02

Напрямую точно не работает.

iqiaqqivik Sep 9 2016 at 07:53

Мусор в фигурных скобочках — валидный эрланг, кортежи; это так задумано. Я не уверен, какой путь лучше, но этот мне кажется более натуральным.

KvanTTT Sep 10 2016 at 11:00

В том то и дело, что это валидный эрланг, т.е. для другого языка эту грамматику уже нельзя будет использовать. Мне больше нравится подход, при котором грамматика полностью абстрагирована от языка парсера, как это и сделано в ANTLR. Да, и там, к сожалению, не всегда это получается.

UA3MQJ Sep 8 2016 at 21:17

Спасибо за статью. Некоторое время назад я находил небольшой гайд о том, как проделать похожие шаги на чистом Erl, но на английском. Понимания того, что делается, практически не было. Тут же все на много понятнее. Пишите еще!

ultrinfaern Sep 9 2016 at 05:54

Ргулярки весьма ограничены в грамматиках, которые вы пытаетесь ими описать (к примеру попробуйте парсить html регулярками) (переводчик: на самом деле — нет. Но на ассемблере тоже можно написать кластерное приложение. Масштаб проблемы приблизительно одинаковый)

Почему не получится распарсить HTML регулярками

UFO landed and left these words here

Maccimo Sep 10 2016 at 07:13

Это тот случай, когда «можно, но не нужно».
Поддерживать и развивать более-менее сложную регулярку — проще застрелиться и переписать всё с нуля.
На, хотя бы, рукописный рекурсивный спуск. А ещё лучше — с использованием генератора парсеров.

UFO landed and left these words here

potan Sep 9 2016 at 10:53

Лично я люблю комбинаторные монадические парсеры. По моему с этой техникой генераторы парсеров становятся не слишком нужны — единственное их преимущество это возможность оптимизации.
Кстати, на Erlang была для этого библиотека.

nwalker Sep 12 2016 at 18:03

мастрид про парсер-комбинаторы в fprog

VAK_53 Oct 25 2023 at 16:53

Замените термин "тупиковые" на "терминальные"