Pull to refresh
10
0
Send message

Век живи, век учись писать статьи на хабре)

Попробую поредачить, но концепт оставлю. Все ещё думаю, что должно быть красивое решение 3-ей задачи с нормальным шаблоном, должен же кто-то его написать хехе

С одной стороны резонно, с другой почему нет, если если задача решена и решается за приемлимое время?

Не совсем понял...

Может быть вот такая ситуация в одном логе:

QuantityInputCommand: 10
Pick_something:(args_1)
QuantityInputCommand: 1
QuantityInputCommand: 2
Pick_something:(args_2)

Нужно, чтобы получилось:

["10, args_1", "2, args_2"]

Если что, я ищу через findall

Первая версия алгоритма была: было 2 регулярки, одна на Pick..., другая на Quantity..., через (?:Pick...|Quantity...) искалось все подряд, добавлялось в Series, потом была проверка на существование Pick... после Quantity..., соответсвенно, если проверка не проходила либо удалял не подходящий Quantity, либо в другой Series сохранял те, что проверку прошли, не помню уже. Вы что-то подобное имеете ввиду?

И пока логику сбора логов пишет не тот, кто потом с этими логами работает)

А если уже рабочая задача, тебя не спрашивают, что ты думаешь о логах, тебе просто скидывают файл и говорят: "Мне нужно, чтобы ты посчитал сколько за день таких-то реквестов"

Что-то вроде - один раз сделал и больше к этому не возвращался.

Я это к тому, что теория это хорошо, но иногда нужно решение, а не понимание.

Комментарий интересный, конечно, но не очень понимаю как он к статье относится.

Может будет эффективнее перейти на статью с похожей тематикой или самому описать? Вроде, интересующихся вашим кейсом немало, возможно, могли бы какие-то ещё идеи найти)

Хз, может не прав, но пока кажется, что регулярки очень универсальны, достаточно гибки и хорошо поддаются оптимизации.

Есть ощущения, что один раз их понял (как один товарищ абсолютно понял мир), и можешь работать с любыми текстами.

Вопрос интересный про "достойно для отдельной статьи" и, скорее всего, ответ будет неоднозначным.. С одной стороны, действительно, Америку я тут не открываю, с другой, я бы не против наткнуться на решении 3 задачи, когда пытался что-то подобное найти..)

Но после публикации появился другой фактор, пришёл datacompboy в комментарии и кратко, понятно и доходчиво объяснил, что я неправильно понимаю и как мою регулярки улучшить (те что в статье и будущие), а это точно стоило публикации этой статьи)

Насчёт того, что нужно было описать что такое квантификатор и т.д. не могу согласится. Это решение конкретно моего кейса и пример решения задачи, которого сам я найти не смог,. Опять же, по себе сужу, все части с очередным объяснением что такое квантификатор, жадность и т.д., скорее всего, пролистал бы и сначала пошёл смотреть задачи, совпадают ли они с моими. К тому же, не думаю, что человек вводит в поисковике "Основы regex" и ему первой ссылкой советуют эту статью, все же рассчитываю на то, что человек уже немножко понимает, а если не понимает, сможет решить свою задачу.

Разве то, что могут идти две QuantityInputCommand подряд не помешает предложенной вашей логике?

Если мы раскидываем переменные по спискам, то их длинны необязательно будут одинаковыми.

Огромное спасибо!

Все замечания прочекаю, попробую отредактировать статью)

Может я глупый или искать инфу нормально не умею, но вот не мог нормальные примеры (особенно для 3-ей задачи) найти и все.. А вы сразу практически все объяснили) Как-то даже немного "стремно" от того, что чтобы начинающему "специалисту" найти человека, который разбирается и подскажет какой-то вопрос, нужно написать статью на хабре..)

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Analyst, Data Scientist
Junior
From 45,000 ₽
Data Analysis
Math statistics
Python
Pandas
NumPy
Math modeling
Machine learning
Neural networks
Deep Learning
Computer Science