Добрый вечер! В данном случае сортировка слов осуществляться не будет и в словарь перебор слов будет заноситься полностью исходный вариант. Даже для чистоты эксперимента попробовал Ваш вариант. Помню в самом начале написания я хотел как-то избавиться от вложенных циклов, но не получилось, т.к. нужно перебрать каждое слово и внести его в определенной последовательности. И также на производительность никак не сказалось, а вот декоратор предложенный CrazyElf помог.
К сожалению, от опечаток никто не застрахован, особенно инженера на производстве, когда все делается на скорую руку. Библиотека pymorph3 слова с ошибками: "голагеговая" и "оссцилограф" определяет как надо - прилагательное и существительное соответственно.
Что касается орфографии, к счастью, в Excel есть словарь, который можно запустить для проверки.
Если взять к примеру опечатку из выгрузки "Газы реакции/ котловая вода", то именно слово вместе со слэшем "реакции/" pymorph3 не сможет определить и выдаст результат, как UNKN, то есть токен не удалось распознать. В этом случае перебор будет отличаться от входящего значения, и при сравнении измененных позиций сразу станет понятно (сразу скажу таких случаев было немного)
Лично я просматривал измененные позиции, что позволило вдобавок ещё навести красоту и отредактировать рабочую среду.
Только что проверил, как и ожидалось, декоратор дал прирост, но совсем немного в 2-3 секунды!) Из выгрузки, которая описывалась в статье. Думаю результат будет более заметным, если выгрузка будет объемнее.
Хорошее замечание по поводу библиотеки. Да, я использую pymorphy3, это стоит упомянуть. Как я понял, проект pymorphy2 был заброшен автором ещё в 20-ом году, на github это обсуждали.
Да, декоратор должен дать прирост в скорости
Приятно получить такую критику, в которой все по факту. Спасибо!)
Да, в том то и дело что коллеги жить не могут без экселя, т.к. вся основная их работа - в цифровизации документации. А я, а я просто увлекаюсь программированием, вот так и столкнулся с VBA, когда потребовалось автоматизировать рутину.
С автобэкапом согласен на все 100. Был случай, когда при открытии файла макросы просто куда-то пропадали... Причем файл никак не был поврежден. Excel и git не пытался связать (Шаблон с макросами весит не особо много, поэтому все версии изменений храню на локальном и часть - на облачном), поэтому и подсказать тут не смогу.
За JSON отдельное спасибо, не рассматривал даже его для таких целей.
Добрый вечер!
В данном случае сортировка слов осуществляться не будет и в словарь перебор слов будет заноситься полностью исходный вариант.
Даже для чистоты эксперимента попробовал Ваш вариант. Помню в самом начале написания я хотел как-то избавиться от вложенных циклов, но не получилось, т.к. нужно перебрать каждое слово и внести его в определенной последовательности.
И также на производительность никак не сказалось, а вот декоратор предложенный CrazyElf помог.
К сожалению, от опечаток никто не застрахован, особенно инженера на производстве, когда все делается на скорую руку.
Библиотека pymorph3 слова с ошибками: "голагеговая" и "оссцилограф" определяет как надо - прилагательное и существительное соответственно.
Что касается орфографии, к счастью, в Excel есть словарь, который можно запустить для проверки.
Если взять к примеру опечатку из выгрузки "Газы реакции/ котловая вода", то именно слово вместе со слэшем "реакции/" pymorph3 не сможет определить и выдаст результат, как UNKN, то есть токен не удалось распознать.
В этом случае перебор будет отличаться от входящего значения, и при сравнении измененных позиций сразу станет понятно (сразу скажу таких случаев было немного)
Лично я просматривал измененные позиции, что позволило вдобавок ещё навести красоту и отредактировать рабочую среду.
Спасибо!)
Понимаю и полностью согласен, я прям прочувствовал всю боль в "Ад в номенклатурных справочниках - постоянная проблема".
Только что проверил, как и ожидалось, декоратор дал прирост, но совсем немного в 2-3 секунды!) Из выгрузки, которая описывалась в статье.
Думаю результат будет более заметным, если выгрузка будет объемнее.
Хорошее замечание по поводу библиотеки. Да, я использую pymorphy3, это стоит упомянуть.
Как я понял, проект pymorphy2 был заброшен автором ещё в 20-ом году, на github это обсуждали.
Да, декоратор должен дать прирост в скорости
Приятно получить такую критику, в которой все по факту. Спасибо!)
Шикарный вариант!) А рядом бы ещё пшеничный смузи
Да, в том то и дело что коллеги жить не могут без экселя, т.к. вся основная их работа - в цифровизации документации. А я, а я просто увлекаюсь программированием, вот так и столкнулся с VBA, когда потребовалось автоматизировать рутину.
С автобэкапом согласен на все 100. Был случай, когда при открытии файла макросы просто куда-то пропадали... Причем файл никак не был поврежден. Excel и git не пытался связать (Шаблон с макросами весит не особо много, поэтому все версии изменений храню на локальном и часть - на облачном), поэтому и подсказать тут не смогу.
За JSON отдельное спасибо, не рассматривал даже его для таких целей.
Сомнительно, но окэй...
Согласен, функция может пригодится и для работы в других макросах