Комментарии 9
почему проверка результата происходит в экселе с помощью фильтров, а не внутри скрипта с помощью pandas?
вводные данные тоже можно чистить в pandas. К примеру убрать пробелы в начале строки:
df_src = df_src.applymap(lambda x: x.lstrip() if isinstance(x, str) else x)
Или же, чтобы не городить огород c applymap, воспользовавшись методом replace(), у него очень богатые возможности.
+1
Ну тут все зависит от того, что нужно в итоге.
Когда мне важно посмотреть, что все объекты из одного файла по уник.идентификатору совпадают с объектам во втором — то я просто запускаю скрипт с мержем и смотрю в терминале, что в итоговом файле нужное количество строк получилось, если количество строк отличается, то уже смотрю в полном итоговом Excel-файле, что не сходится, ну и такие файлы удобно хранить или кому-то пересылать, а также делать в них другие фильтрации потом.
А если нужно в итоговом файле сравнить данные по столбцам, то да, удобнее с помощью самого pandas это делать.
За инфу по applymap спасибо, посмотрю про это подробнее.
Когда мне важно посмотреть, что все объекты из одного файла по уник.идентификатору совпадают с объектам во втором — то я просто запускаю скрипт с мержем и смотрю в терминале, что в итоговом файле нужное количество строк получилось, если количество строк отличается, то уже смотрю в полном итоговом Excel-файле, что не сходится, ну и такие файлы удобно хранить или кому-то пересылать, а также делать в них другие фильтрации потом.
А если нужно в итоговом файле сравнить данные по столбцам, то да, удобнее с помощью самого pandas это делать.
За инфу по applymap спасибо, посмотрю про это подробнее.
+1
у меня есть очень похожий по функциональности скрипт, которые делает выборку из нескольких csv и сохраняет новый csv. Хочу сделать веб-интерфейс для него, наверное как то прикрутить скрипт к django, но я в этом деле совсем новичок. Смотрел туториалы по django, но там в основном описывается работа с бд, что мне не подходит. Подскажите пожалуйста куда смотреть. И сильно не пинайте)
0
А еще можно сделать так, чтобы по данным из Excel pytest формировал бы набор тестов. И, как уже заметили в комментарии выше, проверку данных удобнее делать в питоне, там же и отчет по тестированию, который понимают все CI-системы.
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Python для тестировщика: как маленькие скрипты c pandas помогают в тестировании больших наборов данных