MalcKaterina 3 фев 2020 в 15:37

Python для тестировщика: как маленькие скрипты c pandas помогают в тестировании больших наборов данных

13 мин

19K

Тестирование IT-систем*Python*Тестирование веб-сервисов*

Технотекст 2020

Из песочницы

+14

Комментарии 9

Taxopr 3 фев 2020 в 18:54

почему проверка результата происходит в экселе с помощью фильтров, а не внутри скрипта с помощью pandas?

вводные данные тоже можно чистить в pandas. К примеру убрать пробелы в начале строки:

    df_src = df_src.applymap(lambda x: x.lstrip() if isinstance(x, str) else x)

Или же, чтобы не городить огород c applymap, воспользовавшись методом replace(), у него очень богатые возможности.

MalcKaterina 4 фев 2020 в 14:34

Ну тут все зависит от того, что нужно в итоге.
Когда мне важно посмотреть, что все объекты из одного файла по уник.идентификатору совпадают с объектам во втором — то я просто запускаю скрипт с мержем и смотрю в терминале, что в итоговом файле нужное количество строк получилось, если количество строк отличается, то уже смотрю в полном итоговом Excel-файле, что не сходится, ну и такие файлы удобно хранить или кому-то пересылать, а также делать в них другие фильтрации потом.
А если нужно в итоговом файле сравнить данные по столбцам, то да, удобнее с помощью самого pandas это делать.
За инфу по applymap спасибо, посмотрю про это подробнее.

hlevrbdy 4 фев 2020 в 09:54

у меня есть очень похожий по функциональности скрипт, которые делает выборку из нескольких csv и сохраняет новый csv. Хочу сделать веб-интерфейс для него, наверное как то прикрутить скрипт к django, но я в этом деле совсем новичок. Смотрел туториалы по django, но там в основном описывается работа с бд, что мне не подходит. Подскажите пожалуйста куда смотреть. И сильно не пинайте)

Taxopr 4 фев 2020 в 11:24

Есть dash от plotly. Я пользовался им, много элементов управления, реактивный дизайн.
Под другой статьей рекомендовали посмотреть на voila и на streamlit, но я еще не успел их попробовать.

hlevrbdy 4 фев 2020 в 14:16

спасибо, попробуем

DollaR84 4 фев 2020 в 13:08

Хочу сделать веб-интерфейс для него

А почему именно веб-интерфейс? Если просто нужно GUI интерфейс для консольного скрипта, почему бы не использовать GUI библиотеки? типа QT или WX Widgets.

hlevrbdy 4 фев 2020 в 14:19

не, задача стоит именно в создании простого сайтика, где пользователь указывает критерии и получает csv

DollaR84 4 фев 2020 в 18:37

А, понятно. Тогда да. Вместо django можно попробовать flask. Если django как комбайн, все в одном, то flask наверно можно охарактеризовать как конструктор.

dbagaev 4 фев 2020 в 17:45

А еще можно сделать так, чтобы по данным из Excel pytest формировал бы набор тестов. И, как уже заметили в комментарии выше, проверку данных удобнее делать в питоне, там же и отчет по тестированию, который понимают все CI-системы.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Python для тестировщика: как маленькие скрипты c pandas помогают в тестировании больших наборов данных

Комментарии 9

Публикации

Истории