Как стать автором
Обновить

Как использовать Python для «выпаса» ваших неструктурированных данных

Время на прочтение8 мин
Количество просмотров18K
Всего голосов 15: ↑14 и ↓1+13
Комментарии10

Комментарии 10

хм… Стуктура у данных хоть и разрозенная, но все же была.
Считаете, стоит заменить на «слабо структурированные»?
Нет, не считаю.
По факту это просто «грязные» данные, которые автор чистил и сводил в одном месте, с помощью удобного инструмента.
Можно конечно долго размышлять — что есть структура и т.п., но смысла в этом мало — это всего лищь терминология)))
В любом случае статья интересная, спасибо.
Так вот в чём смысл названия джинсов «Врангель»!

Если серьёзно, ни разу не видел термин wrangling в применении к данным — cleaning, cleansing, scrubbing и т.п.
По всей видимости, придумывание необычных терминов — это что-то от маркетологов :)
НЛО прилетело и опубликовало эту надпись здесь
Ок, будем знать.
Вот с data munging, которое в wikipedia ставится синонимом data wrangling, сталкивался.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Смотрел оригинал этой книги (Data Wrangling ...) еще до ее официального выхода на O'Reily (мне по какой-то причине дали бесплаьный доступ) — на мой взгляд там воды сильно много и примеры кода откроенно слабые.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий