Как стать автором
Обновить

Комментарии 3

Зачем писать 101ый раз то, да ещё так по-дилетантски, если это уже даже тут на Хабре написали 100 раз до вас?

Конвейеры данных (Data Pipelines) состоят из трех основных компонентов: источника, одного или нескольких этапов обработки и пункта назначения

Здесь самое интересное это обработчики. Все остальное – тривиальшина.

А обработчики это алгоритмы, в разных задачах разные. О них можно говорить бесконечно. Это о любви можно ничего больше не говорить, поскольку, «о ней все сказано». Ну, и о чем тогда статья?

... является конвейер на основе пакетной обработки (batch-based pipeline). Например, система точек продаж может создавать множество точек данных, которые необходимо передавать в хранилище данных и аналитическую базу данных

Тут вообще написано не то что по-русски... Вообще, по-человечески?

Почему не пользуетесь устаявшейся терминологией? Пайплайн уже давно понятное слово в разработке, тем более в ML. Батч - тоже терминология вполне устаявшаяся. Термин "точка продаж" остался за пределами моего понимания...

Руссификация терминов привела лишь к недопонимаю, а это, как я предполагаю, противоположный результат тому, что вы хотели достичь.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации