Комментарии 3
Зачем писать 101ый раз то, да ещё так по-дилетантски, если это уже даже тут на Хабре написали 100 раз до вас?
Конвейеры данных (Data Pipelines) состоят из трех основных компонентов: источника, одного или нескольких этапов обработки и пункта назначения
Здесь самое интересное это обработчики. Все остальное – тривиальшина.
А обработчики это алгоритмы, в разных задачах разные. О них можно говорить бесконечно. Это о любви можно ничего больше не говорить, поскольку, «о ней все сказано». Ну, и о чем тогда статья?
... является конвейер на основе пакетной обработки (batch-based pipeline). Например, система точек продаж может создавать множество точек данных, которые необходимо передавать в хранилище данных и аналитическую базу данных
Тут вообще написано не то что по-русски... Вообще, по-человечески?
Почему не пользуетесь устаявшейся терминологией? Пайплайн уже давно понятное слово в разработке, тем более в ML. Батч - тоже терминология вполне устаявшаяся. Термин "точка продаж" остался за пределами моего понимания...
Руссификация терминов привела лишь к недопонимаю, а это, как я предполагаю, противоположный результат тому, что вы хотели достичь.
Что такое конвейер данных? И почему вы должны это знать