Как стать автором
Обновить

Комментарии 9

Хочу отметить, что начиная с версии Studio 6.5 RapidMiner вернулся к концепции open source, и эта версия не имеет ограничений по памяти, как бесплатные предыдущие (6.0 — 6.4). А разница в возможностях между 5 и 6 версиями местами очень существенная.
Не совсем так. Действительно, есть такая новость где пишется о том, что RapidMiner вновь имеет community версию. На самом деле это похоже на маркетинговый ход, т.к. в этой коммьюнити версии урезано большое количество операторов, к примеру используемый Read XML в этой статье, в community шестерки работать не будет… а вот в пятой этот оператор свободно доступен к применению.

И ещё хотелось бы уточнить, о каких именно существенных различиях вы говорите? (сравниваем 5 и 6 community)
Честно говоря, возможность именно работы с XML в разных версиях я не сравнивал; знаю только, что ограничения бесплатных версий касаются в частности входных форматов данных (и коннекторов в целом). Если в community версии действительно не поддерживается XML — да, жаль. Но я бы не сказал, что прям «урезано большое количество операторов» — например операторы для построения моделей везде одни и те же.

Существенные различия 5 и 6 версий в очень большой мере касаются интерфейса, там гораздо круче сделаны графики, например, или просмотр статистики по датасетам, очень много маленьких плюшечек, делающих процесс работы очень приятным. Но я работаю с RM практически ежедневно, есть какие-то критичные для меня мелочи, которые может быть другим совершенно не важны.
Я не очень понял, что этот RapidMiner должен заменять. Системы бизнес-аналитики вроде Tableau, QlickView?
Что там насчёт сервера? Допустим мне надо делать автоматически обновляющиеся на основании баз данных графики и предоставлять к ним доступ в интранете компании — это то средство, которое мне поможет?
Автор просто осветил только ETL-возможности RapidMiner, которые, так сказать, скорее на втором плане. На самом деле инструмент для Data Mining / Machine Learning больше. Вот, например, посмотрите: docs.rapidminer.com/studio/getting-started/3-creating-model.html
Хотя RapidMiner Server и позволяет строить отчеты, но BI полноценный он заменить не может.
О, спасибо! Тогда попробую пощупать, как оно. Я для аналогичной операции пользуюсь пакетом rpart в R. Судя по Вашей ссылке, в RapidMiner визуализация деревьев принятия решений выглядит довольно симпатично.
RapidMiner ничего не должен заменять :) Это самостоятельная платформа для аналитики, работы с данными и построения моделей машинного обучения. Те же Tableau или QlickView бесспорно обгоняют RapidMiner по возможностям визуализации, ну так и сравнивать их не надо, это разного назначения продукты.

Сервер для описанных вами целей подойдёт, но к сожалению, RapidMiner Server доступен только на платной лицензионной основе, в отличие от Studio, где есть бесплатные версии.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации