Search
Write a publication
Pull to refresh

Comments 14

Для обработки этих данных сейчас применяются большие фреймворки типа Hadoop, Spark, Cassandra
Ага, что ж не упомянули тогда MySQL, MSSQL, Oracle DB и далее по тексту, если СУБД вдруг стали «большими фреймворками»?
Spark MLLib написан с помощью скриптового языка Scala
WTF?
А в чем WTF? Spark разработан с помощью Scala и он является основным языком.
Кроме того поддерживаются Python и Java, R. Можно почитать подробнее здесь:

www.scala-lang.org/what-is-scala.html
www.quora.com/Why-is-the-default-language-for-Spark-MlLib-Scala-and-not-Python-or-Java
spark.apache.org/docs/1.2.1/mllib-guide.html
Вы не осилили прочитать выделенное полужирным?! Процитирую ещё раз «скриптового языка Scala». При этом Scala не является скриптовым языком.
А что сколько злости? Всё я осилил, я подумал, что акцент на Scala. То, что он скриптовый — не совсем верно, лучше поставить это в кавычки.
«To some, Scala feels like a scripting language» — я эти some.
Между feels like и является — расстояние большое.
MySQL, MSSQL прочее- это просто базы данных. В том же Spark'е кроме SQL имеется ряд библиотек и средств (MLLib, GraphX, Spark Streaming).
Это больше, чем просто СУБД. Аналогично с Hadoop'ом.
Опять же, воспринимать и осознавать написанное у вас получается не очень. Мой комментарий был не про spark и hadoop, а про cassandra, которая является базой данных.
Выделили бы жирным, как про «скриптовый» язык. Вы правы, фреймворками являются Spark и Hadoop. Cassandra попала для «кучности», но не вижу в этом проблемы. Да, можно дописать и MySQL, MSSQL и прочее.
Sign up to leave a comment.