Comments 22
Наверное будет полезно упомянуть про weka. Это довольно зрелая опесоурс реализация на java большинства алгоритмов применяемых в data mining.
+3
+1
Как бы большие объемы сложно.
0
weka.wikispaces.com/I+cannot+process+large+datasets+-+any+ideas%3F
Я имел в виду, есть ли что-то подобное отдельному серверу, а не набору классов для обучения.
Я имел в виду, есть ли что-то подобное отдельному серверу, а не набору классов для обучения.
0
на Веке базируется Pentaho, тоже опен сорс, но уже охватывает не только Data Mining, но весь Business Inteligence
а насчет больших объемов: если пойти по вашей ссылке, то можно выйти на Massive Online Analysis (сам, если честно, первый раз увидел этот проект)
а насчет больших объемов: если пойти по вашей ссылке, то можно выйти на Massive Online Analysis (сам, если честно, первый раз увидел этот проект)
0
То что искал!!! Вот уж спасибо!
+1
I`m very young :))
Интересная штука все-таки.
А как на тему опесорс или такого еще не изобрели?
Интересная штука все-таки.
А как на тему опесорс или такого еще не изобрели?
+1
Добавил информации по weka и ссылки на книги.
+1
Правильно ли я понимаю что Weka нельзя использовать в закрытых коммерческих проектах?
0
Там GPL лицензия, такая же как у MySQL. Точно не получиться распространять коммерческое закрытое программное обеспечение использующее weka. Если же можно использовать MySQL без покупки коммерческой лицензии, то для weka этого тоже не понадобиться.
0
Но MySQL это ведь отдельное приложение, мы его не поставляем со своим, он ставится отдельно. Т.е. если я пишу сайт использующий mysql, то это требование чтобы на сервере стоял майскл, а с моим приложением идут лишь драйвера. В данном случае правда тоже проблема, jdbc длрайвера тоже под GPL, но их уже ставят на стороне application server'а, и мы вроде как тоже не причем. Для PHP и пр. все облегчается тем что с приложением вообще такие библиотеки не могут идти, они ставятся вместе с языком.
А вот с weka я так понимаю другой случай, это все таки именно библиотека, и нам придется на нее завязыватся из своего кода, ну и поставлять со своим приложением. Это ведь уже derivative work, судя по GPL, так?
А вот с weka я так понимаю другой случай, это все таки именно библиотека, и нам придется на нее завязыватся из своего кода, ну и поставлять со своим приложением. Это ведь уже derivative work, судя по GPL, так?
0
Лицензия GPL, afair, подразумевает под собой, что вы ничего не приобретаете до тех пор, пока сами ей следуете. Т.е. если вы производите продукт, который так же выходит под GPL — то все в порядке — можете использовать.
Но если вы производите продукт, который не GPL (например, ограничиваете количество копий у пользователя) — то должны приобретать комерческую лицензию и на все компоненты, которые используете при разработке.
Текст лицензии вот тут GNU General Public License
Но если вы производите продукт, который не GPL (например, ограничиваете количество копий у пользователя) — то должны приобретать комерческую лицензию и на все компоненты, которые используете при разработке.
Текст лицензии вот тут GNU General Public License
0
сори, не так прочитал в первый раз, поинт в том что использовать можно, но распространять конечное приложение нельзя? т.е. лишь для внутреннего использования, пусть и внутри коммерческой компании, это можно, но сделать, скажем публичный сайт, использующий weka, уже нельзя, так?
0
Первая книга — хорошая, остальные — не знаю, посмотрю.
Спасибо за топик, очень полезно.
Спасибо за топик, очень полезно.
0
Из англоязычной литературы — www.amazon.com/Introduction-Information-Retrieval-Christopher-Manning/dp/0521865719/ref=sr_1_1?ie=UTF8&qid=1249912902&sr=8-1 В интернете где-то тоже была.
0
В свое время я читал книгу Data Mining Introductory and Advanced Topics by Margaret H. Dunham. Вряд ли ее имеет смысл читать тем, кто уже разбирается в теме, но как первая книга она мне очень понравилась.
0
Спасибо, интересная подборка. Половина книг из списка правда уже знакома, остальные взял на заметку :-)
0
Спасибо.
Давно искал подобную литературу.
Буду использовать её в новом компиляторе.
Давно искал подобную литературу.
Буду использовать её в новом компиляторе.
0
Я видимо считаю Data Mining частью Computer Science те теоретическую дисциплину иначально. А тут только практические книги я так понимаю? Наверное это имеет смысл но для меня выглядит странным полное отсутствие теор материала. Вот про weka book уже говорили например…
0
Sign up to leave a comment.
Обзор литературы по Data Mining