Pavel_Osipov 24 июл 2012 в 17:18

PyBrain работаем с нейронными сетями на Python

8 мин

166K

Python * Алгоритмы *

+89

Комментарии 22

Stas911 24 июл 2012 в 17:53

Спасибо, только начал изучать питон и задумался, а есть ли реализация алгоритмов машинного обучения, а тут как раз ваша статья по теме!

Pavel_Osipov 24 июл 2012 в 18:17

В таком случае надеюсь PyBrain Вам понравится, и позволит реализовать что-нибудь занимательное

vaxXxa 24 июл 2012 в 18:44

Могу еще посоветовать:

Pavel_Osipov 24 июл 2012 в 18:52

Это уже не нейронные сети, но тоже конечно Machine Learning.
Может расширите Ваш комментарий аргументацией рекомендации именно этих двух проектов?

kmike 25 июл 2012 в 07:51

+1 к этим проектам. Чего тут комментировать) В scikit-learn собрана куча современных алгоритмов, довольно неплохо оптимизированных, и люди все это на практике используют. В PyBrain — только небыстрые и не супер-актуальные нейронные сети + довольно корявые биндинги для SVM, которые, похоже, не очень-то и поддерживаются. Даже если количество коммитов сравнить — в PyBrain их за последний год штук 10 было, в scikit-learn это сотни (по десятку в день), очень активный и хороший проект. Pandas не пользовался, но все хвалят очень.

MihailOlenin 24 июл 2012 в 19:04

При обцчении в ШАДе я искал различные библиотеки, реализующие алгоритмы машинного обучения. К сожалению, в большинстве реализованы обычно только базисные алгоритмы и каких-то продвинутостей нету.

В данной библиотеке PyBrain удивительно много алгоритмов. Насколько удобно ими пользоваться — непонятно.

Disasm 24 июл 2012 в 18:50

Когда я сел разбираться в нейронных сетях, то понял, что метод обратного распространения по сравнению с другими методами это как счёты по сравнению с суперкомпьютером. Для объяснения принципов и модельных примеров — пойдёт, для реальных задач он ужасен.

mechmind 24 июл 2012 в 20:07

Сравнивали с fann? У них есть биндинги к python в комплекте, да и побыстрее должна быть.

iwuvjhdva 27 авг 2012 в 11:07

К PyBrain можно прикручивать arac, который дает прирост производительности раз в 10. А вот с fann я как раз собираюсь сравнить.

Pavel_Osipov 27 авг 2012 в 11:51

Я-бы использовал PyPy для JIT, более общий конечно вариант, по идее должен быть медленнее чем arac, просто смущает то, что последнее обновление для arac было больше двух лет назад

iwuvjhdva 31 авг 2012 в 12:41

Так… Вобщем сравнил. Субъективно libfann на порядок медленнее чем PyBrain + arac!

Pavel_Osipov 31 авг 2012 в 12:53

На порядок это серьёзно! Опишете процесс тестирования? Есть численные результаты (графики всегда эффектно выглядят)?
Сравнить со связкой PyPy + PyBrain не надумали?

А вообще, спасибо, что поделились. Такая информация может пригодится.

НЛО прилетело и опубликовало эту надпись здесь

boombick 25 июл 2012 в 12:23

Девиз Java: «Зачем просто, когда можно сложно?»

solver 25 июл 2012 в 14:26

Чушь. На любом языке можно создать фигню.
У меня мой проект сетей создается 1-й строчкой безо всяких фабрик.
BPNet net = new BPNet( 4, 100, Type.Sigma );

Загружаю данные.
net.LoadData( «C:\Net\datain.csv»)

Обучение
net.train( 100, TypeTrain.BP );

И что это доказывает? Да ничего…
Еще раз повторю, на любом языке можно написать плохо и хорошо.

НЛО прилетело и опубликовало эту надпись здесь

equand 25 июл 2012 в 00:17

У меня всегда с этим затык, может ТС объяснит как например файл разбирать нейронной сетью?
Например я хочу создать датасет из разнообразных слов и словосочетаний и определять спам по ним.
Пример простейшей байзановой сети я могу понять (матрица грубо говоря), а с нейронкой с ходу не выходит…
Хотя уверен с ней результаты были бы лучше для антиспама.

WoZ 26 июл 2012 в 09:47

Я очень сомневаюсь что такую задачу нейросетями решить можно. Требуется много ресурсов, не гарантируется нахождение минимума, возможны блуждания в седловых точках. Насколько мне известно, наивные байесовский классификаторы используются для этой цели и показывают хорошие результаты.

equand 26 июл 2012 в 10:11

Проблема Байеса — фальш-позитивы.

WoZ 26 июл 2012 в 10:14

Ну как сказать, вот для Вас F1 score > 0.98 это достаточно или нет? А требуемое количество ресурсов, на порядок, а то и два больше стоит повышения F1 до 0.999?

Pavel_Osipov 26 июл 2012 в 09:54

Единственная статья на хабре, кроме моей, в которой упоминается PyBrain — http://habrahabr.ru/post/136237/ посмотрите, возможно приведённый в ней код поможет Вам разобраться как по log-файлам сеть тренировать

yanchick 25 июл 2012 в 02:57

Есть еще хорошая библиотек NeuroLab, API которого сильно напоминает MatLab Neural Network Toolbox.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий