Comments / Profile of pustota

Данил Липовой @pustota_2009

Разработчик, архитектор приложений

Маленький код для больших данных или Apache Spark за 3 дня

pustota_2009 Nov 25 2016 at 07:28

В данном случае эти параметры оказались именно такими практически случайным образом, это ведь не настоящие данные, а для разработки (были сгенерированны функцией rand() в экселе).

Вообще их выбирают исходя из того, что слишком большой шаг ведет к расходимости, а слишком маленький долго работает. Насколько я понимаю, данная реализация уменьшает шаг с каждой итерацией на stepSize/sqrt(t). Но пока с этим не разбирался детально.

Look

Маленький код для больших данных или Apache Spark за 3 дня

pustota_2009 Nov 25 2016 at 07:28

не та ветка

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Nov 5 2016 at 11:41

Да, собственно топологии еще не перебирал (даже кол-во слоев не пробовал менять). Пока занимаюсь отладкой общей логики и функциональной обвязки (распределение вычислений по сети на несколько машин и агрегация результатов).

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Nov 4 2016 at 10:10

Проект — макроэкономическое моделирование. Надеюсь вскоре будут результаты достойные публикации. Размер сеток на данный момент 200x70x15 (три слоя).

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Oct 28 2016 at 05:19

Проверил, простое заполнение небольшого двумерного массива x,y проходит несколько медленнее, чем одномерного x*y.

int x, y, z;
int i, j, k;

x = 100;
y = 10;
z = 10000;

double[,] a = new double[x, y];
double[] b = new double[x * y];

Stopwatch stA = new Stopwatch();
stA.Start();

for (k = 0; k < z; k++)
for (i = 0; i < x; i++)
for (j = 0; j < y; j++)
a[i, j] = i * k;

stA.Stop();

Stopwatch stB = new Stopwatch();
stB.Start();

for (k = 0; k < z; k++)
for (i = 0; i < x * y; i++)
b[i] = i * k;

stB.Stop();

Results:

stA.Elapsed.Ticks = 531087
stB.Elapsed.Ticks = 390716

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Oct 27 2016 at 17:41

Да это к счастью не проблема, загрузить проц весьма легко увеличив кол-во параллельно выполняющихся потоков в 1,5-2 раза, данный пример был для сравнимости результатов при одинаковом коде приложения (менялась только библиотека).

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Oct 27 2016 at 11:13

Да, GPU показывает изумительные результаты. Я пробовал делать расчеты на GPU, оказалось там очень большие затраты на ввод вывод данных (вплоть до проигрыша CPU в сумме). Специфика моего приложения в том, что обмен данными очень интенсивный, такой что смысла юзать GPU не увидел.

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Oct 27 2016 at 11:11

Кроме классических сетей (с реализацией обучения, отжига и т.д.) есть сети Хопфилда, самоорганизующиеся карты Кохонена. Вот тут куча примеров использования:

https://github.com/jeffheaton/jeffheaton-book-code/tree/master/CSIntroNeuralNetworkEdition2

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Oct 27 2016 at 10:57

Спасибо, весьма интересно!

Look

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

pustota_2009 Oct 27 2016 at 10:55

Думаю вы правы, что это ускорило бы процесс. Только это потребовало бы уже гораздо больше усилий, чтобы перепахать всю внутреннюю логику на поддержку этого.

Look

1 2 ...

5 6