Comments / Profile of sergeypid / Habr

Сергей Подлесный @sergeypid

Мышиное обучение

Profile Publications 20Comments 476Bookmarks 344

Щи, или Распознавание 330 млн лиц на скорости 400 фото / сек

sergeypid Mar 7 2018 at 13:30

Вы за 120 мс успеваете просматривать на 6 нодах 300Гб векторов эмбеддинга для поиска? (нет конечно) Поделитесь секретами индексации?

Look

Щи, или Распознавание 330 млн лиц на скорости 400 фото / сек

sergeypid Mar 7 2018 at 13:02

А сколько у вас нодов Cassandra если не секрет?

Look

Почему не стоит использовать LocalStorage

sergeypid Feb 15 2018 at 13:32

localStorage располагает как минимум 5 Мб для хранения данных (этот размер поддерживается всеми основными веб-браузерами), что на порядок больше, чем у cookie-файлов (~ 4 Кб)

Занудство: на три порядка больше. Но я восхищаюсь темпами развития технологии, при которых прирост в 10 раз вообще ничего не значит, а переход от килобайтов к мегабайтам — это переход «на порядок». Предлагаю придумать новое русское выражение, которое бы передавало смысл фразы «на порядок больше» при сравнении килобайтов с мегабайтами.

Look

Рынок систем охлаждения для дата-центров на пороге значительных перемен

sergeypid Feb 9 2018 at 13:50

Рынок систем охлаждения для дата-центров значительно перегрет

Look

Neurogress: платформа систем нейроуправления от участников проекта Blue Brain

sergeypid Feb 8 2018 at 12:44

А что за девайс для считывания ЭЭГ? Где можно купить?

Look

Орги среди программистов

sergeypid Feb 2 2018 at 14:14

Вооооот

Look

Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

sergeypid Jan 25 2018 at 11:32

Вот попалась страничка с анонсом релиза (!) пяти статей на эту тему от Убера: eng.uber.com/deep-neuroevolution

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 11 2017 at 11:55

Только практика может ответить на этот вопрос. Проверьте свою схему и напишите статью на Архив.
Я бы применял их схему чуть попозже, после первоначального грубого обучения. Например, первые слои уже обучились типовым фильтрам Габора. Но это только мое предположение, все надо проверять. В этом и заключается эмпирический подход.

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 10 2017 at 21:49

При «холодном» рестарте коэффициенты сети случайно инициализированы, и их надо долго обучать. При рестарте с локального минимума у нас уже в принципе обученная сеть, дальнейшее обучение будет только слегка изменять значения весов.

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 7 2017 at 14:06

Ничего, бывает.

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 7 2017 at 13:04

Алгоритм имитации отжига
Гуглоперевод, говорите…

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 7 2017 at 12:03

Почему у комментаторов сложилось впечатление, что авторы первой статьи плохо обучили baseline?

ResNet-110, Cifar-10
Оригинальная статья авторов архитектуры ResNet
Смотрим таблицу 6: ошибка классификации на CIFAR-10: 6.43 (6.61±0.16)
Статья про «отжиг» (ансамбль снимков модели): Фигура 1.2 — ошибки классификации CIFAR-10
Resnet-110 Single Model: 5.52 (по оригинальной статье)
Resnet-110 Snapshot Ensemble: 5.32

Остальные результаты тоже можно проверить.

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 7 2017 at 11:36

Если скорость при тестировании для вас важнее, значит вы успешно внедряете технологию!

Все-таки скорость обучения тоже важна если данных много, GPU не топовый, модель сложная, идей много надо проверить…

Look

Отжиг и вымораживание: две свежие идеи, как ускорить обучение глубоких сетей

sergeypid Jul 6 2017 at 17:00

Результаты второй статьи и мне показались слабоватыми. Что касается первой, то речь ведь не идет об ускорении обучения как такового. За время обучения одной модели формируют N моделей для ансамбля.
По поводу гуглоперевода, коллега, попросил бы не бросаться обвинениями.

Look

Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

sergeypid Jun 7 2017 at 12:23

Чтобы дискуссия не была поверхностной, предлагаю простой эксперимент. Запустим скрипт оптимизации, приведенный в статье, для разный уровней сложностей.

Модифицированный код

import numpy as np  
from matplotlib import pyplot as plt
 
def f(w): return -np.sum((w - solution)**2)

npop = 50      # population size  
sigma = 0.1    # noise standard deviation  
alpha = 0.001  # learning rate  
N = 1000        # iterations number
SIZE = 10      # task size (times 3)
w = np.random.randn(SIZE *3) # initial guess  

solution = np.array([0.5, 0.1, -0.3] * SIZE).flatten() 

graph = np.zeros(N)
for i in range(N):  
  N = np.random.randn(npop, SIZE * 3)
  R = np.zeros(npop)
  for j in range(npop):
    w_try = w + sigma*N[j]
    R[j] = f(w_try)
  A = (R - np.mean(R)) / np.std(R)
  w = w + alpha/(npop*sigma) * np.dot(N.T, A)
  graph[i]= f(w)
  
plt.figure()
plt.plot(np.log(-graph))
plt.show()

Уровень сложности задачи определяется только размерностью вектора параметров w. Вот табличка достигнутой погрешности решения и затраченного числа итераций для разного уровня сложности:

Размерность w     Число итераций     Погрешность (f(w))
          3                250            10E-12
         30               1000            10E-7
        300               2500            10E-3
       3000               7000            10E0
      30000              >20000       Не доучилась за полчаса, см. график

По-моему совсем неплохой результат для задачи, которая в принципе никак не ограничена дифференцируемостью функции, числом шагов эмуляции эпизода и т.п. Никаких оптимизаций в коде не проводилось, очевидно что нужно постепенно снижать скорость обучения и т.п.

График обучения при сложности 30:

График обучения при сложности 300:

График обучения при сложности 3000:

График обучения при сложности 30000:

Look

Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

sergeypid Jun 7 2017 at 09:29

Ну вот Вам понятно, а этим господам непонятно: Andrej Karpathy, Tim Salimans, Jonathan Ho, Peter Chen, Ilya Sutskever, John Schulman, Greg Brockman & Szymon Sidor.

Look

Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

sergeypid Jun 7 2017 at 08:58

Статья не об этом. Но я желаю Вам успеха.

Look

Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

sergeypid Jun 7 2017 at 08:57

Вы считаете задачу обучить машину играть в игры для Атари имея на входе только скриншоты "совсем несложной системой"? На этой задаче предложенный алгоритм работает наравне с reinforced learning, в каких-то играх побеждает, в других немного отстает.

Look

Чип для умных камер ELISE — одно из самых высокотехнологичных изделий России 2017 года. Плата для разработчиков и камера

sergeypid Jun 1 2017 at 17:47

Поиск https://www.google.ru/search?client=ubuntu&channel=fs&q=трехмерная+бинокулярная+камера результата не дал. Не могли бы раскрыть информацию по трехмерной бинокулярной камере от Элвис?

Look

Власть народу: как использовать ИИ для решения человеческих проблем

sergeypid Mar 24 2017 at 14:29

Роботы пишут обзорные статьи по ИИ.

-1

Look

1 2

4 5 ...

23 24