Comments / Profile of Dark

Пользователь

Dark_Daiver Nov 24 2016 at 16:26

>Но к сожалению в языке C++ пока нет такой методики создания объектов
И я очень надеюсь что она и не появится. Ибо чревато всякими неожиданными эффектами

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 19:34

Мне нравится думать, что ResNet это такой себе каскад, в котором мы обучаем одновременно все этапы, а не только текущий

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 19:21

Как я понимаю, еще используют хитрую инициализацию
http://www.jmlr.org/proceedings/papers/v28/sutskever13.pdf
Статью я сам пока не осилил, но
>More recently, Martens (2010)… is capable of training DNNs from certain random initializations without the use of pre-training, and can achieve lower errors for the various auto-encoding tasks considered by Hinton & Salakhutdinov (2006).

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 19:17

Я абсолютно не спец в Deep Learning, поэтому могу не совсем верно использовать термины
Отсюда https://arxiv.org/pdf/1512.03385v1.pdf
>Our method shows no optimization difficulty
В пункте про обучение 1к сетки
>The testing result of this 1202-layer network is worse than that of our 110-layer network, although both have similar training error. We argue that this is because of overfitting.
Ну я это понял как обучить смогли, но получили оверфит из-за слишком сложной модели при малом числе данных.
Если переобученную сеть нельзя считать за обученную сеть, то тогда я неправ.

Пример с этой сеткой я привел для того, чтобы показать, что проблема затухающих градиентов для сверхглубоких сетей может и не стоять, при правильно подобранной архитектуре.

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 18:36

Ну, а чем еще их учат то? Backprop (т.е. получение градиента) и разные варианты SGD. С затуханием борются с использованием незатухающих ф-ий (ReLU) и штук типа Batch Normalization, если я не ошибаюсь, конечно.
Тот же ResNet (в том числе и его версию из 1000 слоев), вполне обучили.

Под «честным», я имею ввиду обучение на всех размеченных данных без предобучения

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 18:15

Понял, спасибо!

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 16:08

Виноват, не понял что в вашем сообщении акцент на разметке.

Если честно, то мне казалось, что предобучение в основном использовалось чтобы ускорить обучение (и сейчас так уже делают редко).
А есть ли какие-нить бенчмарки которые бы сравнивали качество предобученных моделей + тюннинг и моделей обученных «честно»?

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

Dark_Daiver Nov 21 2016 at 14:24

Как раз наоборот, для Deep Learning важно чтобы данных было много. Иначе велик шанс получить переобученную модель.

Агент UNREAL. Нейросеть «фантазирует» о будущем — и обучается быстрее

Dark_Daiver Nov 20 2016 at 10:06

За UNREAL не скажу, но тот же AlphaGo, который «ИИ и его обучением и принятием решений» именно так и работал.

Ваш язык программирования — отстой

Dark_Daiver Nov 18 2016 at 06:18

>Про питон — половина просто зашоренность автора
Кстати да. Более того, пример с отступами и вложенными if/else я бы использовал в качестве аргумента «за» отступы вместо {}

Ваш язык программирования — отстой

Dark_Daiver Nov 17 2016 at 20:46

Бомбежка от того, что вместо указания реальных проблем, автор(ы) статьи высосали большую часть пунктов из пальца.

Ваш язык программирования — отстой

Dark_Daiver Nov 17 2016 at 14:16

>это можно использовать как краткий справочник по особенностям языков программирования
Не стоит.
За все языки не скажу, но по части C/C++/Python/Haskell большая часть пунктов как минимум спорна.

Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей

Dark_Daiver Nov 17 2016 at 05:07

Эм, я конечно извиняюсь, но вы точно «в теме»?
Residual networks это не библиотека, это вполне себе подход к организации архитектуры сети https://arxiv.org/pdf/1512.03385v1.pdf.
Batch Normalization/Layer Normalization это тоже не библиотеки.

Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей

Dark_Daiver Nov 16 2016 at 06:04

>Да как бы на самом деле ничего революционного и грандиозного за последние годы в нейронных сетях — не было
Ну а как же ResNet, Batch normalization и прочие веселые штуки?

Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей

Dark_Daiver Nov 15 2016 at 19:02

Я так понимаю, что при использовании семейства ReLU вместо сигмоид, хитрой инициализации и residual связей, проблема затухания градиентов не особо стоит

Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей

Dark_Daiver Nov 15 2016 at 08:29

Эм, а разве ядро не создается в процессе обучения? Ну в смысле отдельно обучать автоэнкодер не обязательно же.

Tesla Motors презентовала новый улучшенный автопилот

Dark_Daiver Nov 1 2016 at 14:16

Средства получения информации есть, вопрос в средствах принятия решений.

Каковы перспективы у «немодной» платформы .NET — мнения экспертов

Dark_Daiver Oct 21 2016 at 07:36

>К тому же часто проблема использования памяти — это не проблема языка, а проблема конкретного кода и алгоритмов.
Ну строго говоря нет. Язык может быть построен на принципах, которые трудно или невозможно реализовать без оверхеда (или грязных трюков).
Гипотетический язык с «честной» динамической типизацией будет априори проигрывать гипотетическому языку со статической типизацией (по производительности и потреблению памяти), к примеру.

Google Cloud Vision API‎. Будущее Computer Vision as a service настало?

Dark_Daiver Oct 20 2016 at 16:07

Почти уверен что ГА там и не пахнет =)

Анатомия KD-Деревьев

Dark_Daiver Oct 18 2016 at 15:40

Из того что я слышал про диаграммы Вороного (сам я не пытался разобраться), они могут в некоторых случаях требовать довольно много памяти, и построение такой диаграммы на 1 000 000 — 10 000 000 точек может занимать по полминуты. Для меня это довольно много.
Если я ошибаюсь, то буду рад об этом узнать =)

1 2 ...

9 10

12 13 14 15