derprimus 26 окт 2020 в 11:59

Принципиально новый метод позволяет тренировать ИИ практически без данных

5 мин

15K

Блог компании MadrobotsИскусственный интеллектМашинное обучение*

Перевод

+27

Комментарии 18

N-Cube 26 окт 2020 в 12:38

Получается, исследователи вручную задали границы классов и добавляют промежуточные классы, варьируя число k требуемых ближайших соседей алгоритма kNN. Такая себе пространственная интерполяция. Ок, в ГИС (геоинформационные системы) такой подход используют не первый век как. Только причем тут машинное обучение? Это же просто заданный вручную классификатор.

vics001 26 окт 2020 в 18:16

Может скоро и симплекс-метод откроют. Век живи — век учись.

kraidiky 26 окт 2020 в 19:23

Я уж надеялся они на примере картинок научились делать то, что 100 лет умеют методы NLP. Это там если сложить вектора «женщина» и «король» получится ветокр похожий на «королева» даже если модели слово «Королева» не давать на претрейне. А алгоритмам машинного зрения до этого ещё расти и расти…

SmilePic 26 окт 2020 в 13:10

Дистилляция данных, которая хороша для разработки примеров с «мягкой» меткой для нейронных сетей, также имеет значительный недостаток: метод требует, чтобы вы начали с гигантского набора данных, сокращая его до чего-то более эффективного.

Если я правильно понимаю, нам все равно нужна большая выборка, только дополнительно её нужно правильно сократить до «гибридных объектов» с правильными метками. Потом мы получим хотя бы выигрыш в скорости обучения сети?

Elvares 26 окт 2020 в 14:29

Выйгрыш будет т. к все таки сетку дольше учить, чем как-то видоизменять данные. Но я чет не понял каким образом они изменяют данные. Не будет ли получаться бред из данных, которые имеют огромное кол-во фичей с большим кол-во классов. На том же датасете coco, выйдет ли что-то дельное

YuraLia 26 окт 2020 в 15:34

Думаю, обучать то будет быстрее, но устойчивость к состязательным примерам наверное еще ухудшится. Идея дистиллировать данные наверное хорошая, но в этой реализации видимо дальше цифр или синтетических примеров продвинутся не получится.

НЛО прилетело и опубликовало эту надпись здесь

longtolik 26 окт 2020 в 19:36

Если вещи будут развиваться подобным ходом, то переизобретут автоматическую коррекцию IF, потом RBF Classifier, и даже нейроморфную память :) О_o

v1000 27 окт 2020 в 05:15

Я правильно понимаю, что сложность обучения на большом объеме структурированных данных заменяют на сложность структирирования малого объема данных? И вместо машинного обучения мы получаем человеческое программирование данных.

michael_v89 27 окт 2020 в 05:18

Их тщательно спроектировали и оптимизировали, чтобы они содержали объем информации, эквивалентный объему полного набора.
исследователи создали серию крошечных наборов синтетических данных и тщательно продумали их «мягкие» метки

Так это то же самое, что делает сама нейросеть при обучении по обычному набору данных — объединяет обучающие примеры в некий общий образ со всеми признаками одновременно. Поэтому они могут классифицировать объекты, которые раньше не видели, и поэтому же у них узкая специализация и много ложных срабатываний за ее пределами.

Они просто ускорили обучение, используя логические рассуждения для получения результата. В самой сети от этого интеллекта не добавилось. Это наоборот ближе к обычному программированию.

zueve 27 окт 2020 в 08:17

Посмотрел бы я на обучение ребенка по картинкам из примера. Ведь именно эта аналогия описана в начале статьи

DarthVictor 27 окт 2020 в 08:21

10 изображенных, «дистиллированных» из MNIST, могут обучить ИИ-модель достигать 94-процентной точности распознавания рукописных цифр. Тунчжоу Ван и др.

Я конечно не специалист, но эти изображения выглядят так, как будто исследователи просто сделали дамп уже работающей нейросети.

johnfound 27 окт 2020 в 09:01

Ну или наоборот – вычислили правильные коэффициенты сети из выходных данных и потом создали изображение, которое устанавливает их с первой попытке.

kraidiky 30 окт 2020 в 17:09

В комментах к этой статье кажется о таком никто и не думал, но именно так, прямым вычислением получаются веса для гостовской нейросети идентификации биометрических даннных.

Alex_ME 27 окт 2020 в 09:41

Я думал, тут про one shot learning, а тут такое...

LynXzp 27 окт 2020 в 11:12

Похоже сейчас ученый изнасилует журналиста. Потому что наука всегда не ради практического применения. Похоже это просто еще один, бесполезный практически но научно интересный, способ обучения нейронной сети. Где хаб ненормальная наука?

Vinchi 28 окт 2020 в 07:32

Опять кликбейт.

iShrimp 3 ноя 2020 в 16:43

10 изображенных, «дистиллированных» из MNIST

Интересный факт: насколько глубоко позволяют хакнуть нейросеть эти специально сгенерированные 10 картинок, которые человеку кажутся случайным шумом. Это напоминает об одной фундаментальной проблеме — уязвимости готовых обученных нейросетей, которые можно взломать специально подобранным паттерном. Пример с лицами и цветными очками.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий