maybe_elf Dec 10 2019 at 14:29

Nvidia создала нейросеть, которая преобразует двухмерные объекты в трехмерные

2 min

12K

Working with 3D-graphics*Machine learning*Artificial Intelligence

+16

Comments 18

puyol_dev2 Dec 10 2019 at 15:53

На картинках выглядит пока ужасно

Gurturok Dec 10 2019 at 16:05

Meklon Dec 10 2019 at 16:34

+13

ffs Dec 10 2019 at 17:17

store.steampowered.com/app/22230/Rock_of_Ages

namikiri Dec 10 2019 at 16:43

DIB-R смогла создать качественные модели по одной 2D-картинке.

Очень качественно, особенно отрубленные ноги у птиц и помятые корпуса автомобилей.

Но позабавило, это да. Сразу вспомнил попытки нейросети нарисовать картинки на основе датасета из WikiHow. Хотя сам я от руки рисую примерно так же, да.

BupycNet Dec 10 2019 at 17:55

Это на основе пары картинок, представь что если робот с одной камерой делает 60 кадров в секунду и начинает понимать объем всех объектов вокруг, расстояние до них, их размеры и т.д. и это за 1/6 секунды. А если это будет камера дрона и он сможет без хитрых датчиков облетать любые препятствия и начнет наконец-то понимать где ветки деревьев, и что в них лететь не надо, сможет сам облетать людей независимо от сцены и снимать то что нужно без опасности врезаться.

namikiri Dec 11 2019 at 10:28

Может облетать, а может и подлететь сзади и всадить заряд живительного свинца в черепушку. Страшненько всё это, страшненько.

xakep2011 Dec 10 2019 at 16:51

Круто! Имхо, это естественный этап развития технологии машинного обучения. Мы это умеем делать на подсознательном уровне, теперь машины тоже научатся.

khim Dec 10 2019 at 16:58

Нет, мы этого не умеем делать «на подсознательном уровне». Дети этому учатся. Другое дело, что там наверняка есть какие-то «заточки» на аппаратном уровне…

Syatonka Dec 10 2019 at 17:55

«умеем делать на подсознательном уровне»
Если дать кусок глины/3d-редактор случайному прохожему, то скорее всего, окажется что не умеем.

playermet Dec 10 2019 at 18:49

Речь ведь не о создании 3d-моделей, а о понимании какая у объекта форма в объеме по двухмерному изображению.

OKyJIucT Dec 10 2019 at 19:11

Это при условии, что мы видели ранее нечто похожее трехмерное. Либо надо как минимум три двумерных проекции, как в чертежах.

playermet Dec 11 2019 at 00:19

Люди могут предсказывать форму объекта по перспективе, свету и теням (если они есть).

jayb19 Dec 10 2019 at 17:55

В интересное время живем товарищи: мы не можем понять как работает мозг, создаем его цифровую модель и… не можем понять как работает эта модель. Для этого создаем модули которые обьясняют поведение нейросети. Чистейшая логика. Думаю дальше будет еще интереснее.

Keynessian Dec 10 2019 at 20:19

По сравнению с леопардом в форме дивана habr.com/ru/post/259191

— выглядит как наконец-то настоящий прорыв!

khim Dec 10 2019 at 22:29

В статье с этим «ягуаром» не было главного: никто даже не пытался проверить гипотезу (нифига не доказанную) про «уверен, эту картинку с первого взгляда легко опознает любой человек».

Потому как я, например, уверен, что с первого взгляда никакой «любой человек» её не опознает. Наоборот, если предъявлять картинку на всё более короткие промежтки времени (пара секунд, секунда, полсекунды и так далее), то число людей, увидевших тут леопарда будет расти, а число людей, обнаруживших диван — падать.

Да, пока нейровнные сети не умеют в сложные конструкции, которые в мозгу «во втором-третьем эшелоне» (и, тем более, в сознание) — и которые, собственно, обнаружив «подлог» «выключают» опознание леопарда и включают опознание дивана… Но как раз первая линия работает так же, как и у человека…

Hab_Reader Dec 11 2019 at 06:41

Чтобы люди приняли леопардовый диван за леопарда — мало демонстировать картинку в течение секунды, нужно этот диван ещё и запрятать по среди зарослей в каких водятся леопарды.

AxeFizik Dec 11 2019 at 09:09

После этого довольно высок шанс не найти ни дивана, ни леопарда:)