Pull to refresh

Comments 18

DIB-R смогла создать качественные модели по одной 2D-картинке.

Очень качественно, особенно отрубленные ноги у птиц и помятые корпуса автомобилей.

Но позабавило, это да. Сразу вспомнил попытки нейросети нарисовать картинки на основе датасета из WikiHow. Хотя сам я от руки рисую примерно так же, да.
Это на основе пары картинок, представь что если робот с одной камерой делает 60 кадров в секунду и начинает понимать объем всех объектов вокруг, расстояние до них, их размеры и т.д. и это за 1/6 секунды. А если это будет камера дрона и он сможет без хитрых датчиков облетать любые препятствия и начнет наконец-то понимать где ветки деревьев, и что в них лететь не надо, сможет сам облетать людей независимо от сцены и снимать то что нужно без опасности врезаться.
Может облетать, а может и подлететь сзади и всадить заряд живительного свинца в черепушку. Страшненько всё это, страшненько.
Круто! Имхо, это естественный этап развития технологии машинного обучения. Мы это умеем делать на подсознательном уровне, теперь машины тоже научатся.
Нет, мы этого не умеем делать «на подсознательном уровне». Дети этому учатся. Другое дело, что там наверняка есть какие-то «заточки» на аппаратном уровне…
«умеем делать на подсознательном уровне»
Если дать кусок глины/3d-редактор случайному прохожему, то скорее всего, окажется что не умеем.
Речь ведь не о создании 3d-моделей, а о понимании какая у объекта форма в объеме по двухмерному изображению.

Это при условии, что мы видели ранее нечто похожее трехмерное. Либо надо как минимум три двумерных проекции, как в чертежах.

Люди могут предсказывать форму объекта по перспективе, свету и теням (если они есть).
В интересное время живем товарищи: мы не можем понять как работает мозг, создаем его цифровую модель и… не можем понять как работает эта модель. Для этого создаем модули которые обьясняют поведение нейросети. Чистейшая логика. Думаю дальше будет еще интереснее.
В статье с этим «ягуаром» не было главного: никто даже не пытался проверить гипотезу (нифига не доказанную) про «уверен, эту картинку с первого взгляда легко опознает любой человек».

Потому как я, например, уверен, что с первого взгляда никакой «любой человек» её не опознает. Наоборот, если предъявлять картинку на всё более короткие промежтки времени (пара секунд, секунда, полсекунды и так далее), то число людей, увидевших тут леопарда будет расти, а число людей, обнаруживших диван — падать.

Да, пока нейровнные сети не умеют в сложные конструкции, которые в мозгу «во втором-третьем эшелоне» (и, тем более, в сознание) — и которые, собственно, обнаружив «подлог» «выключают» опознание леопарда и включают опознание дивана… Но как раз первая линия работает так же, как и у человека…
Чтобы люди приняли леопардовый диван за леопарда — мало демонстировать картинку в течение секунды, нужно этот диван ещё и запрятать по среди зарослей в каких водятся леопарды.
После этого довольно высок шанс не найти ни дивана, ни леопарда:)
Sign up to leave a comment.

Other news

Change theme settings