Комментарии 18
На картинках выглядит пока ужасно
+
DIB-R смогла создать качественные модели по одной 2D-картинке.
Очень качественно, особенно отрубленные ноги у птиц и помятые корпуса автомобилей.
Но позабавило, это да. Сразу вспомнил попытки нейросети нарисовать картинки на основе датасета из WikiHow. Хотя сам я от руки рисую примерно так же, да.
Это на основе пары картинок, представь что если робот с одной камерой делает 60 кадров в секунду и начинает понимать объем всех объектов вокруг, расстояние до них, их размеры и т.д. и это за 1/6 секунды. А если это будет камера дрона и он сможет без хитрых датчиков облетать любые препятствия и начнет наконец-то понимать где ветки деревьев, и что в них лететь не надо, сможет сам облетать людей независимо от сцены и снимать то что нужно без опасности врезаться.
Круто! Имхо, это естественный этап развития технологии машинного обучения. Мы это умеем делать на подсознательном уровне, теперь машины тоже научатся.
Нет, мы этого не умеем делать «на подсознательном уровне». Дети этому учатся. Другое дело, что там наверняка есть какие-то «заточки» на аппаратном уровне…
«умеем делать на подсознательном уровне»
Если дать кусок глины/3d-редактор случайному прохожему, то скорее всего, окажется что не умеем.
Если дать кусок глины/3d-редактор случайному прохожему, то скорее всего, окажется что не умеем.
В интересное время живем товарищи: мы не можем понять как работает мозг, создаем его цифровую модель и… не можем понять как работает эта модель. Для этого создаем модули которые обьясняют поведение нейросети. Чистейшая логика. Думаю дальше будет еще интереснее.
По сравнению с леопардом в форме дивана habr.com/ru/post/259191
— выглядит как наконец-то настоящий прорыв!
— выглядит как наконец-то настоящий прорыв!
В статье с этим «ягуаром» не было главного: никто даже не пытался проверить гипотезу (нифига не доказанную) про «уверен, эту картинку с первого взгляда легко опознает любой человек».
Потому как я, например, уверен, что с первого взгляда никакой «любой человек» её не опознает. Наоборот, если предъявлять картинку на всё более короткие промежтки времени (пара секунд, секунда, полсекунды и так далее), то число людей, увидевших тут леопарда будет расти, а число людей, обнаруживших диван — падать.
Да, пока нейровнные сети не умеют в сложные конструкции, которые в мозгу «во втором-третьем эшелоне» (и, тем более, в сознание) — и которые, собственно, обнаружив «подлог» «выключают» опознание леопарда и включают опознание дивана… Но как раз первая линия работает так же, как и у человека…
Потому как я, например, уверен, что с первого взгляда никакой «любой человек» её не опознает. Наоборот, если предъявлять картинку на всё более короткие промежтки времени (пара секунд, секунда, полсекунды и так далее), то число людей, увидевших тут леопарда будет расти, а число людей, обнаруживших диван — падать.
Да, пока нейровнные сети не умеют в сложные конструкции, которые в мозгу «во втором-третьем эшелоне» (и, тем более, в сознание) — и которые, собственно, обнаружив «подлог» «выключают» опознание леопарда и включают опознание дивана… Но как раз первая линия работает так же, как и у человека…
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Nvidia создала нейросеть, которая преобразует двухмерные объекты в трехмерные