Как стать автором
Обновить
22
17

Пользователь

Отправить сообщение

Она говорит, что развитие пространсвенного интеллекта приведет к кембрийскому взрыву в ИИ. А для создание прострагственнго интеллекта нужно в том числе уметь строить 3д модель по фото/видео

https://braintitan.medium.com/fei-fei-li-with-spatial-intelligence-artificial-intelligence-will-understand-the-real-world-5413022c8974

С точки зрения Фей Фей Ли, которую считают крестной матерью искуственного интеллекта построение 3д модели окружающего пространства по фото является передним краем в создании ИИ.

Тут обучение ImageNet-1K на сервере dgx a100 (состоит из 8 видеокарт а100) заняло около недели (300 эпох обучения)

Одного сервера dgx a100 хватает для обучения imagenet-1k за неделю

4 видеокарты rtx3090 позволяют обучать за 14мин/эпоху. 90 эпох получится за 21 час.

Полный датасет 22 тыс категорий
Полный датасет 22 тыс категорий

Обучение на датасете ImageNet-1k (1000 категорий, более 1млн изображений) на видеокарте nvidia M40 занимает 14 дней.

На моей rtx4050 видимо займет примерно столько же времени.

На картинках шкала от 1 до 12 что означает?

Пространственный искусственный интеллект:

Описанный в статье способ можно применить, чтобы выйграть конкурс по распознаванию лиц:

https://habr.com/ru/companies/ntechlab/articles/594575/

Вот ещё есть площадка для определения качества распознавания лиц: MegaFace

https://www.livebusiness.ru/tags/raspoznavanie_lic/

"Однокласники" не обучали свою нейросеть для распознавания лиц, а использовали готовую сеть от гугла (facenet).

На 15:40 обьясняется почему:

У меня гугл-фото плохо лица распознает. Есть куда расти ещё технологиям распознавания

Интересная задача. Но 128 признаков маловато кажется для восстановления лица

В тексте нигде не написано про плоскую маску. Скорее всего там действительно трехмерный обьект

С этой статье описывается процесс использования готовой предобученной модели распознавания лиц.

Я как-то писал статью про обучение собственной модели распознавания лиц: https://habr.com/ru/articles/789774/

Но в России собственные модели почти никто не создает-все используют готовые. (Кроме FindFace)

Про лидарное машинное зрение Яндекса можно прочитать здесь:

Про безлидарное бинокулярное машинное зрение skydio можно прочитать здесь:

Данная статья про очень редкий раздел машинного зрения (обведено красным маркером)

Третий пункт я считаю самый перспективный
Третий пункт я считаю самый перспективный

Еще раз повторю: построение 3d моделей местности является одной из ключевых задач для создания автопилота.

Тут еще один пример Nvidia (с использованием лидара, что с точки зрения Илона Маска концептуально неверно)
Тут еще один пример Nvidia (с использованием лидара, что с точки зрения Илона Маска концептуально неверно)

https://youtu.be/jcKnb65wpWA?si=6jqACaRKUgu1m-uQ

Meshroom просто обрабатывает видео.

Примеры Nvidia и Гугла не впечатляют?

1
23 ...

Информация

В рейтинге
363-й
Зарегистрирован
Активность