Она говорит, что развитие пространсвенного интеллекта приведет к кембрийскому взрыву в ИИ. А для создание прострагственнго интеллекта нужно в том числе уметь строить 3д модель по фото/видео
С точки зрения Фей Фей Ли, которую считают крестной матерью искуственного интеллекта построение 3д модели окружающего пространства по фото является передним краем в создании ИИ.
Она говорит, что развитие пространсвенного интеллекта приведет к кембрийскому взрыву в ИИ. А для создание прострагственнго интеллекта нужно в том числе уметь строить 3д модель по фото/видео
https://braintitan.medium.com/fei-fei-li-with-spatial-intelligence-artificial-intelligence-will-understand-the-real-world-5413022c8974
С точки зрения Фей Фей Ли, которую считают крестной матерью искуственного интеллекта построение 3д модели окружающего пространства по фото является передним краем в создании ИИ.
Тут обучение ImageNet-1K на сервере dgx a100 (состоит из 8 видеокарт а100) заняло около недели (300 эпох обучения)
Одного сервера dgx a100 хватает для обучения imagenet-1k за неделю
4 видеокарты rtx3090 позволяют обучать за 14мин/эпоху. 90 эпох получится за 21 час.
Обучение на датасете ImageNet-1k (1000 категорий, более 1млн изображений) на видеокарте nvidia M40 занимает 14 дней.
На моей rtx4050 видимо займет примерно столько же времени.
На картинках шкала от 1 до 12 что означает?
Пространственный искусственный интеллект:
Описанный в статье способ можно применить, чтобы выйграть конкурс по распознаванию лиц:
https://habr.com/ru/companies/ntechlab/articles/594575/
Вот ещё есть площадка для определения качества распознавания лиц: MegaFace
https://www.livebusiness.ru/tags/raspoznavanie_lic/
"Однокласники" не обучали свою нейросеть для распознавания лиц, а использовали готовую сеть от гугла (facenet).
На 15:40 обьясняется почему:
У меня гугл-фото плохо лица распознает. Есть куда расти ещё технологиям распознавания
Интересная задача. Но 128 признаков маловато кажется для восстановления лица
В тексте нигде не написано про плоскую маску. Скорее всего там действительно трехмерный обьект
С этой статье описывается процесс использования готовой предобученной модели распознавания лиц.
Я как-то писал статью про обучение собственной модели распознавания лиц: https://habr.com/ru/articles/789774/
Но в России собственные модели почти никто не создает-все используют готовые. (Кроме FindFace)
Про лидарное машинное зрение Яндекса можно прочитать здесь:
Про безлидарное бинокулярное машинное зрение skydio можно прочитать здесь:
Данная статья про очень редкий раздел машинного зрения (обведено красным маркером)
Еще раз повторю: построение 3d моделей местности является одной из ключевых задач для создания автопилота.
https://youtu.be/jcKnb65wpWA?si=6jqACaRKUgu1m-uQ
Meshroom просто обрабатывает видео.
Примеры Nvidia и Гугла не впечатляют?