Pull to refresh
20
0
Send message

В качестве резюме. Схема создания систем распознавания лиц и роли метода фотограмметрии-антифотограмметрии в ней:

1 этап самый трудозатратный. Создание больших датасетов под силу только крупным ШЕ компаниям или большим соцсетям. Для примера создание датасета сотрудниками соцсети "Однокласники": https://habr.com/ru/companies/odnoklassniki/articles/350566/

2 этап требует существенных вычислительных мощностей. Если для создания minimum valuable product бывает достаточно одной продвинутой видеокарты, то для создания state-of-art модели нужны тысячи GPU

3 этап самый простой. Часто на этом этапе берут чужую, предобученную кем-то другим модель. Соответственно первые два этапа проходить не нужно. К примеру для создания аналога FindFace три разработчика использовали модель, которая "почти случайно оказалась в открытом доступе" ( ссылку приводить не буду, можно загуглить по этой фразе)

Интересно, что Цукерберг обучал свое разпознавание лиц на датасете из 4000 людей и получил точность распознавания примерно как у среднего человека. Подробнее тут.

Что наталкивает на мысль, что для получения модели с качеством распознавания лучше, чем у человека нужно использовать в датасете больше 5000 людей.

Тут другое интересное исследование: Ученые выяснили, сколько лиц может запомнить человек

Человек может запомнить в среднем 5000 лиц

Тут пишут что 24Gb видеопамяти минимум нужно: https://habr.com/ru/articles/520996/

4,4 млн изобрпжений 4 тыс человек.

В среднем получается 1100 изображений каждого человека

https://hub.docker.com/r/harshjv/openface

Глубокое обучение распознавания лиц в соцсети Цукерберга использовало датасет из 4 млн изображений: https://en.wikipedia.org/wiki/DeepFace

Хотя скорее всего глубокое обучение запускали на видеокарте с 24Gb видеопамяти.

Видимо без 24Gb видеопамяти в глубоком обучении делать нечего.

Тут пример глубокого обучения системы распознавания лиц: https://habr.com/ru/articles/306568/

В данном случае авторы использовали датасет из 500тыс картинок с лицами, а обучение проводили всего лишь на одной видеокарте nvidia tesla 16Gb (500 тыс картинок 100*100 пикселей как раз занимают около 16 Gb)

Распознавание лиц человеческим мозгом: 19 фактов, о которых должны знать исследователи компьютерного зрения

https://habr.com/ru/articles/136483/

29. Face Recognition A Convolutional Neural Network Approach
30. Face Recognition using Convolutional Neural Network and Simple Logistic Classifier
31. Face Image Analysis With Convolutional Neural Networks

Нужно признать, что из статьи не совсем понятно о каком типе систем распознавания лиц идет речь.

По используемому методу выделяют 5 типов систем распознавания лиц:

1. Метод гибкого сравнения на графах (Elastic graph matching)

2. Нейронные сети

3. Скрытые Марковские модели (СММ, HMM)

4. Метод главных компонент или principal component analysis (PCA)

5. Active Appearance Models (AAM) и Active Shape Models (ASM)

В моей статье идет речь про 2-й тип систем распознавания лиц, (с использованием нейросетей). Данный тип систем распознавания лиц используется в социальной сети Марка Цикерберга. Подробнее тут: https://habr.com/ru/companies/synesis/articles/238129/

Любые смски от банков это сгенерированные алгоритмом тексты.

Я привел пример одну область (языковые модели), где данные, полученные детерминированными алгоритмами не используются для обучения нейросетей.

Могу привести примеры из других областей тоже.

Тексты (данные), сгенерированные детерминированными алгоритмами для обучения chatGPT и других моделей тоже не используются.

Да, по той же причине, по которой chatGPT обучают на реальных текстах, а не на текстах, написанных другой нейросетью.

В данном случае я удивился, что запатентовали метод. Насколько я гуглил патентуют только полезные образцы (воплощеные/невоплощеные в материале устроиства).

Методы вроде как нельзя патентовать во всем мире. Хотя может есть тут какие-то тонкости. Я глубоко не копал.

Если у Вас есть опыт патентования ит-решений в России и США, я думаю многим было бы интересно про это почитать.

Тут пример, когда дроны получили систему не машинного, а естественного стереозрения: https://iz.ru/news/645794

1
23 ...

Information

Rating
Does not participate
Registered
Activity