Comments 3
Я не понял, откуда берутся детекторы признаков.
Первый слой еще понятен, это простые геометрические примитивы, их ограниченное число (96?) и их можно создать искусственно.
Второй слой — комбинации всех 96 первичных признаков в матрице 11х11=121. Итого 96 в 121 степени уникальных возможных сочетаний?
Видимо, все таки, эти детекторы должны как-то генерироваться в процессе обучения?
И еще. Похоже, такая сеть учится распознавать изображения определенного размера, не вижу механизма масштабирования. Собачка в углу кадра и собака крупно?
Первый слой еще понятен, это простые геометрические примитивы, их ограниченное число (96?) и их можно создать искусственно.
Второй слой — комбинации всех 96 первичных признаков в матрице 11х11=121. Итого 96 в 121 степени уникальных возможных сочетаний?
Видимо, все таки, эти детекторы должны как-то генерироваться в процессе обучения?
И еще. Похоже, такая сеть учится распознавать изображения определенного размера, не вижу механизма масштабирования. Собачка в углу кадра и собака крупно?
Видимо, все таки, эти детекторы должны как-то генерироваться в процессе обучения?
Так и есть. Никто не прописывает веса вручную, все веса вычисляются на основе примеров алгоритмами, подобными градиентному спуску.
Похоже, такая сеть учится распознавать изображения определенного размера, не вижу механизма масштабирования.
Некоторые сети — да. Но распознавание разных масштабов можно добавить предобработкой или чем-то вроде inception-слоёв.
Картинка кажется относительно нормальной, когда вы смотрите на неё в перевёрнутом виде, поскольку человеческая зрительная система привыкла видеть глаза и рты в таком положении
Признаться жутко мне стало от этого фото в первую долю секунды в любом виде)
Sign up to leave a comment.
Как компьютеры научились потрясающе хорошо распознавать изображения