Pull to refresh
14
0
Савелий @Safreliy

Программист-математик

Send message

Вообще вот интересный метод: GiffCF - ребята сделали диффузию при помощи уравнения теплопроводности в первом приближении, выглядит интересно. Её менее изощренной предтечей была DiffRec, основанная на обычном добавлении гауссова шума в матрицу, но всё равно интересно поразбираться.

И насчёт вашей научной статьи - было бы круто глянуть)

Спасибо за статью, это очень важный класс рекомендательных систем. Ещё хотелось бы почитать про диффузии на графах, которые относительно неплохо себя показывают и соревнуются с трансформерными моделями по качеству и скорости работы.

Вовсе не удивительно, что на основе аппроксимационной теоремы Колмогорова можно строить такие же функции в виде сетей, как и в случае MLP. MLP в свою очередь обосновываются аппроксимационной теоремой Хехта-Нильсена (и её обобщением на класс измеримых функций, данным Алексеевым).

Как в случае MLP, так и в случае KAN у нас доказывается сходимость представленной структуры в пространстве измеримых функций, но ничего не говорится об их оптимальности. По всей видимости это в принципе очень трудная проблема, сравнимая с задачами тысячелетия. Всё сравнивается с эффективностью на конкретных задачах, но не производится никаких обобщений. Таким образом мы просто метаемся от одного представления к другому, так и не исследовав глубокие морфологические свойства подобных разложений, не поняв структуру созданных сетей и то, как же всё-таки сопоставить классы всевозможных сетей с классами всевозможных функций, чем бы они не являлись.

Благодарю за найденную опечатку - поправил.

Безусловно важно следить за чистотой языка, но на вашем месте я бы больше внимания обращал на содержательную часть статьи и оставлял комментарии по теме. И да, помимо "диванной футурологии" в статье тоже много чего имеется. Почитайте, советую)

Хотел оставить мнение на следующие статьи из цикла, когда уже будет широкое понимание существующих технологий, но вкратце и тут можно поразмышлять) Достаточно взглянуть на модель One-2-3-45++, которая уже способна генерировать 3D-модели приемлемого качества по одной лишь фотографии объекта. И что самое интересное, её невозможно рассматривать обособленно от текущего контекста, поскольку она использует и CLIP, и Stable Diffusion и прочие современные подходы, чтобы достичь такого качества.

Вообще всё идёт к тому, что 3D-модели будут создаваться по щелчку пальца, как сейчас происходит с иллюстрациями. Это в свою очередь упростит создание игр, мультфильмов, аниматиков, контента для AR/VR. Также такое глубокое понимание концепта 3D-объектов может в последствии помочь в робототехнике и создании ПО для беспилотников (и мы наконец преодолеем этот барьер, существующий между нашим миром и бурно развивающимся миром нейросетей).

Ещё я мечтаю увидеть момент, когда мы научимся генерировать настраиваемые видеоролики большой продолжительности в приемлемом качестве. Кажется, что и здесь не обойтись без внедрения 3D-нейросетей в процессы генерации. Есть ещё такая штука, называется VQGAN-3D, так вот, там за третье измерение берётся время, а не глубина, и выходит так, что 2D-анимации она генерит неплохо, а вот с 3D уже происходят коллапсы на хоть сколько-нибудь длинных дистанциях. То есть надо шагать дальше в VQGAN-4D? Думаю это сейчас одно из самых перспективных направлений - давать нейросетям больше информации о нашем мире, давать им понимание, какое есть у нас, а не вывозить за счёт эвристик. Конечно, здесь есть ограничения по производительности, но мы всегда с этим что-нибудь придумываем)

Полностью согласен с вами! Но есть проблема - базовой модели, которая удовлетворяла бы всем поставленным бизнес-задачам на проекте изначально не существовало. Т.е. по сути мы и разработали базовую модель, основанную на новом принципе. По ML-метрикам:

  • косинусное расстояние для энкодера на тесте = 0.258 (рандом даёт 1)

  • MSE для декодера = 0.281 (вектора единичные, поэтому рандом также даёт единицу)

Information

Rating
Does not participate
Location
Обнинск, Калужская обл., Россия
Date of birth
Registered
Activity