Генерация изображений с помощью ИИ – процесс, который требует вычислительных ресурсов и энергии. В основе многих популярных генераторов лежат диффузионные модели – алгоритмы машинного обучения, которые постепенно добавляют шум к изображениям, а затем учатся обращать этот процесс вспять, создавая новые картинки из хаоса.

Исследователи предлагают радикально иной подход – использовать не цифровой, а природный шум. Речь о термодинамических вычислениях, где случайные тепловые колебания в физических системах становятся основой для низкоэнергетических операций. По оценкам ученых, такой метод может оказаться в 10 миллиардов раз эффективнее с точки зрения энергозатрат на создание случайности, чем традиционные цифровые псевдослучайные генераторы.

“Эта работа предполагает, что возможно создавать аппаратное обеспечение для определе��ных типов машинного обучения – в данном случае генерации изображений – с существенно более низкими энергозатратами, чем сейчас”, – говорит Стивен Уайтлем, сотрудник Национальной лаборатории Лоуренса в Беркли.

Концепция уже обретает физические очертания. Стартап Normal Computing создал прототип чипа, состоящий из восьми резонаторов, соединенных особыми муфтами. Программируя связи между ними, можно создать “калькулятор” для конкретной задачи. Затем система приводится в движение, а естественные тепловые колебания вносят в нее случайность, выполняя вычисления. В состоянии равновесия конфигурация резонаторов и представляет собой ответ.

В статье, опубликованной в Nature Communications, Уайтлем и его коллега показали, что можно создать термодинамический аналог нейронной сети. Это закладывает основу для генерации изображений на подобных компьютерах.

Предложенная стратегия выглядит так: термодинамической системе “показывают” набор изображений. Затем системе позволяют деградировать естественным путем – случайные взаимодействия между ее компонентами приводят к состоянию равновесия. Далее вычисляется вероятность того, что система с заданными параметрами связей сможет обратить процесс деградации вспять. После этого значения связей настраиваются для максимизации этой вероятности.

В симуляциях, результаты которых опубликованы 20 января в Physical Review Letters, этот процесс обучения позволил получить настройки, при которых термодинамический компьютер смог генерировать изображения рукописных цифр. И все это – без энергоемких цифровых нейронных сетей и генераторов псевдослучайного шума.

Уайтлем, однако, отмечает, что термодинамические компьютеры пока находятся в зачаточном состоянии по сравнению с цифровыми аналогами. “Мы еще не знаем, как спроектировать термодинамический компьютер, который был бы так же хорош в генерации изображений, как, скажем, Dall-E. Необходимо еще разобраться, как создать для этого железо”, – подчеркивает ученый.

Хотя теоретически потенциал экономии энергии колоссален, на практике все сложнее. “Будет непросто построить термодинамический компьютер, который сможет воспользоваться всем этим преимуществом. Вероятно, ближайшие разработки будут представлять собой нечто среднее между этим идеалом и текущими цифровыми уровнями потребления”, – заключает исследователь.


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Источник.