Свет считает быстрее: как работают фотонные вычисления и из какого «железа» они собраны / Habr

Сколько времени занимает сложение двух лучей света? Почти никакого: интерференция рождает результат сразу, пока лучи проходят через чип. В этой статье — без мистики и рекламных лозунгов — разберём, как свет выполняет линейную алгебру, из каких модулей собирают фотонные процессоры и где они уже уместны в реальных задачах. К концу чтения у вас будет ясная картинка тракта «источник → модулятор → оптическая решётка → детекторы» и чек-лист для первого PoC.

Часть 1. Как свет делает математику

Почти никакого времени на сложение. Два луча встретились — и результат "сложения" родился сразу, просто как рисунок интерференции. Ни тактов, ни зарядки-разрядки ёмкостей, ни очередей к памяти. Это и есть интонация фотонных вычислений: линейная алгебра происходит в пространстве, пока свет летит, а не ждёт своей очереди во времени.

Представьте короткий оптический тракт на кристалле. В начале — источник (лазер): он даёт нам ровный "световой ток", как идеальный генератор тактов в электронике. Рядом — модулятор: он превращает числа в свойства света — амплитуду или фазу. Иногда мы ещё раскрашиваем данные в разные "цвета" (длины волн), чтобы пустить много независимых потоков в одном и том же волноводе. Дальше — главное действие.

Сердце чипа — решётка интерферометров. Каждый крошечный блок (его часто называют MZI — интерферометр Маха-Цендера) берёт два световых канала, делит, сдвигает фазу и снова складывает. Выходит маленькая 2×2 линейная операция. Если такие кирпичики уложить аккуратной сеткой, они складываются в большую матрицу: y = Wx.

Мы просто настраиваем фазы — и чип реализует нужное линейное преобразование. Никакой магии: свет умеет складывать и вычитать амплитуды идеально параллельно, и это по природе линейно.

Где здесь "умножение"?

В интерференции. Когда два пути встречаются, их амплитуды складываются с учётом фазы — это и есть плюс-минус и весовые коэффициенты. Мы заранее выставили ручки, свет прошёл — и результат уже лежит на выходах. Дальше фотодетекторы превращают свет обратно в ток, АЦП оцифровывает — и готово.

Хочется аналогии? Представьте оркестр. Каждый MZI — это пара музыкантов, у которых мы чуть‑чуть поворачиваем ручку «громкость» и «фазу», добиваясь нужного аккорда. Сетка из сотен таких дуэтов играет вам целую матрицу. А мультиплекс по длинам волн (WDM) — это тот же оркестр, но на нескольких сценах одновременно: один и тот же партитурный план, только разными «цветами» света.

Три вещи, которые отличают учебник от заводского цеха

Во-первых, нелинейности и память. Нейросети живут не только матрицами, им нужны ReLU/GELU и хранение весов. Оптика — королева линейной части; нелинейности и память чаще остаются в CMOS рядом. Поэтому реальные системы сегодня гибридные: свет делает тяжёлую линейную работу, кремний — всё, что сложно и ветвится.

Во‑вторых, точность и шум. В идеальном мире фаза стоит, как влитая. В реальном — есть потери, паразитные связи между дорожками, дрейф из‑за температуры. Плюс АЦП в конце «откусывает» дискретную разрядность. Решение — автокалибровка. Чип периодически «подпевает сам себе»: меряет опорные паттерны, корректирует фазы, держит сетку в строю. Это не ритуал перед запуском, а фоновая привычка, как автоподстройка гитары у концертмейстера.

В‑третьих, параллелизм без пенальти. Электронике сложно наращивать ширину шин без тепла и задержек. Оптика спокойно везёт десятки потоков на разных длинах волн в одном волноводе, а расстояния внутри/между кристаллами для неё — почти бесплатные. Поэтому фотоника сильнее всего там, где "жмёт" пропускная способность, а не логика.

Если собрать всё в одну картинку, путь такой:

Тракт фотонного вычислителя: лазер (источник) → модулятор (кодирует числа в амплитуду/фазу; при необходимости — WDM) → решётка интерферометров (выполняет линейное преобразование y = W x) → фотодетекторы (считывают интенсивность) → АЦП (оцифровка) → CMOS-блок (нелинейности и память). Пунктирная петля — автокалибровка: подстройка фаз и компенсация температурного дрейфа. — **Тракт фотонного вычислителя:** лазер (источник) → модулятор *(кодирует числа в амплитуду/фазу; при необходимости — WDM)* → решётка интерферометров *(выполняет линейное преобразование* ***y = W x***) → фотодетекторы *(считывают интенсивность)* → АЦП *(оцифровка)* → CMOS-блок *(нелинейности и память)*. Пунктирная петля — **автокалибровка**: подстройка фаз и компенсация температурного дрейфа.

А если потоков много — подселим их на разные длины волн и пустим в ту же архитектуру.

Свет "считает" линейные преобразования, пока распространяется через сетку интерферометров; нелинейности и память чаще остаются в электронике. Сильная сторона фотоники — параллелизм и пропускная способность; слабое место — дрейф и разрядность, которые лечатся калибровкой и грамотной архитектурой.

Часть 2. Из чего это сделано: «железо» фотонных вычислений

Если матрица получается «на лету», то из каких деталей собран этот «оркестр света», и где в нём слабые места?

Представьте стол инженера. На нём — набор аккуратных кубиков. Из них и строится фотонный процессор. Секрет в том, что каждый кубик прост по отдельности, а магия появляется только в связке.

Платформа — на чём всё напечатано

Кремниевая фотоника (SOI). Базовый рабочий конь: компактно, дёшево, совместимо с массовым производством. Хорошо для логики и маршрутизации света.

Нитрид кремния (SiN). Очень малые потери — свет «бежит» дальше, полезно для фильтров и длинных трактов.

Ниобат лития (TFLN). Быстрые электрооптические модуляторы: когда нужна высокая полоса и точная амплитуда/фаза.

Фосфид индия (InP). Там, где нужны встроенные источники света (лазеры) или высокая оптическая мощность.

Посыл: платформа выбирается под задачу. Нужна скорость — тянемся к TFLN; нужна дальность и низкие потери — берём SiN; хотим «всё в одном корпусе» и массовость — SOI.

Источник света — «двигатель»

Лазер даёт стабильный «световой ток». Часто его выносят за пределы кристалла и подают через волокно: так проще охлаждать, обслуживать и менять. В сложных системах источников несколько — под разные «цвета» (длины волн), чтобы параллелить потоки.

Компромисс: стабилизация частоты и мощности. Лазер — живой элемент, ему нужен уход, как серверу — чистый воздух и питание без шума.

Модулятор — «цифры в свет»

Это преобразователь чисел в свойства света: амплитуду и фазу.

Термооптические. Простые и надёжные, но не самые быстрые: тепло разогревает микроучасток — меняется показатель преломления.

Электрооптические. Быстрее и точнее (особенно на ниобате лития): напряжение → немедленный фазовый сдвиг, можно гнать высокие скорости.

Компромисс: термо — проще, но инерционнее; электро — быстрее, но требовательнее к схеме питания и упаковке.

«Кирпичики» вычислений — где рождается матрица

Интерферометр Маха–Цендера (MZI). Два делителя света + две регулируемые фазы. Из таких 2×2-кирпичиков собирают сетку (mesh), которая и реализует y = Wx.

Сильные стороны: гибкость, можно синтезировать почти любую матрицу.
Компромиссы: много настраиваемых узлов → чувствительность к дрейфу, нужна автоматическая подстройка.

Микрокольцевые резонаторы. Компактные «фильтры»; хорошо дружат с мультиплексом по длинам волн (WDM), что позволяет обрабатывать сразу десятки потоков.

Сильные стороны: плотность и спектральная селективность.
Компромиссы: требуют очень точной термостабилизации; небольшое смещение — и настроенная «нота» ушла.

Вывод: MZI — универсальные и предсказуемые; кольца — более «плотные», но капризные. Часто их комбинируют.

Остальная инфраструктура

WDM-узлы — «многополосная трасса». Мультиплексоры и демультиплексоры собирают/разбирают десятки «цветов» в один волновод и обратно. Это главный инструмент «ширины шины» без лишних проводников.

Перекрёстки, делители, комбайнеры. Они не делают «математику», но позволяют аккуратно развести пути, раздать мощность, собрать каналы. Здесь важны низкие потери и предсказуемость.

Фотодетекторы — «свет обратно в ток». На выходе мы измеряем результат. Скорость и чувствительность детекторов определяют, как быстро можно читать матрицу и с какой «тонкостью» различать уровни.

ЦАП/АЦП — граница с «цифрой». Туда-сюда между числом и светом — основная цена гибридности. Именно здесь нередко «сидят» ватт-часы и требования к точности.

Правило: если игнорировать ЦАП/АЦП, легко переоценить выигрыш. Считать «конец-в-конец».

Системные вопросы

Упаковка и межсоединения. Co-packaged optics (оптика в одном корпусе с вычислителем) убирает длинные медные трассы и даёт терабитные скорости рядом с кристаллом. Для больших систем это часто «момент истины»: не столько ускоряем вычисления, сколько перестаём терять на дороге.

Тепло и устойчивость. Свет любит стабильность. Температура, вибрации, медленные уползания параметров — всё это лечится датчиками и фоновыми петлями калибровки. Хорошая система «подпевает себе» постоянно, тихо и незаметно для пользователя.

Надёжность и сервис. Лазеры изнашиваются, коннекторы требуют чистоты, кристаллы — повторной настройки после больших температурных изменений. План эксплуатации включает запасные модули, регламенты чистки и «скрипты» автокалибровки. Это не сложнее обычного дата-центра — просто другой набор привычек.

Фотонный вычислитель — это аккуратная сборка стандартных узлов: источник → модулятор → «кирпичики» интерференции → детекторы, вокруг — WDM и качественная упаковка. Выбор платформы и блоков — это баланс между скоростью, плотностью, стабильностью и ценой на границе цифры.

Часть 3. Что делать на практике: где фотоника уместна, как обучать и как переносить модели

Если оптика так хороша в линейной алгебре, как превратить это в реальный выигрыш в вашем проекте — без иллюзий и с прогнозируемым результатом?

Где это даёт эффект уже сегодня

Сценарий А — линейные слои нейросетей.
Большие матрицы (GEMM, внимание) — идеальная добыча для оптики. Практика: вырезаете «линейное сердце» модели (проекции, матрицы внимания, свёрточные ядра, сведённые к матрицам), отдаёте в фотонический блок, остальное оставляете в CMOS. Выигрыш приходит из параллелизма (в том числе WDM) и отсутствия «медных» ограничений внутри узла.

Сценарий B — межсоединения кристаллов и узлов.
Когда «горит» не ALU, а дорога между ними, сопакетированная оптика рядом с кристаллом снимает узкое место по полосе и ваттам на бит. Это не ускоритель вычислений, а ускоритель коммуникаций — но для LLM это часто определяющий фактор.

Сценарий C — потоковые и сигнальные задачи.
Резервуарные/спектральные схемы и оптические фильтры хорошо работают там, где важна скорость тракта и непрерывный поток (радар/лидар, телеком-фильтрация, аномалия в реальном времени).

Противопоказания: сильно разреженные вычисления, ветвящийся контрольный поток, строгие требования к высокой разрядности по всей цепочке.

Обучение «на свету»: варианты и здоровый прагматизм

Гибридный путь (базовый).
Обучаете модель электронно (GPU/TPU) с учётом будущих ограничений (квантование, шум), а в оптику прошиваете только линейные слои для инференса. Минимум риска, быстрый PoC.

In-situ обучение (когда хочется максимум близости к железу).
Возможны два класса подходов:

Двунаправленные схемы (аналог backprop): требуют дисциплины с нелинейностями и аккуратной метрологией, зато обновляют веса по месту.
Безобратные методы (forward-forward, feedback-alignment, резервуар): проще физически, хорошо ложатся на оптику, но меняют привычную методику обучения.

Практические советы:

Планируйте noise/quant-aware обучение: точность весов и измерений в оптике ниже «идеала», но предсказуема.
Разделяйте ответственность: оптика — линейная часть; нелинейности и нормализации — в электронике.
Держите короткую петлю калибровки во время обучения: дрейф — не баг, а свойство среды.

Хранение и перенос моделей между чипами

Как кодируются «веса»:

Фазы/амплитуды в интерферометрах/резонаторах (летучая настройка, быстрая перенастройка).
Материалы с фазовым переходом (PCM) как энергонезависимые уровни (мультибитные «синапсы» с ограниченной разрядностью).

Как переносить:
Экспортируете карту настроек (фазы, уровни PCM) и сопровождающую калибровочную информацию. На целевом чипе запускаете короткую процедуру ретаргетинга: компенсируете его индивидуальные вариации и фиксируете таблицу поправок. Итог — воспроизводимость без «ручной магии».

Как делать PoC: дорожная карта на одну страницу

Сегментация нагрузки. Профилируете модель и выделяете слои/операции, где линейка и трафик реально доминируют.
Целевые метрики. Определяете три числа «конец-в-конец»: точность (с учётом квантования/шума), латентность, энергия. Без них сравнение бессмысленно.
Границы цифро-аналоговой части. Сразу считаете бюджет ЦАП/АЦП, лазеров, термостабилизации. Это часть системы, а не «мелкий шрифт».
Калибровка и мониторинг. Заложите автокалибровку в рантайм, а не только в «настройку перед стартом». Планируйте телеметрию по дрейфу и деградации.
Интеграция со стеком. Нужен мост к вашему фреймворку (PyTorch/JAX), формат выгрузки/загрузки весов, тесты на эталонных датасетах.
Критерий успеха и откат. Фиксируете пороги «годится/не годится» и заранее прописываете путь назад (fallback на чисто электронный путь) — это снимет лишний технический риск.

Мини-чек-лист для первого PoC

☐ Доля линейной алгебры ≥ X% в профиле
☐ Целевая разрядность достижима с учётом шума
☐ Бюджет ЦАП/АЦП/лазеров/термо включён в энергию
☐ Есть автокалибровка и телеметрия
☐ Интеграция с фреймворком и тесты готовы
☐ Определены пороги успеха и сценарий отката

Применяйте оптику там, где её природные сильные стороны — параллельная линейная алгебра и пропускная способность — превращаются в измеримый выигрыш «конец-в-конец». Обучение «на свету» возможно, но целесообразно не всегда; переносимость решается формализованными картами весов и короткой калибровкой. Хороший PoC честно считает «всю систему», а не только красивую сердцевину из интерференции.

Заключение

Фотонные вычисления — это не замена GPU, а инструмент для конкретных узких мест: линейная алгебра и межсоединения. Свет естественным образом делает матричные операции через интерференцию, но требует грамотной инженерии на границах с электроникой.

Ключевые моменты:

Линейные операции — в оптике, нелинейности и память — в CMOS
Считайте энергию «конец-в-конец» с учётом ЦАП/АЦП
Автокалибровка — обязательная часть рантайма
Выбирайте задачи с большой долей линейной алгебры и параллелизмом

Фотоника уже работает в межсоединениях датацентров и начинает входить в ускорители ИИ. Следующие 2-3 года покажут, насколько далеко можно зайти в гибридных архитектурах. А пока — экспериментируйте с линейными слоями и честно считайте метрики.

Если у вас есть опыт работы с фотонными ускорителями или вопросы по конкретным применениям — пишите в комментариях, разберём детальнее.