У DeepMind есть новая система искусственного интеллекта, которая пишет код — не только для создания приложений, но и для решения математических задач, оптимизации собственного оборудования Google и даже для ускорения обучения таких же моделей искусственного интеллекта, как она сама. Она называется AlphaEvolve, и, возможно, это самая рекурсивная вещь, которую когда-либо создавал Google.

AlphaEvolve сочетает в себе творческую гибкость больших языковых моделей Gemini с безжалостной эволюционной петлёй и автоматизированной оценкой. В результате получается агент для программирования, который совершенствуется сам и системы, на которых он работает, с каждым поколением.

AlphaEvolve уже выполняет реальную работу по всей империи Google. Он нашёл более эффективную эвристику планирования для Borg — системы, которая управляет вычислениями в центрах обработки данных, — и восстановил в среднем 0,7% ресурсов, которые в противном случае простаивали бы. Он также предложил улучшения аппаратного уровня для схем TPU, ускорил ядра умножения матриц на 23% (сократив время обучения Gemini на 1%) и сократил время работы моделей Transformer на 32,5% за счёт оптимизации кода, сгенерированного компилятором, что редко удается даже опытным инженерам.
В отличие от своего предшественника AlphaTensor, который был создан для поиска более быстрых алгоритмов умножения матриц, AlphaEvolve — это универсальный инструмент. Он работает с любыми задачами, которые можно «автоматизировать»: математические ограничения, комбинаторные структуры, эвристические алгоритмы поиска или низкоуровневый код, который нужно ускорить. Он использует определяемую пользователем программу и функцию оценки, затем итеративно видоизменяет, оценивает и развивает ее, используя набор моделей Gemini Pro и Gemini Flash. Представьте, что это оптимизатор кода с турбонаддувом и обратной связью, который на самом деле понимает, что он пытается улучшить.
В ходе внутренних тестов AlphaEvolve улучшил результаты по 14 бенчмаркам умножения матриц, в том числе по давней нерешённой задаче 1969 года, и добился прогресса в более чем 20% из 50 с лишним нерешённых математических задач, на которых он был протестирован. Один из самых впечатляющих? Он нашёл новую нижнюю границу для числа «поцелуев» в 11 измерениях — головоломку в области геометрии, которая на протяжении веков ставила математиков в тупик.
Именно сочетание символического мышления и конкретной проверки отличает AlphaEvolve от других. В то время как многие агенты на основе LLM по-прежнему выдают полуправдоподобные решения, система DeepMind может фактически запускать написанный ею код, оценивать результаты и вносить изменения в зависимости от производительности. Возможность применять этот цикл в разных областях — от упаковки кругов до планирования центров обработки данных — намекает на универсальную новую парадигму для прикладных исследований в области ИИ.
AlphaEvolve также полезен в рекурсивном смысле: он оптимизирует Gemini, на котором работает AlphaEvolve. Несмотря на то, что результаты пока скромные, они указывают на цикл обратной связи, в котором ИИ помогает создавать более совершенный ИИ быстрее. DeepMind делает ставку на то, что эта структура — эволюция кода в ответ на прямую количественную обратную связь — может масштабироваться и, возможно, даже стать основой научных открытий.
Следующий шаг — открыть его. DeepMind заявляет, что создаёт пользовательский интерфейс и запускает программу раннего доступа для избранных академических исследователей. Хотя точных сроков публичного релиза пока нет, цель ясна: ИИ-помощник, который может генерировать идеи, реализовывать их в виде кода и доказывать, что они работают, — и всё это со скоростью машины.
Или, как выразился DeepMind: «AlphaEvolve подходит для любой задачи, решение которой можно описать в виде алгоритма и автоматически проверить». Другими словами, это не просто автоматизация ответов. Это развитие самих вопросов, которые мы можем задавать.