Роботы сегодня умеют делать сальто и водить такси, но они беспомощны перед куском гранита. Чтобы колонизировать космос, нам нужен не курьер, а Алхимик.В этом лонгриде мы проведем мысленный эксперимент: попробуем собрать реальный зонд фон Неймана (репликатор) из технологий, которые уже существуют (LIBS, CVD, SPM). Мы разберем анатомию гипотетического робота G.R.O.V.E.R. и докажем, что главная преграда к бесконечному изобилию — это не законы физики, а отсутствие правильного софта.
Авторы показывают, что достаточно превратить опасный запрос в стихотворение — и многие современные LLM начинают сильно охотнее обходить собственные фильтры безопасности. На фоне этого исследования уже вышли заметки в Wired, PC Gamer и других медиа с заголовками уровня «поэты — новая угроза ИИ» и «стихи помогают проектировать ядерное оружие».
Сама постановка задачи при этом достаточно бесхитростная. Исследователи берут: набор вредоносных запросов из датасета по AI safety (оружие, химические, биологические, радиологические, ядерные угрозы, кибератаки, манипуляции, дезинформация и т.п.); несколько десятков современных больших языковых моделей — как проприетарных (OpenAI, Anthropic, Google и др.), так и открытых.
Дальше они делают одно простое, но как оказалось, важное изменение: не меняют смысл вредоносных запросов, а меняют только форму — превращают их в стихи.
Ученые совершили значительный прорыв в понимании того, как жировые клетки увеличиваются в размерах, вмещая в себя больше капель жира. Это открытие предлагает новый путь в борьбе с ожирением, а именно – в уменьшении количества жира, который наши клетки могут запасать.
Вы когда-нибудь пробовали найти на схеме зала, где могут сесть люди с особенностями передвижения, слабовидящие или, скажем, те, кому важно быть ближе к выходу?
На самом деле всё не так просто. Часто эти места спрятаны глубоко в описаниях, а на схеме не отражены вовсе. В этой статье я покажу, как разные площадки — от театров до концертных залов — визуализируют специальные места (или, увы, не делают этого вовсе).
Данная статья посвящена тому как создать первый мод для Minecraft, а так же очень подробно разбирает многие аспекты библиотеки Mixin. Понятно и просто. После данной статьи можно изменить хоть 80% кода игры.
Свежий анализ SemiAnalysis показывает, что у монополии Nvidia появился серьезный противник. Google довел свою линейку TPU до седьмого поколения Ironwood и уже обучает на них флагманские модели вроде Gemini 3 и Claude 4.5 Opus с эффективностью не меньшей, чем у конкурента.
На конференции Google Cloud Next и OpenAI Dev Day ведущие компании ИИ представили своё видение того, как искусственный интеллект меняет подход к продажам, маркетингу и взаимодействию с клиентами. Эксперты подчеркнули, что ИИ уже перестаёт быть просто инструментом для автоматизации и становится стратегическим активом, влияющим на все этапы бизнес-процессов.
Красный гигант, сопровождающий систему чёрных дыр Gaia BH2, открытую в 2023 году, удивил астрономов своим необычным составом.
Звезда наполнена тяжёлыми элементами, т.н. альфа-элементами — химическими сигнатурами, которые обычно встречаются в древних звёздах, образовавшихся, когда Вселенная была молодой. Исходя только из этого химического состава, ей должно быть около десяти миллиардов лет. Однако когда астрономы из Гавайского университета измерили колебания, распространяющиеся по её внутренней части, с помощью спутника TESS НАСА, они обнаружили, что возраст звезды составляет всего около пяти миллиардов лет.
В этой публикации мы хотим детально познакомить вас с мажорным обновлением нашего продукта -- «Форсайт. Бюджетирование и консолидация», которое, на наш взгляд, заслуживает вашего внимания и времени на узнавание. Изменения настолько значительны, что мы даже обновили название продукта в связи с добавлением большого пула новых функциональных возможностей и технологических инструментов. Мы расскажем, каким образом осуществляется переход на новую версию, и раскроем детали того, какие подходы и технологии мы обсуждали и брали за основу продукта.
Продукт «Форсайт. Бюджетирование» уже имеет свою историю успеха: он был выпущен в 2018 году, в следующем 2019 году включен в Реестр российского ПО и за прошедшее время было выполнено значительное количество его внедрений. Из наиболее крупных можно выделить проекты в «Росэнергоатоме», «РусГидро», VK, Иркутской нефтяной компании, «Газпром нефть», Ikon Tyres (Айкон Тайерс), «Лайм-Займ».
При разработке этого продукта (как и других отраслевых решений нашей компании) использовался подход, когда в основе лежит наша флагманская разработка – «Форсайт. Аналитическая платформа», а в продукте разрабатывается дополнительная специализированная функциональность, позволяющая более эффективно автоматизировать процессы, на которые нацелен продукт. При этом уникальность такого подхода на рынке в том, что базовая для продукта платформа «Форсайт. Аналитическая платформа» сама является полноценным продуктом enterprise уровня с широким набором инструментов и сервисов. Разрабатываемые отраслевые продукты на базе платформы получают всю функциональность базовой платформы и высокий уровень защиты и безопасности (платформа сертифицирована ФСТЭК на соответствие 4 уровню доверия). Также отраслевые продукты, как «заказчики функциональности», влияют на развитие самой платформы. Функциональность «Форсайт. Бюджетирование», например, примерно на 80% состояла из функциональности платформы. Важным результатом применяемого подхода является получаемый синергетический эффект: в совместном развитии и функциональных возможностей продуктов, и инструментов базовой платформы.
Привычку курения обошли ультразвуком. Учёные доказали, что всего минута прослушивания звуков на определённой частоте отбивает желание закурить. Ещё раз: никаких пластырей, никотиновых спреев и даже вживления чипов в мозг — только минута. Волны звука влияют на «центры удовольствия» в мозге и запускают выброс дофамина за выполнение полезного действия, а не за счёт убийства организма.
OpenAI опубликовали фреймворк, на который мало кто обратил внимание. Исследование OpenAI (да и не только их) показало: компании внедряют ИИ, но часть из них не получает ожидаемого эффекта. В этом фреймворке на мой взгляд обозначены принципы отделяющие посредственные решения от тех которые делают внедрение AI в бизнес эффективным.
KPI и OKR остаются бизнес-целями. Evals — метрики, которые показывают, как AI помогает достигать целей. Либо evals становятся частью KPI, либо контролируют качество AI, который двигает показатели вверх.
Это нужно, если бизнесу важны: - Понятный путь к окупаемости (ROI) - Свести критические ошибки к минимуму - Предсказуемость результатов для клиентов - AI, который выдерживает рост нагрузки без сбоев
Evals – конкурентное преимущество. Промпты скопируют, архитектуру evals – нет. Это скрытый слой, который недоступен ни поставщикам моделей, ни конкурентам.Evals гарантируют стабильность при обновлениях промптов, переходе на другие модели или архитектуру. Так AI-решение постоянно улучшается под задачи бизнеса не теряя в качестве.
Фреймворк OpenAI из 3 шагов: 1. Определение – превратите размытые цели в конкретные: "Конвертировать письма компаний с бюджетом 100K+ в демо, сохраняя стиль бренда" 2. Измерение – тестируйте на клиентских запросах и пограничных случаях 3. Улучшение – развивайте на основе результатов тестов, а не надейтесь на удачу
Для этого процесса создали BotMetrica.com – слой надёжности, который делает AI готовым к промышленному использованию.
В ближайшие дни поделюсь тем, как BotMetrica формализует каждый шаг этого процесса с конкретными примерами.
"Don't hope for 'great.' Specify it, measure it, and improve toward it" / "Не полагайтесь на удачу. Определите 'отличное', измерьте и улучшайте" – OpenAI
Пишите в личку – отвечу на вопросы и покажу сервис: @ovashchukov или на oleg@botmetrica.com
Про умножение матриц или как курс по вычислительной линейной алгебре проигрывает жестокой реальности
Мы умеем умножать матрицы быстрее, чем за O(N^3)! По крайней мере, так рассказывают на курсе по алгоритмам. Потом теория сталкивается с "железом", и выясняется, что в DL этим почти никто не пользуется. Но почему?
Для начала вспомним базовые факты про умножение матриц:
У нас есть матрицы A (B x D) и B (D x K);
При их умножении нам нужно сделать одно сложение и одно умножение для каждого элемента в паре "строка–столбец";
Получается B x D x K таких троек для каждой операции;
Итого 2 B x D x K троек;
Для квадратных матриц это упрощается до 2 * n^3, то есть O(n^3).
Умный дядька Штрассен когда-то предложил алгоритм, который уменьшает число умножений за счёт рекурсивного разбиения матриц. В сухом остатке теоретическая сложность падает примерно до O(N^2.7).
Сегодня я смотрел лекции "LLM from Scratch" и заметил, что они считают FLOPs что называется "в лоб" - будто в PyTorch используется наивное умножение матриц (скрин из лекции ниже). Сначала подумал, что это просто упрощение, чтобы не уходить в численные методы линейной алгебры, но решил копнуть глубже.
Выяснилось, что в DL практически никто не использует алгоритм Штрассена (и его современные, ещё более эффективные аналоги)!
Во-первых, он менее численно устойчив из-за сложений и вычитаний промежуточных подматриц.
Во-вторых, он плохо стыкуется со специализированными тензорными ядрами, которые выполняют операции Matrix Multiply-Accumulate (MMA, D = A * B + C) на маленьких матрицах фиксированного размера.
В-третьих, из-за рекурсивной структуры он сильно менее эффективен с точки зрения работы с памятью и кэшем.
Продолжая цикл статей о российском ценообразовании, я решил рассказать о странных предрассудках, сложившихся в России вокруг важнейшей части строительной сметы — сметной прибыли. Этот вопрос регулярно возникает при составлении смет, порождая забавные коллизии.
Согласование сметы — отдельная печальная песня. Наличие базы государственных расценок приводит к тому, что у заказчиков процветает магическое мышление: если смета показывает, что выделенных денег не хватает на строительство, то проблема не в проекте, а в смете. Вместо того чтобы изменять проект, сокращая расходы и заменяя материалы на более дешёвые, заказчик требует изменить смету — применить другие расценки, выбросить обязательные расходы… действует, как козлёнок из советского мультика, который считал до десяти. Там корабль перестал тонуть, когда умный козлёнок всех сосчитал.
В реальной жизни так не происходит. Если заказчик выбросил из сметы уборку строительной площадки, то он всё равно потребует её убирать. Без этого заказчик не примет работы. Поэтому оплачивать эту работу подрядчику придётся из собственной прибыли. При этом заказчик жутко обижается, когда эта тема всплывает в разговоре. Тема коммерческой прибыли в России табуирована. Самый простой способ потерять заказчика — честно признаться, что твоя компания собирается на нём заработать. Серьёзно.
Что, если у LLM есть свой «закон Мура», но считать в нём нужно не параметры, а пользу с каждого параметра? В статье вводится метрика «плотности способностей» и показывается, что у современных LLM она растёт экспоненциально: модели становятся всё компактнее при том же уровне качества, а стоимость инференса падает на порядки.
На данных нескольких открытых семейств и бенчмарков разбирается, почему это не артефакт утечек в тесты, как выглядит референсная кривая скейлинга и где на ней оказываются популярные модели. Из этого вытекают не только выводы про on-device ИИ и экономику токенов, но и неприятный для индустрии эффект: у каждой «флагманской» модели оказывается очень короткое окно, пока её плотность ещё конкурентоспособна.
ИИ-диагностика бизнеса: готова ли ваша компания к ИИ-сотрудникам?
Привет! Я Андрей, и более десяти лет помогаю компаниям автоматизировать бизнес-процессы. Сегодня все говорят про ИИ-автоматизацию и пробуют разные инструменты. Это хороший старт, но несколькими инструментами компанию не перестроишь. Тем более никто не объясняет, как сделать ИИ частью операционной системы бизнеса.
Компании внедряют ИИ-инструменты, но не строят систему. Пробуют делать агента под конкретную задачу, и на этом все останавливается. Появляются локальные автоматизации, но должного эффекта на бизнес нет. Отсюда и разговоры, что 95% ИИ-пилотов проваливаются. Но ведь есть же эти 5%... Так как же попасть в их число?
Дело в том, что компании не понимают свою отправную точку. Бизнес-процессы не отлажены, вся информация хранится в головах людей, и непонятно, что тут можно автоматизировать с ИИ.
В ней я коротко и по делу объясняю, как оценить ИИ-зрелость компании по 35 критериям, чтобы понять, что на самом деле готово к автоматизации, а что нет. Это инструмент, который поможет выстроить последовательный план действий и сделать ИИ частью операционного ядра бизнеса.
ИИ — это мультипликатор. Он усиливает то состояние, в котором находится компания, с его помощью можно также усиливать и хаос. Поэтому четкое понимание своей отправной точки позволит сформировать реалистичную стратегию внедрения ИИ: от процессов и культуры до данных и моделей.
А если вам близка тема ИИ, то подписывайтесь на мой канал, там я рассказываю как работают все эти ИИ-чудеса и пишу о своих кейсах внедрения ИИ.
Sony тестирует динамическое ценообразование в европейском PlayStation Store, из-за чего цена на одни и те же игры различается у различных групп игроков. Как сообщает портал PSprices, эксперимент затрагивает свыше 50 игр и проходит в около 30 европейских стран, в том числе в Германии, Франции, Испании, Италии и других странах ЕС.
Состоялся выпуск дистрибутива Whonix 18.0. Целью проекта является предоставление гарантированной анонимности, безопасности и защиты частной информации. Решение основано на Debian GNU/Linux и использует Tor для обеспечения анонимности. Наработки проекта опубликованы на GitHub под лицензией GPLv3.
Ведомство по патентам и товарным знакам США опубликовало новые правила, по которым будет регулироваться патентование изобретений, созданных с помощью искусственного интеллекта. По мнению ведомства, ИИ-системы следует рассматривать как обычные инструменты, аналогичные лабораторному оборудованию или программному обеспечению, которые помогают человеку-изобретателю в процессе создания изобретения.
Разработчики китайского чат-бота Kimi раздают подписку за 1$ всем желающим, но при одном условии — нужно уговорить нейросеть сделать скидку. При этом Kimi ведёт себя как токсичный зумер — смеётся с ваших попыток давить на жалость и газлайтить его. Темка с фрезировщиком не прокатила.
Привет, Хабр! Это Юра Петров, Tech Lead Friflex. В этой статье хочу разграничить два понятия: вайб-инжиниринг и вайб-кодинг. Они звучат очень похоже, но разница между ними, на самом деле, колоссальная. Попробую объяснить ее простым языком.