
Байесовский подход применен к А/Б-тесту конверсий с 3 группами. Лучшая группа выбирается сравнением апостериорных распределений. Способ применим для других метрик и большего количества вариантов.
Байесовский подход применен к А/Б-тесту конверсий с 3 группами. Лучшая группа выбирается сравнением апостериорных распределений. Способ применим для других метрик и большего количества вариантов.
«Кто был тот ювелир,
что, бровь не хмуря,
нанес в миниатюре
на них тот мир,
что сводит нас с ума,
берет нас в клещи……»
Иосиф Бродский «Бабочка»
Решение сделать татуировку требует не только эстетического выбора, но и анализа медицинских рисков. В этой статье мы рассмотрим, почему научных данных о долгосрочных последствиях тату так мало. Как управлять уже существующими рисками. И какие системные изменения в обществе необходимы. Этой статьей я не аккумулирую весь информационный багаж по данной теме. Я стараюсь дополнить наиболее громкие высказывания популярных ораторов, завершить картину внезапно нашедшимся затерянным пазлом.
Примечание: наткнулся на свой старый текст, написанный давно, более 10 лет назад. В общем а почему бы и не пост.
%user%, добро пожаловать в матрицу, Сервер: \Земля, OS Sansara v1.0
Итак, вы обычный юзер, с ограниченными полномочиями. Игр нет, ресурсы ограничены, сетевое время ограничено и дисконнект может произойти в любой момент. Вас это не устраивает и начав ковыряться в папках своего профиля в одной из директорий вы находите странные файлы. Мануалы гласят, что есть возможность поднять свои привилегии в системе вплоть до административных, обрести свободу действий и даже перенести профиль на гораздо более лучшие севера с дружелюбными операционками. Становится ясно, что Sansara не фонтан и надо выбирать как это сделать сообразно своим способностям.
Итак, основные пути следующие:
Иудаизм. В свое время вы входили в одну их первых групп пользователей на сервере и совмещали с основными обязанностями еще и функции секретаря. За это сисадмин выдал дополнительные ништяки, которых больше ни у кого не было, а именно возможность печатать на принтере. Выбирая этот путь, не надо заниматься никаким хакерством и мучать систему, сосредотачиваемся на социальной инженериии максимально используем принтер и бумажный документооборот. Пишем служебную записку в юр. отдел, директору и копию в ИТ-отдел о том, что вас угнетают другие юзеры, сисадмин вас позабыл, вы не можете исполнять свои должностные обязанности и не забудьте напомнить, что вы еще и секретарь, у вас доп. нагрузка и вообще. Делаем это каждый день. В какой-то момент начальство, что-бы не болела голова таки даст сисадмину поручение добавить вам полномочий. Минус: сисадмин может проверить чем вы реально занимаетесь и если вы отлыниваете, то устроит профилю холокост.
Как превратить скучные слайды в интерактивную демонстрацию, где код можно запускать прямо на месте? В этой статье попробуем перенести презентацию в браузер, а затем — в «блокнот». Интерактивные среды, такие как Jupyter Notebook, Observable, Mathematica, WLJS Notebook, позволяют создавать живые презентации, лекции и наглядные материалы для коллег или студентов. Они незаменимы и для визуализации моделей, симуляций и любых данных.
Под катом — примеры, пошаговый разбор и демо вживую.
Гипотезы становятся концепциями, идеи — планами, а мечты — реальностью особенно быстро, когда речь идёт об искусственном интеллекте. Сезон «Будущее здесь» на Хабре стал лабораторией ближнего будущего, где ИИ — больше чем просто инструмент. Он превращается в собеседника, помощника, зеркало, в котором наши ценности, страхи и надежды сначала отражаются, а затем обретают самостоятельную жизнь.
Участники сезона принесли десятки версий завтрашнего дня: одни — в виде рассказов, другие — как инженерные концепции и технологические прогнозы. Вместе с ВТБ мы подводим итоги — и выбираем идеи, готовые воплотиться в жизнь.
Уже в ближайшем будущем сеть будет наполнена ИИ агентами. Персональные агенты, агенты компаний, государств… Скорей всего уже через пару лет почти у всех нас будут как минимум поодному своему агенту, как сейчас у нас есть профили в соцсетях.
Как понять кому принадлежит агент, с которым ты или твой агент сейчас собираетесь взаимодействовать? Можно ли ему доверять? Не фейк ли это? Брать ли трубку или заказывать ли на этом сайте билеты?
Агент ID — это что‑то вроде телефонного номера, но более сложное, так как поведение определяется многими параметрами — промптом, базой знаний и моделью. Изменение любого из них приведет к изменению поведения агента. Можно рассматривать это как версию определенной программы, она как бы та же, но немного иная. По мнению авторов, каждая такая версия заслуживает своего ID.
Как фильтры стиля и настроения меняют рейтинг LM Arena
Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами.
Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control, который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента.
Что такое LM Arena и зачем она нужна
Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench).
На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.
Привет, на связи Андрей Шведов, руководитель проектов ГРАН Груп!
Разработчики электроники стремятся сделать свой проект с минимальным количеством вопросов и доработок со стороны производителя. Служба качества всегда хочет получить минимальный уровень брака. Сотрудникам монтажного производства хотелось бы видеть оптимизацию под линию монтажа для достижения максимальной производительности. А вопросы минимизации стоимости печатных плат и сокращения сроков поставки всегда крайне важны для компании в целом. Но как возможно отвечать всем этим требованиям одновременно?
Всего этого можно добиться, соблюдая набор принципов концепции DFM (англ. design for manufacturing) – "проектирование с учетом производства". Она имеет довольно простой смысл: задуманные в проекте решения следует реализовывать, учитывая особенности технологических процессов и возможности производств.
Следуя принципам DFM, вы получаете надежные и соответствующие функциональным характеристикам печатные платы, поставленные в срок, с минимальным риском дефектов и по оптимальной стоимости.
Цель нашей статьи – показать, что соблюдая простые рекомендации и имея представление о "популярных" ошибках, можно заметно сэкономить время.
Ручная проверка модулей контроля питания отнимала 4 часа на устройство. Я собрал стенд на Python, сократив время до 75 минут на 5 устройств. В статье: как превратить неттоп в мозг системы, избежать «фейерверков» из реле и заставить операторов пить кофе вместо того чтобы работать!
Однако продвинутый темброблок с пассивными фильтрами способен облагородить и разнообразить звук даже самого дешёвого китайского клона культовых американских EMG.
Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA в Лаборатории ИИ РСХБ-Интех. В этой статье я и архитектор нашей платформы Александр Рындин @aryndin9999расскажем о том, как мы построили взаимодействие Платформы ИИ и Озера данных для работы с витринами данных моделей машинного обучения с использованием Spark.
Началось все с простого эксперимента на кухне. Мы никак не могли найти качественные зожные питательные батончики — в магазинах была одна пальмовая печаль. Тогда мы решили сделать их сами из фиников и орехов с рынка.
Я занимаюсь разработкой SilentPatch, исправляющего ошибки старых игр серии GTA и других игр. В issue tracker проекта на GitHub я получил недавно очень специфичный отчёт о баге:
Самолёта Skimmer нет в Windows 11 24H2
Когда я обновил Windows до версии 24H2, самолёт Skimmer полностью пропал из игры. Его невозможно создать с помощью трейнера или найти на обычных точках спауна. Я играю и в версию с модами (которая до обновления Windows была абсолютно нормальной), и в «ванильную» с единственным установленным silentpatch (я пробовал версии silentpatch за 2018 год, 2020 год и самую новую). Самолёт всё равно не спаунится в игре.
Если бы я услышал о подобном впервые, то посчитал бы сомнительным и заподозрил, что дело может быть в чём-то другом, а не конкретно в Windows 11 24H2. Однако на GTAForums я получал комментарии точно о такой же проблеме с ноября прошлого года. Некоторые из пользователей винили в ней SilentPatch, однако другие говорили, что то же самое происходит и в игре без модов:
Очевидно, Skimmer не может заспауниться при игре в Windows 11 24h2; надеюсь, этот баг устранят.
Дополнение: кажется, я подтвердил это — создал виртуальную машину с Windows 11 23h2, и этот чёртов самолёт замечательно спаунится; апдейт той же виртуальной машины до 24h2 ломает Skimmer. Остаётся только догадываться, почему небольшое обновление операционной системы в 2024 году ломает какой-то левый самолёт в игре 2005 года.
После нового обновления Silent patch из игры пропадает Skimmer, а когда я пытаюсь создать его с помощью RZL-Trainer или Cheat Menu пользователя Grinch, игра зависает и приходится закрывать её через Диспетчер задач.
[…] Я был вынужден обновиться до 24H2, и после апдейта у меня возникла та же проблема со Skimmer в GTA SA, что и у остальных. Это значит, что проблему вызывают не моды или что-то другое: она возникла после свежего обновления Windows.
Современные литиевые батареи легко выходят из строя при повреждениях — вплоть до возгорания. Для решения этой проблемы ученые из США и Гонконга разработали гибкий аккумулятор, который можно сгибать, резать и прокалывать без потери работоспособности. Эта технология может стать ключевой для носимой электроники, мягких роботов и медицинских имплантатов. Ниже расскажу, что это вообще такое и какие перспективы открывает изобретение.
Помните самое начало 2000-х, когда салоны связи были завалены телефонами всех форматов и цветов? А на стойках были специальные обвесы-брелочки для всех категорий самовыражения. Сегодня перепутать смартфоны на занятии или на рабочей встрече проще простого, они все… одинаковые (особенно со стороны, где нет логотипа). А вы давно пробовали во время прогулки насчитать 10 жёлтых автомобилей? Да, мир теряет цвет, но вместе с этим он теряет дизайн. Нет, конечно, современные формы и смыслы требуют своего дизайна и талантливые ребята создают что-то невероятное. Тем не менее, с прилавков «крафтовых» магазинчиков разлетаются открытки в винтажном и ретро-стиле, мы ожидаем интересные обложки любимых книг, тяготеем к комиксам и обложкам старого винила. И думается, что это не просто ностальгия в глаз попала, а запрос на человеческое, глубокое, — на то, откуда мы до сих пор черпаем идеи и вдохновение.
В рамках поддержки номинации Технотекста «Дизайн» (тут стоит побороться), в которую можно податься аж до 5 мая (эта же «акция» работает для «Аналитики», а остальной конкурс закрыт) предлагаю вам ненадолго провалиться в прокрастинацию и переместиться в первую половину XX века.
23.04.2025, Эван Гоф, universetoday.com
В какой-то ранний момент истории Земли набор все более сложных химических веществ проделал новый трюк. Они, с помощью толчка энергии, каким-то образом трансформировались в энергопроизводящую и самовоспроизводящуюся клетку. Время этого критического момента в истории Земли скрыто за течением миллиардов лет.
Наука обнаружила доказательства жизни 4,2 миллиарда лет назад, всего лишь через 250 миллионов лет после образования планеты.
AI-агенты трансформируют индустрии — от чат-ботов в службе поддержки до продвинутых ассистентов для программирования. Однако, чтобы они действительно были эффективными и заслуживающими доверия, необходимо их тщательное тестирование. Строгая процедура тестирования и оценки позволяет оценить производительность агента, адаптивность к новым сценариям и соответствие требованиям безопасности.
В этой статье изложены структурированные шаги для тестирования и оценки AI-агентов с точки зрения надежности, устойчивости к сбоям и общего воздействия.