Как стать автором
Обновить

Научпоп

Сначала показывать
Порог рейтинга
Уровень сложности

Байесовские А/Б-тесты: множественные сравнения

Время на прочтение4 мин
Количество просмотров229

Байесовский подход применен к А/Б-тесту конверсий с 3 группами. Лучшая группа выбирается сравнением апостериорных распределений. Способ применим для других метрик и большего количества вариантов.

Читать

Новости

Часть 3. Обзор технологий RAG для LLM: оптимизация извлеченных данных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров337

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь) Во этой, третьей части авторы совсем кратенько разбирают технологии оптимизации извлеченных данных.

Читать далее

Татуировка, управление рисками и эффект бабочки

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров664

«Кто был тот ювелир,
что, бровь не хмуря,
нанес в миниатюре

на них тот мир,
что сводит нас с ума,
берет нас в клещи……»

Иосиф Бродский «Бабочка»

Решение сделать татуировку требует не только эстетического выбора, но и анализа медицинских рисков. В этой статье мы рассмотрим, почему научных данных о долгосрочных последствиях тату так мало. Как управлять уже существующими рисками. И какие системные изменения в обществе необходимы. Этой статьей я не аккумулирую весь информационный багаж по данной теме. Я стараюсь дополнить наиболее громкие высказывания популярных ораторов, завершить картину внезапно нашедшимся затерянным пазлом.

Читать далее

Достижения освобождения ИТ-шным языком

Время на прочтение3 мин
Количество просмотров529

Примечание: наткнулся на свой старый текст, написанный давно, более 10 лет назад. В общем а почему бы и не пост.

%user%, добро пожаловать в матрицу, Сервер: \Земля, OS Sansara v1.0
Итак, вы обычный юзер, с ограниченными полномочиями. Игр нет, ресурсы ограничены, сетевое время ограничено и дисконнект может произойти в любой момент. Вас это не устраивает и начав ковыряться в папках своего профиля в одной из директорий вы находите странные файлы. Мануалы гласят, что есть возможность поднять свои привилегии в системе вплоть до административных, обрести свободу действий и даже перенести профиль на гораздо более лучшие севера с дружелюбными операционками. Становится ясно, что Sansara не фонтан и надо выбирать как это сделать сообразно своим способностям.

Итак, основные пути следующие:

Иудаизм. В свое время вы входили в одну их первых групп пользователей на сервере и совмещали с основными обязанностями еще и функции секретаря. За это сисадмин выдал дополнительные ништяки, которых больше ни у кого не было, а именно возможность печатать на принтере. Выбирая этот путь, не надо заниматься никаким хакерством и мучать систему, сосредотачиваемся на социальной инженериии максимально используем принтер и бумажный документооборот. Пишем служебную записку в юр. отдел, директору и копию в ИТ-отдел о том, что вас угнетают другие юзеры, сисадмин вас позабыл, вы не можете исполнять свои должностные обязанности и не забудьте напомнить, что вы еще и секретарь, у вас доп. нагрузка и вообще. Делаем это каждый день. В какой-то момент начальство, что-бы не болела голова таки даст сисадмину поручение добавить вам полномочий. Минус: сисадмин может проверить чем вы реально занимаетесь и если вы отлыниваете, то устроит профилю холокост.

Читать далее

Markdown презентации по-новому: контроллер Nintendo, интерактивный блокнот и немного магии

Уровень сложностиПростой
Время на прочтение38 мин
Количество просмотров878

Как превратить скучные слайды в интерактивную демонстрацию, где код можно запускать прямо на месте? В этой статье попробуем перенести презентацию в браузер, а затем — в «блокнот». Интерактивные среды, такие как Jupyter Notebook, Observable, Mathematica, WLJS Notebook, позволяют создавать живые презентации, лекции и наглядные материалы для коллег или студентов. Они незаменимы и для визуализации моделей, симуляций и любых данных.

Под катом — примеры, пошаговый разбор и демо вживую.

Читать далее

Мечтать, чтобы строить: как прошёл сезон «Будущее здесь»

Время на прочтение8 мин
Количество просмотров293

Гипотезы становятся концепциями, идеи — планами, а мечты — реальностью особенно быстро, когда речь идёт об искусственном интеллекте. Сезон «Будущее здесь» на Хабре стал лабораторией ближнего будущего, где ИИ — больше чем просто инструмент. Он превращается в собеседника, помощника, зеркало, в котором наши ценности, страхи и надежды сначала отражаются, а затем обретают самостоятельную жизнь.

Участники сезона принесли десятки версий завтрашнего дня: одни — в виде рассказов, другие — как инженерные концепции и технологические прогнозы. Вместе с ВТБ мы подводим итоги — и выбираем идеи, готовые воплотиться в жизнь.

Читать далее

Жесткий контроль над ИИ агентами как инструмент для массовой слежки

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров571

Уже в ближайшем будущем сеть будет наполнена ИИ агентами. Персональные агенты, агенты компаний, государств… Скорей всего уже через пару лет почти у всех нас будут как минимум поодному своему агенту, как сейчас у нас есть профили в соцсетях.

Как понять кому принадлежит агент, с которым ты или твой агент сейчас собираетесь взаимодействовать? Можно ли ему доверять? Не фейк ли это? Брать ли трубку или заказывать ли на этом сайте билеты?

Агент ID — это что‑то вроде телефонного номера, но более сложное, так как поведение определяется многими параметрами — промптом, базой знаний и моделью. Изменение любого из них приведет к изменению поведения агента. Можно рассматривать это как версию определенной программы, она как бы та же, но немного иная. По мнению авторов, каждая такая версия заслуживает своего ID.

Читать далее

От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров326

Как фильтры стиля и настроения меняют рейтинг LM Arena

Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами.

Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control, который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента.

Что такое LM Arena и зачем она нужна

Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench).

На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.

Читать далее

Как оптимально проектировать печатные платы

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров2.6K

Привет, на связи Андрей Шведов, руководитель проектов ГРАН Груп!

Разработчики электроники стремятся сделать свой проект с минимальным количеством вопросов и доработок со стороны производителя. Служба качества всегда хочет получить минимальный уровень брака. Сотрудникам монтажного производства хотелось бы видеть оптимизацию под линию монтажа для достижения максимальной производительности. А вопросы минимизации стоимости печатных плат и сокращения сроков поставки всегда крайне важны для компании в целом. Но как возможно отвечать всем этим требованиям одновременно?

Всего этого можно добиться, соблюдая набор принципов концепции DFM (англ. design for manufacturing) – "проектирование с учетом производства". Она имеет довольно простой смысл: задуманные в проекте решения следует реализовывать, учитывая особенности технологических процессов и возможности производств.

Следуя принципам DFM, вы получаете надежные и соответствующие функциональным характеристикам печатные платы, поставленные в срок, с минимальным риском дефектов и по оптимальной стоимости.

Цель нашей статьи – показать, что соблюдая простые рекомендации и имея представление о "популярных" ошибках, можно заметно сэкономить время.

Читать далее

Как Factorio соблазнила Кремниевую долину (и меня)

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.4K

Персонаж игры Factorio, разработанной чешской компанией Wube Software, совершил аварийную посадку на чужую планету. Его задача — построить ракету для побега. Для этого ему потребуется единолично воссоздать промышленную революцию, от разбивания камней для создания грубых каменных печей до перегонки нефти в ракетное топливо. Играя однажды, я установил насос на побережье озера, чтобы подавать воду на свой бетонный завод, и тут до меня дошло, что я много часов не пил воду в реальном мире. У меня болела голова, но я не хотел вставать из-за компьютера. Мне хотелось решить проблему щелчком мыши, как я делаю это в игре, проложив несколько метров трубопровода от кухонного крана к моей сгорбившейся фигуре (и, возможно, ещё несколько метров от моего тела до туалета).

Раньше меня увлекали многие игры, но лишь некоторые полностью подавляли мою волю, моё ощущение времени, да и все остальные зоны мозга, не занимающиеся строительством фабрики. Однако по стандартам Factorio я всё равно остаюсь обычным нубом. Два моих друга однажды устроили 24-часовую игровую сессию лишь с одним трёхчасовым перерывом на сон. Серьёзные игроки очень часто не выходят из игры в течение многих тысяч часов.

Эта игра, продавшаяся за последние восемь лет тиражом в четыре миллиона копий и недавно выпустившая первое расширение, за свою аддиктивность была прозвана «Крэкторио». Всё это ещё более примечательно потому, что Factorio практически не пытается увлечь игрока. Игровой процесс суров и беспокоен, графика как будто устарела на двадцать лет, за попытки срезать углы тебя всегда в позже наказывают, а если хочешь идеально освоить её, то хотя бы часть времени приходится тратить на вычисление коэффициентов.
Читать дальше →

Часть 1. Как я производство автоматизировал: от «я всё делаю руками» к «система уже всё сделала»

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.6K

Ручная проверка модулей контроля питания отнимала 4 часа на устройство. Я собрал стенд на Python, сократив время до 75 минут на 5 устройств. В статье: как превратить неттоп в мозг системы, избежать «фейерверков» из реле и заставить операторов пить кофе вместо того чтобы работать!

Раскрыть секреты магии

Настоящие пассивные EMG HZ и китайские активные звукосниматели

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K


Привет, Хабр! Хамбакеры со встроенным предусилителем чаще всего не позволяют сделать отсечку катушки и предоставляют всего одно звучание, которое многие считают недостаточно выразительным.

Однако продвинутый темброблок с пассивными фильтрами способен облагородить и разнообразить звук даже самого дешёвого китайского клона культовых американских EMG.

Может ли замена звукоснимателей улучшить дешёвую электрогитару? — Мой опыт показывает, что да. Причём датчики для этого не обязаны быть дорогими, хотя последние мы тоже сейчас послушаем.
Читать дальше →

Секреты Spark в Arenadata Hadoop: как мы ускорили построение витрин для задач ML

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров329

Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA в Лаборатории ИИ РСХБ-Интех. В этой статье я и архитектор нашей платформы Александр Рындин @aryndin9999расскажем о том, как мы построили взаимодействие Платформы ИИ и Озера данных для работы с витринами данных моделей машинного обучения с использованием Spark.

Читать далее

Ближайшие события

Как я делаю 500 млн рублей в год на перемолотых фруктах на маркетплейсах

Время на прочтение10 мин
Количество просмотров18K

Началось все с простого эксперимента на кухне. Мы никак не могли найти качественные зожные питательные батончики — в магазинах была одна пальмовая печаль. Тогда мы решили сделать их сами из фиников и орехов с рынка.

Читать далее

Как 20-летний баг GTA San Andreas всплыл в Windows 11 24H2

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров7.6K

Я занимаюсь разработкой SilentPatch, исправляющего ошибки старых игр серии GTA и других игр. В issue tracker проекта на GitHub я получил недавно очень специфичный отчёт о баге:

Самолёта Skimmer нет в Windows 11 24H2

Когда я обновил Windows до версии 24H2, самолёт Skimmer полностью пропал из игры. Его невозможно создать с помощью трейнера или найти на обычных точках спауна. Я играю и в версию с модами (которая до обновления Windows была абсолютно нормальной), и в «ванильную» с единственным установленным silentpatch (я пробовал версии silentpatch за 2018 год, 2020 год и самую новую). Самолёт всё равно не спаунится в игре.

Если бы я услышал о подобном впервые, то посчитал бы сомнительным и заподозрил, что дело может быть в чём-то другом, а не конкретно в Windows 11 24H2. Однако на GTAForums я получал комментарии точно о такой же проблеме с ноября прошлого года. Некоторые из пользователей винили в ней SilentPatch, однако другие говорили, что то же самое происходит и в игре без модов:

Очевидно, Skimmer не может заспауниться при игре в Windows 11 24h2; надеюсь, этот баг устранят.

Дополнение: кажется, я подтвердил это — создал виртуальную машину с Windows 11 23h2, и этот чёртов самолёт замечательно спаунится; апдейт той же виртуальной машины до 24h2 ломает Skimmer. Остаётся только догадываться, почему небольшое обновление операционной системы в 2024 году ломает какой-то левый самолёт в игре 2005 года.

После нового обновления Silent patch из игры пропадает Skimmer, а когда я пытаюсь создать его с помощью RZL-Trainer или Cheat Menu пользователя Grinch, игра зависает и приходится закрывать её через Диспетчер задач.

[…] Я был вынужден обновиться до 24H2, и после апдейта у меня возникла та же проблема со Skimmer в GTA SA, что и у остальных. Это значит, что проблему вызывают не моды или что-то другое: она возникла после свежего обновления Windows.

Читать далее

«Несломленная»: батарея, которая работает даже если ее проколоть

Время на прочтение4 мин
Количество просмотров773

Современные литиевые батареи легко выходят из строя при повреждениях — вплоть до возгорания. Для решения этой проблемы ученые из США и Гонконга разработали гибкий аккумулятор, который можно сгибать, резать и прокалывать без потери работоспособности. Эта технология может стать ключевой для носимой электроники, мягких роботов и медицинских имплантатов. Ниже расскажу, что это вообще такое и какие перспективы открывает изобретение.

Читать далее

Тестируем новые модели o3 и o4-mini от OpenAI

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров2.6K

Привет! На связи Кирилл Филипенко, сисадмин в Selectel. Недавно OpenAI анонсировала два новых поколения моделей — o3 и o4-mini, которые стали частью линейки o-series. В статье разбираемся, за счет чего они получились мощнее, насколько дешевле обойдется их использование и какие кейсы стоит обязательно протестировать уже сегодня. В OpenAI уверены, что эти образцы задают новую планку того, каким должен быть AI-ассистент. Так ли это? Проверим под катом.
Читать дальше →

Графический дизайн, который был первым и стал легендарным

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.1K

Помните самое начало 2000-х, когда салоны связи были завалены телефонами всех форматов и цветов? А на стойках были специальные обвесы-брелочки для всех категорий самовыражения. Сегодня перепутать смартфоны на занятии или на рабочей встрече проще простого, они все… одинаковые (особенно со стороны, где нет логотипа). А вы давно пробовали во время прогулки насчитать 10 жёлтых автомобилей? Да, мир теряет цвет, но вместе с этим он теряет дизайн. Нет, конечно, современные формы и смыслы требуют своего дизайна и талантливые ребята создают что-то невероятное. Тем не менее, с прилавков «крафтовых» магазинчиков разлетаются открытки в винтажном и ретро-стиле, мы ожидаем интересные обложки любимых книг, тяготеем к комиксам и обложкам старого винила. И думается, что это не просто ностальгия в глаз попала, а запрос на человеческое, глубокое, — на то, откуда мы до сих пор черпаем идеи и вдохновение.

В рамках поддержки номинации Технотекста «Дизайн» (тут стоит побороться), в которую можно податься аж до 5 мая (эта же «акция» работает для «Аналитики», а остальной конкурс закрыт) предлагаю вам ненадолго провалиться в прокрастинацию и переместиться в первую половину XX века.

Читать далее

Зарождение жизни на Земле в любом случае не заняло много времени

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров7.1K

23.04.2025, Эван Гоф, universetoday.com

В какой-то ранний момент истории Земли набор все более сложных химических веществ проделал новый трюк. Они, с помощью толчка энергии, каким-то образом трансформировались в энергопроизводящую и самовоспроизводящуюся клетку. Время этого критического момента в истории Земли скрыто за течением миллиардов лет.

Наука обнаружила доказательства жизни 4,2 миллиарда лет назад, всего лишь через 250 миллионов лет после образования планеты.

Читать далее

Как тестировать AI-агентов, чтобы не было больно

Время на прочтение9 мин
Количество просмотров615

AI-агенты трансформируют индустрии — от чат-ботов в службе поддержки до продвинутых ассистентов для программирования. Однако, чтобы они действительно были эффективными и заслуживающими доверия, необходимо их тщательное тестирование. Строгая процедура тестирования и оценки позволяет оценить производительность агента, адаптивность к новым сценариям и соответствие требованиям безопасности.

В этой статье изложены структурированные шаги для тестирования и оценки AI-агентов с точки зрения надежности, устойчивости к сбоям и общего воздействия.

Читать далее
1
23 ...