Как стать автором
Обновить

Научпоп

Сначала показывать
Порог рейтинга
Уровень сложности

Жребий брошен: оптимальная генерация распределений и алгоритм Кнута-Яо

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.8K

Задача
Три айтишника — Маша, Вася и Петя — пошли в поход. После ужина они решают, кто будет мыть посуду. Петя дежурит один, а Маша с Васей — вдвоём. Значит, нужно выбрать Петю с вероятностью ⅓, а Машу с Васей — с вероятностью ⅔. Под рукой — только честная монетка. Как с её помощью устроить такой жребий?

Когда мы обсуждали эту задачу со студентами, они предложили такой способ. Бросим монету дважды: если выпали два орла — дежурит Петя; если один орёл и одна решка — Маша с Васей; если две решки — перебрасываем

Чтобы выбрать дежурного так, в среднем уходит 8⁄3 броска (чуть позже мы это докажем). Можно ли сделать это быстрее? Существует ли алгоритм, для которого ожидаемое число бросков меньше?

Оказывается, можно придумать простой, но неочевидный метод, позволяющий смоделировать событие с вероятностью ⅓ — и в среднем требует не больше двух бросков. Он называется алгоритмом Кнута–Яо

В этой статье мы пройдём весь путь к этому алгоритму. Начнём с базовых методов, поймем, сколько бросков они требуют в среднем, и найдём границу, быстрее которой не может работать никакой алгоритм. А затем построим тот, который этой границы достигает — оптимальный для вероятности ⅓

В финале мы обобщим эту идею: научимся моделировать любую вероятность p от 0 до 1 — и любое дискретное распределение. Заодно познакомимся с важным понятием, называемым энтропией

А в самом конце, как всегда — красивая задача

Читать далее

Карты Tenstorrent для DIY-сервера с локальной LLM

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров8.3K

В апреле 2025 года компания Tenstorrent начала принимать заказы на PCIe-карты Blackhole и Wormhole (на фото). Ускорители TPU на открытой архитектуре RISC-V с 28−32 ГБ видеопамяти предназначены непосредственно для разработчиков, которые желают запускать LLM на домашнем ПК или небольшом DIY-сервере. Это реальная альтернатива в сегменте, где пока доминирует Nvidia.

Во главе Tenstorrent стоит легендарный инженер Джим Келлер, ветеран Intel и AMD, создатель микроархитектуры AMD Zen и соавтор x86-64.

Благодаря радикальной открытости своих решений Tenstorrent уже привлекла небольшую армию фанатов среди LLM-энтузиастов.

Читать далее

Gaunt Sloth — Open Source AI CLI утилита

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров826

Прошло довольно много времени с тех пор, как я в последний раз что-либо публиковал на Хабре, около 10 лет или около того, и сегодня настал день, чтобы поделиться своим небольшим Open Source проектом.

Проект под названием Gaunt Sloth Assistant — это CLI-клиент для ИИ (AI), созданный на TypeScript (LangChain.js), распространяемый через npm и работающий в Linux, Windows и Mac. Пользователь полностью контролирует промпты, и рекомендуется формировать свои собственные системные промпты, но у него также есть и стандартный.

основные команды:

- Review PR 42 сверяя с требованиями из issue 12 gth pr 42 12
- Review local diff git --no-pager diff | gth review
- Interactive chat gth chat (filesystem read access)
- Interactive code gth code (filesystem write access)

Читать далее

Рений в электронике: патентный анализ

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров932

Рений — исключительно редкий элемент периодической системы Менделеева. Если построить пирамиду, по сторонам которой расположить элементы в порядке убывания их содержания в земной коре, то рений будет находиться в ее вершине. Кларковое содержание рения составляет семь на десять в минус восьмой степени процентов, что обусловливает необходимость большой степени концентрирования его при осуществлении технологических операций и выбор селективных материалов для этого. Тем не менее, этот редкий элемент все-таки используют во многих отраслях, в том числе при производстве электроники. Об этом и, разумеется, патентном аспекте мы сегодня и поговорим. 

Читать далее

Эти 7 книг сдвинули мои проекты с мертвой точки

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров40K

Я долго разбирался со своими двумя проектами: блогом и контент-командой, и наконец, почувствовал, что поставил их на ноги.

Что это значит? Это значит, что у меня есть прогнозируемый план развития проектов.

Я собрал книги, которые дали мне инсайты по управлению людьми, маркетингу, помогли разобраться с процессами. Сейчас расскажу про книжки, которые мне в этом помогли, расскажу, что я из них взял.

Читать далее

Чистый чил: как сделать так, чтобы тебя не трогали по рабочим вопросам в отпуске

Время на прочтение3 мин
Количество просмотров18K

Сезон отпусков в самом разгаре, но вместо долгожданного чила в гамаке ты получаешь в мессенджере: "Я знаю, что ты в отпуске, но можешь пожалуйста, посмотреть..."

В этой статье поделюсь принципами, которые позволяют спокойно уйти в отпуск - без стресса для себя и команды.

Читать далее

Про полезный спорт-физкультуру, с позиции науки

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров8.5K

Определю что такое физкультура на 2025 год - это вообще любое физическое упражнение, любой тренажёр, которые не вредят здоровью, а наоборот полезны здоровью и реабилитации. Так же физкультура ни в коем случае не про достижение неких результатов, скажем 100 отжиманий за раз или с 200 кг на штанге приседать или от груди пихать. У физкультуры нет вообще никакой цели в плане некоего числа килограммов, метров, выпадов и чего угодно. Физкультура это банальная жизнь, что бы как можно медленнее от возраста деградировало тело. Это моё определение, выведенное на основе житейског8о опыта.

Физкультура может быть в виде гантелей на бицепс, байдарки на озере, велосипеда с покатушками где угодно и скажем тренажёр для гребли и тренажёр блочный для спины.

Теперь про важнейший фактор - сердцебиение при физкультуре. https://cyberleninka.ru/article/n/kontrol-chastoty-serdechnyh-sokrascheniy-dlya-povysheniya-rezultatov-na-dlinnyh-distantsiyah/viewer - тут надо внимательно следить и лучший современный способ - либо хорошие смарт-часы, либо спец-пульсометр. ОСОБЕННО СЛЕДИТЕ ЗА ПУЛЬСОМ В БАССЕЙНЕ. Объясняю - вода намного плотнее воздуха, мы 99.9% времени не ходим внутри воды, а ходим сквозь воздух. А многие норовят сразу нырнякнуть и дать брасом 2 раза по 25 метров, мол смотрите - какой я удалец. Неа, это резкий рывок сердцебиения, можно прям в бассейне и ласты склеить.

Вот средняя таблица с зонами пульса. Если брать крайние значения - профессиональные бегуны, пловцы, велосипедисты - у них пульс может быть в покое 35 - 50, это не то что бы норма, это профессиональная адаптация и это не есть хорошо, обычно проф-спротсмены долго не живут.

Читать далее

Как я собираю AI-интервьюера, чтобы имитировать собеседования

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров5.3K

Несколько месяцев назад я поймал себя на мысли: я знаю свою профессию, читаю статьи, работаю в команде — но сто́ит заговорить о собеседованиях, появляется напряжение. Да, я не один такой: стресс, туманные ожидания от интервьюеров, неочевидные слабые места в знаниях. Решил попробовать подойти к подготовке иначе — с помощью AI. Ну все сейчас хотят ко всяким GPT по разным нуждам.

Читать далее

Как собеседовать не идеальных

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров21K

Собеседования — как очередь в муниципальной больнице: все там были, но мало кто потом вспоминает с теплом.

Кто-то берет «100 каверзных вопросов для собеседования» из интернета, кто-то топит за знание фреймворков, кто-то спрашивает разницу между интерфейсом и абстрактным классом. А потом начинается:

А что начинается?

Укрощение установщика ZB3245TSS

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров1.6K

Самый популярный SMD-установщик на AliExpress. История о тернистой любви со счастливым концом: дебри переписки с заводом, простор для модернизации и почему не стоит покупать через Али.

Читать далее

5 идей для повышения эффективности производства

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.8K

Для повышения эффективности управления производством часто предлагают ввести жёсткий контроль за каждым работником, сократить количество перекуров и повысить уровень дисциплины. Однако сотрудники — не бездушные механизмы, которые могут постоянно поддерживать одинаковый уровень производительности. Подобное отношение к людям может привести к их переутомлению и эмоциональному выгоранию. В результате они потеряют мотивацию и желание хорошо выполнять свою работу.

Тогда какие действия можно предпринять, что добиться той самой эффективности?

Мы убеждены, что минимизация человеческого фактора и автоматизация бизнес‑процессов — лучшее решение для повышения эффективности производства и работы предприятия в целом.

Читать далее

Автоматизация Telegram-канала с помощью ChatGPT и Aiogram — просто о сложном

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров7.1K

Привет, Хабр! Это мой первый пост и решил я его посвятить тому: Как можно автоматизировать ведение своего ТГ канала с помощью ИИ. На мой взгляд тема довольно свежая и интересная, а что самое главное полезная. Статья по большей мере ориентирована на новичков у которых имеются базовые знания python, но это не означает что другим она не будет интересна. Итак, начнем!

Читать далее

Камера за 1000 руб, в которой есть всё

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров47K

В обзоре уличная WIFI камера, которую я купил на авось, всего за 1000* рублей с маркетплейса с доставкой из Китая.

Читать далее

Ближайшие события

Запускаем MIPI DSI экраны от смартфонов. Разработка схемы основной платы. Часть 2. Система питания

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров3.5K

Даже на небольшой плате может понадобиться несколько напряжений.

Как будем питать плату? Сколько потребляют разные экраны? Какие топологии преобразователей выбрать?

В данной части рассмотрим эти и другие вопросы. Спроектируем систему питания и станем ещё на шаг ближе к завершению разработки схемы основной платы!

Полетели! :)

Как мы построили свой инструмент для работы с LLM

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3K

Привет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и распознавания речи.

В этой статье я бы хотел рассказать про наш инструмент для тренировки языковых моделей, который шесть лет назад родился из простого набора скриптов. Но постепенно усложняяcь, он стал включать в себя функции разметки данных, фильтрации датасетов, генерации данных и тестирования. В какой-то момент инструмент стал настолько функциональный, что я решил сделать ему красивый UI и назвать его - Data Studio.

Итак, что же такое Data Studio ?

Data Studio — это инструмент для работы с задачами обработки естественного языка (NLP), который мы используем в основном для улучшения качества перевода текста.

С помощью Data Studio можно обучать модели перевода, настраивать различные параметры для этих тренировок, токенизировать данные, фильтровать их по различным параметрам, собирать метрики, создавать данные для обучения, тестирования и валидации и многое другое.

Общий процесс создания языковой модели для перевода выглядит так:

1) Предобработка данных: этап подготовки данных перед обучением модели.

2) Фильтрация с использованием структурных и семантических фильтров.

3) Сбор общего набора данных: удаление избыточности, равномерное распределение тем и длин, сортировка.

4) Тегирование для классификации данных.

5) Загрузка общего набора данных в Data Studio для проверки.

6) Создание данных для валидации и тестирования модели.

7) Обучение модели.

Читать далее

Это не должно быть страшно: как не-хоррор-игры пугают сильнее ужастиков

Время на прочтение7 мин
Количество просмотров10K

Хоррор-игры прямо обещают нам: будет страшно. Мы ожидаем мрачную музыку, гнетущую атмосферу, опасности за углом. За это мы их и любим. Однако подлинное ощущение ужаса часто настигает там, где его никто не ждал, — в играх, созданных вовсе не для этого. Детские платформеры, фэнтезийные квесты, мирные симуляторы жизни, RPG. Они внезапно дарят опыт тревоги, ломают доверие к игровому миру и порождают глубоко личный страх. Что делает эти моменты по-настоящему пугающими? Почему, казалось бы, безобидные игры запоминаются криповыми сценами сильнее, чем жанровые ужастики? Это явление заслуживает отдельного разбора. Присоединяйтесь.
Читать дальше →

Стимуляция восстановления спинного мозга

Время на прочтение14 мин
Количество просмотров869


Организм человека — это удивительный механизм, обладающий множеством функций. Однако далеко не все в нем идеально. Многие травмы или заболевания приводят к повреждениям, которые не поддаются заживлению ввиду ограниченной регенерации. К таким травмам относится повреждение спинного мозга, что часто приводит к потере двигательных функций. Вылечить это невозможно, но технологии могут это изменить. Ученые из Оклендского университета (Новая Зеландия) разработали имплант, передающий слабые электрические токи непосредственно в поврежденные спинной мозг, тем самым имитируя естественные сигналы развития, регулирующие рост, деление и дифференцировку клеток, что способствует заживлению. Из чего сделан данный имплант, как именно он работает, и насколько он эффективен? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →

Ребалансировка инвестиционного портфеля с помощью Python и библиотеки okama

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.7K

Ребалансировка инвестиционного портфеля позволяет контролировать риск и не давать ему отклоняться от заданных параметров. Кроме того, при правильном подходе ребалансировка приносит "избыточную доходность".

Читать далее

У нас есть ERP! Разве этого недостаточно для автоматизации бизнес-процессов?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K

Если задать вопрос искусственному интеллекту “зачем нужна ERP-система” мы получим следующий ответ:  

«ERP‑система нужна для упрощения, автоматизации и эффективного управления бизнес‑процессами в организации. Она собирает важные данные в одном месте, чтобы их анализировать и решать задачи бизнеса.»

В ERP-системах также есть специальные модули для управления складскими запасами, производством, закупками, финансами, продажами и другими аспектами деятельности компании. Каждый модуль необходимо адаптировать под конкретные потребности предприятия, поэтому ERP-проекты не заканчиваются годами, а бюджет растёт на глазах. Обновлять такую систему практически невозможно, поскольку она сильно изменена под задачи бизнеса. 

А есть ли смысл внедрять все эти модули или проще воспользоваться специализированными решениями? 

Наша команда часто работает с заказчиками, которые находятся в начале пути внедрения ERP-системы, и еще чаще — с теми, кто занимается этим уже много лет.

Представители первой группы заказчиков полны энтузиазма, они говорят рекламными слоганами интеграторов ERP-систем, рассказывают о быстрых сроках внедрения и широких возможностях системы, которые закроют все их задачи. 

А что говорят опытные пользователи ERP? Часто они жалуются на то, что функциональность системы недостаточна для решения поставленных задач, в системе хаос, много ошибок из-за ручного ввода данных в систему. Система не подходит для оперативного планирования производства, поскольку перестройка плана занимает часы, и когда план построен, он автоматически становится актуальным и т.д.. Самое главное, что говорят опытные пользователи, — если бы можно было начать проект заново, они бы выбрали максимально коробочное  решение и использовали систему как инструмент учета и источника данных для других систем в ИТ-инфраструктуре компании. 

Читать далее

Сравнение двух СнК одного тех. процесса с точки зрения инференса нейронных сетей

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров722

Несколько лет назад у меня на прошлой работе состоялась интересная дискуссия с коллегой из отделения микроэлектроники. Его посыл заключался в том, что производительность в инференсе нейронных сетей на GPGPU от NVIDIA превосходит наше решение в связи с использованием более продвинутого тех. процесса, более высоких тактовых частот и из-за большей площади кристалла. Как программист, я не мог с этим согласиться, но на тот момент ни у кого не было времени и желания проверить эту гипотезу.

Недавно в разговоре с уже нынешними коллегами мне вспомнилась эта дискуссия и я решил довести это до конца. Для этого был подобран ближайший аналог от NVIDIA с точки зрения микроэлектроники: фабрика, тех.процесс, площадь кристалла и потребляемая мощность. В результате была выбрана видеокарта GT730 и произведено сравнение с устройством NM Card от НТЦ Модуль.

Читать далее