Комментарии / Профиль makaedgar / Хабр

C++ бекендер. Путешествую, общаюсь и хожу в походы

Холодная эмиссия электронов — почему малоизвестна?

В университете делал диплом на сканирующем туннельном микроскопе, смотрели и обсчитывали распределение наночастиц палладия на графите (привет институту катализа в Академе).

Помню эпопею с иглами для зонда. Можно было было заказывать промышленные из-за границы, но втридорога и с месячной задержкой. Поэтому в лабе была отработали свою технологию нарезки игл - аккуратно острейшими кусачками надо было резать и одновременно оттягивать платиновую проволоку. У науча почти каждая игла получалась как надо, а у меня это каждый раз было тестирование на прямоту рук.

Но помню кайф, когда удавалось отрезать острую иглу с первого раза, и какие четкие атомы получались.

Заменяем лишние if-проверки на assert для инвариантов кода в C/C++

makaedgar 5 ноя 2025 в 08:00

В реальном проекте покрыть всю логику и все бранчи тестами нереально. Правильная деградация - это тоже часть логики программы, тогда как ассерт - это верный путь к UB на проде, и может быть ещё хуже. Для горячих мест окей, но много ли их реально?

А так, конечно, разработка ведётся также и на проде (в релизе). Пользователи присылают баг-репорты, а анализ логов и корок даёт много полезной инфы, причём в реальных юзкейсах. Чем не тестирование!

Мы не тестируем на животных

Заменяем лишние if-проверки на assert для инвариантов кода в C/C++

makaedgar 4 ноя 2025 в 23:14

К сожалению, аssert не спасет от разыменования nullptr в релизе. А в C++26 завезли контракты специально для этой цели.

Почему Fortran в 2025 году всё ещё остаётся «ракетой»

makaedgar 4 ноя 2025 в 23:04

Фортран жив по тем же причинам, что и Кобол: никто не хочет и/или не может переписывать существующий код, десятилетиями оттестированный и оптимизированный для вычислений. Да и зачем, если есть полная совместимость с C ABI? Написали врапперов для всех языков программирования и погнали. NumPy внутри дёргает Фортран. В стандартную библиотеку C++26 внесли библиотеку linalg, которая по сути биндинги для BLAS (как правило, фортрановского). Некий предел оптимизации алгоритмов уже достигнут, практической пользы от переписывания просто нет.

В научной среде Фортран сохраняется именно потому, что профы это те условные "деды", которые этот код и оптимизировали в 80х. Например, мой препод по вычислительной химии рекомендовал учить Фортран как самый важный язык для области. Так он и передается, по сути аспиранты находятся в заложниках ситуации, как, например, биоинформатики вынуждены учить R вместо Python.

YouTube начал блокировать семейные Premium-подписки, если их участники не проживают в одном доме

makaedgar 3 сен 2025 в 08:01

Недавно появился новый вид пописки именно для двух людей "Duo subscription plan", по цене 1.5 от одиночного. Все равно очень дорого, мне предлагает за 20 евро.

Нашу турецкую "семью" расформировали, теперь предлагают вместо 4 евро платить 23. Благо есть revanced.

Составлен рейтинг городов мира для «воркейшена» — удалённой работы и отдыха

makaedgar 24 авг 2025 в 23:00

Бывает еще публичный WiFi - технически проводной, но с точки зрения удаленщика другая важная категория.

Составлен рейтинг городов мира для «воркейшена» — удалённой работы и отдыха

makaedgar 23 авг 2025 в 22:16

Дико плюсую, даже если забыть про цены, плохо развитый сервис и коворкинги - тут с интернетом все грустно, даже с проводным и мобильным.

Список рандомно составлялся.

Сравнение уровня жизни в России и Германии с учетом расходов

makaedgar 9 дек 2024 в 08:12

На конфе общался с человеком, который переехал с женой в Гамбург, и работает фрилансером. Он пытался оформить страховку, но во всех ему просто отказали и он попал в правовой коллапс - без страховки нельзя, но как оформить не понятно.

Сравнение уровня жизни в России и Германии с учетом расходов

makaedgar 8 дек 2024 в 17:31

Страховка в Нидерландах обязательная и примерно одинакова для всех. Стоит 150 евро в месяц, плюс первые 385 евро в год платишь за свой счет. Дальше почти все бесплатно, вклю.чая таблетки и лекарства.

К сожалению, зубы в нее не входят, и выходят в копеечку. Местным норм, т.к. до 18 лет стоматология бесплатна и все успевают отходить в брекетах и сделать себе идеальные зубы.

Lasso, Ridge и кастомные регуляризаторы: основы

makaedgar 18 ноя 2024 в 14:43

Могу предложить следующее объяснение.

Пусть есть модель, которая параметризуется весами. В ходе обучения мы подбираем такие значения весов, которые наилучшим образом описывают входные данные. Таким образом, информация, содержащаяся во входных данных, перетекает в информацию, содержащуюся в весах. Если веса могут сохранить больше информации, чем содержится в исходных данных, то появляется вероятность переобучения. А именно: модель будет просто воспроизводить исходные данные вместо описания взаимосвязей. Простейший пример это фиттинг полинома N-й степени по N точкам, такую модель можно обучить всегда со стопроцентной точностью. Но на любой точке вне обучающей выборки она будет давать рандомный результат.

Как можно измерить информацию? Веса хранятся в памяти компьютера в виде байтов. Т.е., если байтов для весов выделенно много, возникает вероятность переобучения. Как решать эту проблему?

Во-первых, можно уменьшить количество весов. Меньше данных - меньше информации. Однако такая модель может недостаточно хорошо описывать сложные закономерности, например, кубическую функцию с 4 параметрами невозможно хорошо описать параболой из 3 параметров.

Во-вторых, можно уменьшить информацию в каждом отдельном весе. Чем больше число, тем больше байтов оно требует для хранения. И тут возникает идея регуляризации: давайте ограничим или введем штраф на размер весов, и тогда мы ограничим количество информации в них. При этом мы сохраняем возможность модели описывать сложные закономерности. Поэтому простейшие регуляризации L1 и L2 просто штрафуют за величину весов. Получается trade off в ходе обучения: оптимизатору выгодно частично запомнить данные, но не выгодно хранить слишком много информации. Итоговый результат с регуляризацией получается полезнее для объемной модели: она хорошо описывает сложные зависимости, но просто запомнить все не будет оптимальным.

Алгоритмы сортировки NumPy (и танцы, и мемы)

makaedgar 21 июл 2021 в 11:32

Худший случай тут не при чем. Существует несколько алгоритмов построения бинарной кучи. Способ, который вы описали в сообщении действительно работает за O(N log N). По сути мы наращиваем кучу: добавляем новый элемент в конец и выполняем для него процедуру sift_up (восстанавливаем кучу). На последнем шаге будет N/2 * log(N/2) сравнений, что уже ограничивает снизу сложность алгоритма.

Однако это не оптимальный способ, можно построить кучу быстрее за O(N). Так как массив эквивалентен бинарному дереву, нам нужно лишь сделать из этого дерева кучу. Вместо процедуры sift_up мы будем двигать элементы вниз с помощью процедуры sift_down, начиная с конца. Количество сравнений будет таково: N/2*0 + N/4*1 + ... + 1*log(N). Удивительно, но асимптотика суммы данного ряда будет линейной! Магия, да и только :)

Вот тут есть еще одно объяснение. Ну и не грех заглядывать на википедию, особенно английскую.

Алгоритмы сортировки NumPy (и танцы, и мемы)

makaedgar 21 июл 2021 в 04:30

данный массив преобразуется в двоичную кучу: занимает эта операция O(N*log2(N))

Операция построения двоичной кучи из неупорядоченного массива имеет оптимальную сложность O(N). Пример доказательства можно найти, в том числе, на хабре https://habr.com/ru/post/195832/

Как Яндекс маркет тебя затролит

makaedgar 27 апр 2021 в 18:36

Позавчера мне позвонили из маркета в 12 ночи из-за перепутанного заказа. На мой вопрос, не смущает ли их время звонка, гордо ответили — наш сервис работает круглосуточно!

Скрытые мобильные подписки на хостинге Мегафона

makaedgar 3 апр 2021 в 13:22

Спасибо за рекомендации, написал в чат — оператор без лишних вопросов принял, а на телефон прилетело много смс с запретами на мегафоновскую чепуху.

Скрытые мобильные подписки на хостинге Мегафона

makaedgar 3 апр 2021 в 13:08

Фейковые подписки Мегафона попортили много нервов, так как часто пользуюсь раздачей интернета со смартфона. Решение было найдено: запретить подписки отправив пять смс на бесплатный номер 5151 со словами:

успзапретвп
успзапретcп
успзапрет1
устпбк1
нетклик1

Раз в три месяца повторить процедуру (благо за пару дней приходят смс об окончании запрета). Это официальная услуга.

Выглядит как дикий костыль, и ужас — но стоит замешкаться на пару дней, и новая подписка на приколы ждёт тебя. После чего семь кругов ада из ботов, операторов, заявок и тп. Если стоять на своем и требовать вернуть деньги — их возвращают. Но это все неприятно.

Кстати, на Хабре уже была статья про связь мегафона и подписок habr.com/ru/post/448530

Наиболее точное скалярное произведение векторов типа double. Вычисление значения полинома

makaedgar 28 ноя 2020 в 16:47

Спасибо что делитесь своим опытом)
Может быть подскажете что-нибудь подобное для разложения Холецкого? Работаю с матрицами ковариации 100*100, и точности double не хватает. Приходится пользоваться длинной арифметикой, что сильно замедляет код

Каверзные вопросы по Python

makaedgar 19 ноя 2020 в 12:30

Меня в свое время очень впечатлил следующий каверзный пример из книги Л. Ромальо:

>>> a = {True : "1", 1 : "one"}
>>> print(a)    #?

Вывод print(a)

>>> print(a)
{True: 'one'}

Объяснение

В python3 тип bool реализован как подкласс инта, поэтому хеши True и 1 (а также False и 0) cовпадают. Для словаря, который использует хеш-функцию как индекс это одинаковые объекты.

Можно пойти еще дальше и вспомнить, как считаются хешы для float:

>>> a = {True : "1", 1 : "one", 1.0 : "double one"}
>>> print(a)
{True: 'double one'}

Такой вот коварный питон :)

Разработка приложения с использованием Python и OpenCV на Android устройстве

makaedgar 19 ноя 2020 в 08:21

Я запускал на Redmi note 9 Pro (MIUI 12).

Попробовал еще раз утром — тоже неудачно, появляется ошибка с proot. Она описана по моей предыдущей ссылке, там же и альтернативный вариант установки.

Разработка приложения с использованием Python и OpenCV на Android устройстве

makaedgar 19 ноя 2020 в 04:27

Большое спасибо за статью. Узнал много нового про termux, думал это просто игрушка для cd-ls.

К сожалению, убунта по вашему рецепту не встала, но сработал метод вот отсюда.