Комментарии / Профиль MzMz / Хабр

Николай Мазуркин @MzMz

Java/Linux/Web

Профиль Публикации 5Комментарии 224Закладки 342

Специалисты по информатике изобрели новый эффективный способ подсчёта уникальных элементов

MzMz 13 июн в 19:56

HyperLogLog вроде выглядит ничуть не хуже по оценке сложности и памяти?

+12

Посмотреть

Операторы связи смогут расторгать договор, если абонента не было в сети больше 90 дней

MzMz 27 янв в 19:45

Все для народа, Госуслуги, банки, социальные сети, абсолюдно все завязано на номер. Попал ты в больничку на три месяца, в СИЗО, выехал за границу или просто забыл про резервный номер на втором запасном телефоне - все, номер потерял, даже если платишь исправно.

Посмотреть

Поиск ошибки

MzMz 6 янв в 23:50

В походный котелок помещается X кг черники. Сколько кг черники поместится в этот котелок, если уминать чернику ложкой?
родилась у нас в водном походе в Карелии

то есть вода у вас была?! тогда инженер в чате:
- в котелок объемом Y литров поместить X кг черники
- залить водой до упора
- воду слить и замерить объем слитой воды Z литров
- плотность черники равна X / (Y - Z) кг/л
- при уминании в котелок войдет еще Z * X / (Y - Z) кг черники

Посмотреть

Вычисление значений при угловом обходе квадратной матрицы

MzMz 13 дек 2023 в 17:41

Размышления о способах непрерывного обхода двухмерных массивов, в
которых траектория не пересекает саму себя, привели к выводу что их и не
так-то много. На самом деле базовые алгоритмы можно, как говорится,
пересчитать по пальцам одной руки. Наиболее известные из них: обход по
спирали и обход «змейкой».

Ни в одной из трех статей не нашел упоминания кривых Пеано.

Тут есть код для преобразования индекса в координаты

Посмотреть

Считаем медиану быстрее numpy

MzMz 31 окт 2023 в 19:21

Ведь на гистограмму в четыре с лишним миллиардов элементов никакой памяти не хватит!

я не очень понял из статьи - а что именно мешает просто отсортировать данные за O(n*log(n)) вместо построения гистограммы?

Посмотреть

Как не стоит работать с HashSet в Java?

MzMz 12 окт 2023 в 18:24

Эту ситуацию спрашивают на собеседованиях на Junior позицию, так как все описано в любой базовой книге по Java.

+13

Посмотреть

Собеседования по алгоритмам: максимальная конкатенация

MzMz 26 июн 2023 в 00:29

    private static final Comparator<String> COMPARATOR = (s1, s2) -> {
        if (s1.length() < s2.length()) {
            // extend the shorter s1
            while (s1.length() < s2.length()) {
                s1 = s1 + s1;
            }
        } else if (s1.length() > s2.length()) {
            // extend the shorter s2
            while (s1.length() > s2.length()) {
                s2 = s2 + s2;
            }
        }

        return s1.compareTo(s2);
    };

    private String concat(String... values) {
        return Arrays.stream(values)
            .sorted(COMPARATOR.reversed())
            .reduce("", (a, b) -> a + b);
    }

Посмотреть

Собеседования по алгоритмам: максимальная конкатенация

MzMz 26 июн 2023 в 00:14

Если посмотреть что происходит при делении на 99..99 то виден хитрый маневр: число abc при делении на 999 будет равно 0.abcabcabc... т.е 0.(abc)

Вообще на первый взгляд задачу можно было бы решить простым строковым сравнением чисел, но возникает проблема с числами у которых одинаковые строковые префиксы:

case 1: 35 351 20 - 3#5 3#5#1 2#0

case 2: 35 354 20 - 3#5#4 3#5 2#0

Фактически нам нужно сравнить какое из чисел с одинаковым строковым префиксом идет первым, для этого мы можем сравнивать бесконечные строки состоящие из повторов тестируемых чисел:

case 1: 353535353535353535... 351351351351351351... case 2: 353535353535353535... 354354354354354354...

Тут можно и без всякого деления на 999..9 сделать если просто написать специальный компаратор строк с автоматическим расширением меньшей строки повторами.

Посмотреть

Собеседования по алгоритмам: максимальная конкатенация

MzMz 25 июн 2023 в 23:47

но если у нас очень длинные числа, то дробь не влезет в double

можно написать специальный класс `Rational(long dividend, long divisor)` и сравнивать с приведением к общему делителю. Тогда дробных чисел не будет, только целые.

Посмотреть

«Если заинтересованы большие деньги, то возможно всё»: Максим Горшенин об «Эльбрусах» и российской микроэлектронике

MzMz 3 ноя 2022 в 00:23

Судя по тону статьи, вся надежда теперь на государство, бюджетные деньги и мудрого чиновника, который их выделит. Ну и хотя бы какая-то часть из них дойдет до адресата.

+10

Посмотреть

Статический анализ кода в современной Java-разработке

MzMz 30 июл 2022 в 21:43

Google error-prone еще

Посмотреть

Предсказание траектории летящего объекта

MzMz 31 дек 2021 в 00:55

Расчетные значения математических ожиданий при этом являются
оптимальными оценками по критерию среднеквадратической ошибки, что и
обуславливает его широкое применение.

это википедия говорит - я к сожалению не совсем математик, эти фильтры пацаны синтезировали, а я просто рядом стоял.

Посмотреть

Предсказание траектории летящего объекта

MzMz 30 дек 2021 в 21:07

Тут были статьи про фильтры Калмана - они также оптимально предсказывают, если есть модель процесса.

Посмотреть

Подготовка эффективной среды для написания bash сценариев

MzMz 24 окт 2021 в 04:06

Мне понравился толковый styleguide для shell-скриптов от Google

Посмотреть

Опыт коррекции зрения под общим наркозом по методике ReLEx Smile или Крайне мучительное восстановление

MzMz 10 сен 2021 в 20:05

Я не очень понял зачем был нужен общий наркоз для SMILE? Я делал SMILE под местным наркозом, там делов всего на 10-15 минут без всякой чувствительности, плюс еще на точку надо смотреть - как это делать под общим наркозом?

Посмотреть

Ценности DDD

MzMz 8 ноя 2020 в 17:58

Приходилось ли вам в коде видеть что-то подобное?

Приходилось

Надеюсь, что данная статья сможет внести свой небольшой вклад и прояснить некоторые моменты.

Хотелось все таки увидеть практические примеры как сделать пример лучше.

Посмотреть

Репозиторий youtube-dl удален с GitHub за нарушение DMCA

MzMz 24 окт 2020 в 01:37

Главное чтобы пакет на PyPi остался

-5

Посмотреть

Фильтр Калмана — это легко

MzMz 16 окт 2020 в 21:21

Просто первый пример из не-физического мира который вспомнился.

С другой стороны, если пофантазировать то можно например представить трафик на сайт как сумму какой-то реальной модели (органический ретеншн, объем рекламы, сезонность, переходы из поиска) плюс какой-то случайный шум (случайно зашли, кто-то опубликовал ссылку). В этом случае можно было бы вычленить тренд даже в случае ускорения. Другое дело что модели нет, ускорения добиться очень сложно, да и кейс не совсем про реальное время.

Посмотреть

Фильтр Калмана — это легко

MzMz 15 окт 2020 в 18:33

С ускорением — хороший пример, спасибо.

А как определить применимость фильтра Калмана к объекту, модель поведения которого неизвестна? С физическими телами — понятно, даже неизвестный для нас объект будет подчиняться физическим законам.

А вот например пользовательский трафик на сайт — нужно сначала подобрать какую-то правдоподобную модель сначала? Есть какие-то методики?

Посмотреть

Фильтр Калмана — это легко

MzMz 15 окт 2020 в 18:04

Спасибо за статью. Но у меня все тот же вопрос, что и к другим подобным примерам простых моделей — чем выгоднее фильтр Калмана по сравнению например с фильтром который просто усредняет значение в каком-то окне? Например берет среднее или медиану всех значений попавших в окно? По графикам как будто выглядит, что с подобным шумом такое усреднение справилось бы не хуже?

Посмотреть

2 3 ...

11 12