Комментарии / Профиль lam0x86 / Хабр

Михаил@lam0x86

Пользователь

Подписчики

ПрофильСтатьи1ПостыНовостиКомментарии681

lam0x86 25 ноя 2021 в 20:46

Ну, тот же топ на HN бывает вполне достоин. Интереснее, чем то, что публикуют на Хабре, да и обновляется чаще. Конечно, за разделом new не уследишь, но оно и не надо. Это как Свежее на Пикабу.

Пока, Хабр

lam0x86 23 ноя 2021 в 18:15

Зашёл в профиль автора и увидел, что уже ставил минус ему в карму. Я крайне редко минусую карму и считаю, что делаю это исключительно по делу (хотя, наверно, все так считают). Я бы с радостью убрал свой минус за давностью лет, но на Хабре можно либо поставить плюс, либо минус. Убрать свой голос нельзя. Это очень странно, я считаю. Вроде бы, я согласен с автором, что механизм кармы далеко неидеален, но вроде бы и не хочу ставить плюс. Хочу просто убрать свой минус.

+27

WhatsApp планирует запустить функцию «Сообщества»

lam0x86 7 ноя 2021 в 20:30

ФБ, конечно, хороши тем, что они мягко предлагают хранить всю историю переписки в "типа" защищённых облаках гугла и эппла. Уверен, большинство пользователей, не читая, кликают "согласен" с тем, что их переписка будет бэкапиться на подконткольные США сервера. По факту, и гугл, и эппл сливают всю переписку спецслужбам по первому требованию, и ФБ об этом знает, конечно. Пока они не предложат делать бэкап на яндекс.диске или других стораджах вне юрисдикции Штатов, их e2e-шифрование ничего не стоит.

Так что да, Телеграм не идеален в плане защиты. Но и ватсапп не идеален тоже. Хочется приватности, есть Сигнал и другие менее распиаренные альтернативы.

Неполадки в Facebook, WhatsApp и Instagram сказались на работе каждого шестого россиянина

lam0x86 6 окт 2021 в 10:27

Может быть, всё же опрос проводился не среди «россиян», а среди «пользователей соцсетей из России»?

Почему инженеры презирают Agile

lam0x86 27 сен 2021 в 23:37

Я не про баллы или очки, а про слово «сюжет». Вы выше писали про «пользовательские истории» из джиры (опять же, не понятно, зачем добавлять «пользовательские» к «историям»?). А термин “story points” родился именно для оценки историй. Так при чем здесь сюжет?

Почему инженеры презирают Agile

lam0x86 27 сен 2021 в 23:20

Даже если допустить, что в русском айти должна использоваться русская терминология (с чем я абсолютно не согласен), перевод "сюжетные баллы" или "сюжетные точки" просто отвратителен. Где сюжет? Мы кино снимаем или театральную постановку? Раз уж так хотите использовать русский язык, придумайте нормальный термин. Не обязательно переводить дословно.

+14

Хранение изображений сайта в БД

lam0x86 27 сен 2021 в 23:06

Можно использовать любой S3-совместимый storage или другой тип CDN с нормальным API и нет проблемы с нагрузкой на ФС, заодно и быстрее работать будет, т.к. грузиться будет с ближайшего сервера.

Google запустила интерактивную 3D-таблицу Менделеева

lam0x86 14 авг 2021 в 19:58

Да просто кто-то из топов гугла запилил свой pet-проект на Svelte, и другие топы такие: ого, круто! Ты, оказывается, умеешь кодить! Вот тебе два ляма на пиар. Не забудь про Хабр.

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 11 авг 2021 в 10:55

Так я конкретный случай рассматриваю, когда в дереве 1 нод.

-1

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 11 авг 2021 в 10:47

Поиск в массиве - O(N).

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 11 авг 2021 в 08:38

Да, тут всё плохо :) Для даты 2001-01-01 ваш алгоритм сразу находит единицу, поэтому работает быстро. Моему приходится искать в дереве, и единица будет самым глубоким левым нодом, поэтому ищется долго.

Шаблон был таким:

*.1,3,6,8,11.1,3,6,8,11,13,16,18 1,3,6,8,11,13,16,18:1,3,6,8,11,13,16,18:1,3,6,8,11,13,16,18

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 18:13

Пока у меня вот такой результат получается. В некоторых тестах дерево работает медленнее, даже чем в FindNextOld, но зато в сложных случаях показывает 15х производительность.

P.S. Я пока сделал только поиск вперед. Все тесты проходятся нормально.

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 13:35

Так двоичное дерево легко представляется в виде массива, где корневой элемент под индексом 0, два дочерних под индексами 1 и 2, следующие 4 дочерних под индексами 3-6 и т.д. Таким образом, у элемента T[i] дочерние будут T[i*2 + 1] и T[i*2 + 2].

Вполне себе кэш-френдли.

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 11:11

Надо будет проверять только пересекающиеся интервалы. В случае с большим количеством значений через запятую будет просто много нодов в дереве, но в результате поиск вернёт только один интервал за O(logN).

Пока что я не готов написать рабочий код из-за отсутствия времени. Может, на выходных доберусь, если тема будет ещё актуальна :)

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 10:56

Зачем делать 283 итерации, если можно сделать один поиск в дереве, содержащем один элемент?

Хотя, конечно, без понимания, в каких условиях будет использоваться код, и без проведения перформанс-тестов, невозможно сказать, что будет эффективнее - массивы или деревья. Если в шаблоне будет указано, например, 990 значений миллисекунд через запятую, то поиск значения в дереве в среднем займёт ~5 итераций (при глубине дерева log2(990) ~ 10), а поиск в массиве ~1 (т.к. почти все ячейки будут true).

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 10:47

Ок, для таких случаев должны возвращаться оба интервала. Step работает уже на следующем уровне: когда мы получили интервал, определяем, попадает ли искомая компонента даты под шаг. Если попадает, возвращаем её. Если нет, возвращаем ближайшее число, удовлетворяющее шагу и направлению поиска.

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 10:34

Это будет не одно дерево, а 8 деревьев, в каждом по одному ноду IntervalWithStep (from=0, to=int.MaxValue, step=4).

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 10:30

Точно, не заметил ограничения в задаче.

Тем не менее, если бинарный поиск не подходит, то линейный поиск подходящей миллисекунды в среднем обойдётся в 500 итераций цикла для случая, когда в шаблоне указано единственное конкретное значение. В случае с деревом сложность будет O(1).

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 10:13

Учитывая, что количество лет потенциально неограниченно, мне кажется, дерево всё же предпочтительнее :)

Ну и не совсем понятно, как вы организуете бинарный поиск в случаях интервалов с шагом: например, 0-999/2.

Предположим, я передал дату 2000-01-01 00:00:00:001.

Очевидно, она не подпадает под шаблон. В каком диапазоне делать поиск? [2;999]? Среднее значение будет 500. Оно подпадает под шаблон, но по сути неверное, т.к. следующее верное значение - 2.

Почему не все тестовые задания одинаково полезны: разбор одного фееричного провала

lam0x86 10 авг 2021 в 10:00

Я бы сделал так:

1) Для каждого сегмента шаблона (год, месяц, день, час, минута, секунда, миллисекунда) завёл бы segment tree с таким интерфейсом:

enum SearchDirection
{
  Forward,
  Backward,
}

class SegmentTree
{
  public void AddSegment(int from, int to, ISegment segment) {...}
    
  // Возвращает сегмент, в который попадает number. 
  // Если number не попадает ни в один сегмент, возвращает ближайший с учётом searchDirection.
  public ISegment GetSegment(int number, SearchDirection searchDirection) { ... }
}

interface ISegment
{
  int? GetFirstMatch(int number, SearchDirection searchDirection);
}

// Класс, представляющий интервал годов/месяцев/дней/часов/минут/секунд/миллисекунд. Интервал может быть представлен единственным числом.
class Interval : ISegment
{
  // from == to для случая, когда значение указано без диапазона
  Interval(int from, int to) {...}
  
  int? GetFirstMatch(int number, SearchDirection searchDirection)
  {
    return number;
  }
}

// Класс, представляющий интервал годов/месяцев/дней/часов/минут/секунд/миллисекунд с учётом шага
class IntervalWithStep : ISegment
{
  IntervalWithStep(int from, int to, int step) {...}

  int? GetFirstMatch(int number, SearchDirection searchDirection)
  {
    var offset = number - this.from;
    if (offset % this.step == 0)
    {
      // Если попали в шаг, возвращаем number
      return number;
    }

    // Если не попали в шаг, возвращаем ближайшее подходящее значение с округлением. Если это значение выходит за пределы интервала, возвращаем null.
    var increment = searchDirection == SearchDirection.Forward ? 1 : -1;
    var result = this.from + (offset / this.step + increment) * this.step; 
    return result < this.from || result > this.to ? null : result;
  }
}

2) При конструировании дерева наполнял бы его разными типами нодов: для простых констант и интервалов - Interval, для интервалов с шагом - IntervalWithStep.

То есть, для случая "*.*.* * *:*:*.*/2" все деревья, кроме дерева миллисекунд, содержали бы по одному ноду Interval, у которого from=0, to=int.MaxValue.

Дерево для миллисов содержало бы один нод IntervalWithStep (from=0, to=int.MaxValue, step=2).

3) Поиск похож на ваш: сначала ищем интервал для года, вызываем у него GetFirstMatch(date.Year), дальше делаем то же самое для месяца, дня и т.д. Если на каком-то из этапов GetFirstMatch возвращает null (т.е. вышли за пределы интервала), то берем следующий сегмент. Где-то мог ошибиться в логике, но вроде бы должно работать.

3 4 ...

34 35