Comments / Profile of tagir_valeev / Habr

Тагир Валеев @tagir_valeev

Программист

ProfileArticles86PostsNewsComments2.8K

Математики достигли прорыва в изучении «опасной» задачи

tagir_valeev Jan 8 2020 at 09:44

Хм. У меня переполнение наступает позже, на числе 23,035,537,407 (за две минуты доходит до этого числа на джаве). Я оптимизировал следующим образом. Во-первых, уже отметили, что можно рассматривать только нечётные числа. Соответственно будем перебирать не x из исходной постановки задачи, а y = (x-1)/2. То есть x = 2y+1, и тогда следующее число за ним — 3x+1 = 6y+4. Очевидно, оно чётное, сразу делим пополам (3y+2). Далее его делим на два пока делится (то есть обрезаем правые нулевые биты), а потом вычитаем единицу и ещё раз делим на два, чтобы получить новый y (то есть обрезаем ещё один единичный бит). По сути надо сдвинуть результат вправо на numberOfTrailingZeros+1. NumberOfTrailingZeros — это инструкция TZCNT, быстро работает. С помощью этих оптимизаций мы также отыгрываем один битик от числа, то есть можем работать с 65-битным промежуточным результатом.

Код на Java

public class Collatz {
  public static void main(String[] args) {
    long limit = Long.divideUnsigned(-1L, 3) - 2;
    for (long num = 1; ; num++) {
      for (long next = update(num); next >= num; next = update(next)) {
        if (next == num || next > limit) {
          System.out.println((next == num ? "Found: " : "Overflow at: ") + (num * 2 + 1));
          return;
        }
      }
    }
  }

  private static long update(long value) {
    value = value * 3 + 2;
    return value >>> (Long.numberOfTrailingZeros(value) + 1);
  }
}

В Java нет типа unsigned long, но это никому не мешает. Сложение и умножение для signed и unsigned работает одинаково, есть операция беззнакового битового сдвига >>>, а для деления есть специальный метод divideUnsigned.

0

Математики достигли прорыва в изучении «опасной» задачи

tagir_valeev Jan 8 2020 at 07:41

Как правило, полное доказательство таких гипотез даёт попутный субпродукт — новую разработанную методологию решения математических задач. Она позволит атаковать другие проблемы, которые вполне могут иметь практическую ценность, даже если от самой изначальной гипотезы пользу нет. В математике никогда заранее точно не знаешь, где появится полезное знание, но практика показывает, что это происходит весьма часто. Поэтому надо продолжать копать.

+1

Топ 10 ошибок в проектах Java за 2019 год

tagir_valeev Dec 20 2019 at 05:52

Ну вот как раз подобный кейс со скоррелированным состоянием в том же методе, который разбирается на пятом месте (смотри мой комментарий ниже). Почему-то в хит-парад попал не он, а ложное срабатывание =)

0

Топ 10 ошибок в проектах Java за 2019 год

tagir_valeev Dec 20 2019 at 05:52

del

0

Топ 10 ошибок в проектах Java за 2019 год

tagir_valeev Dec 20 2019 at 05:46

В целом:

Идея репортит 10, 9 (первый кейс), 8, 7, 6, 4.
5 репортить и не стоит, смотрите выше
9.2 репортить было бы хорошо, но это тоже unsound warning (а вдруг снаружи метода всегда проверяется, что x != index_64.length?). У меня была черновая реализация, но возникают помимо хороших варнингов реально очень мутные false-positive, где голову сломаешь перед тем как докажешь, что анализатор неправ. Я поэтому убрал этот код. Возможно, стоит вернуться.
3 должен репортиться инспекцией Integer multiplication or shift implicitly cast to long, но почему-то не срабатывает. Проверю, починю, спасибо!
2 — это интересная штука, у нас прямого аналога нет. Кое-какие циклы инициализации репортятся косвенно, но прямо такой нету.
1 — варнинг крутой, но как я понял инспекция у вас эвристическая. Возникает вопрос, сколько мусора она репортит. Вообще преаллоцированные массивы в toArray() в наши дни — антипаттерн. У нас на это есть инспекция, которая подсвечивает верхний по дефолту, но как раз молчит в нижнем, потому что вдруг пользователь реально хотел массив другой длины (чтобы были null'ы в хвосте).

+2

Топ 10 ошибок в проектах Java за 2019 год

tagir_valeev Dec 20 2019 at 05:34

final int roundCarryMask = (1 << (bitShiftsInWord - 1));  // <=

Это тоже вообще не ошибка. Я потому не делаю подобные unsound-варнинги, потому что в них сбалансировать false-positive/false-negative очень сложно. Здесь откровенно мусорный варнинг, который только отвлечёт программистов от реальных проблем. Видите выше noRestore = bitShiftsInWord == 0? А ниже посмотрите на использования noRestore. Вы сразу увидите, что когда bitShiftsInWord == 0, результат битового сдвига (переменная roundCarryMask) не используется вообще. Поэтому абсолютно наплевать, какое там значение.

Почему-то вы, кстати, молчите про другую вещь в том же методе:

if (wordShifts == 0 && bitShiftsInWord == 0) {
    return;
}
...
final boolean noRestore = bitShiftsInWord == 0;
...
switch (wordShifts) {
case 0:
  // noRestore is always false
  roundCarry = (noRestore ? 0 : (this.v[0] & roundCarryMask)) != 0;
  ...

Здесь очевидно noRestore всегда ложно, потому что случай wordShifts == 0 && bitShiftsInWord == 0 был обработан выше. Идея радостно подсвечивает эти ветки и предлагает автоматически упростить код в один клик. PVS-Studio не может так? ;-)

+1

Топ 10 ошибок в проектах Java за 2019 год

tagir_valeev Dec 20 2019 at 05:33

 if (text == null || text.length() < 2) {
    return false;
  }
  if ("0".equals(text) || "0L".equals(text) || "0l".equals(text)) {// <=
    return false;
  }

Я ж вам про это говорил вроде. Это вообще не ошибка, просто перестраховка. Вы смотрите хоть немного логику метода. Да, если на входе строка "0", она отсекается двумя разными способами, в обоих случаях return false; произойдёт, поэтому без разницы, в какую ветку мы зайдём. Может сбить с толку, если не вчитаться в код, но ошибки здесь нет. Сама Идея этот код подсвечивает ещё с 2017-го года (и не заводите волынку, что раз мы его не исправили, то нищитово).

+1

5 скрытых cекретов в Java

tagir_valeev Dec 18 2019 at 17:24

Выше написали же. В целом это абьюз фичи. Фичи следует использовать по назначению.

0

Hello World из байт-кода для JVM

tagir_valeev Dec 18 2019 at 16:55

Вот ещё я по теме писал, но только про пул констант. Зато с красивой картинкой!

+1

5 скрытых cекретов в Java

tagir_valeev Dec 18 2019 at 16:49

Не пользуйтесь этим ужасом. Забудьте как страшный сон.

0

Не все патчи одинаково полезны

tagir_valeev Dec 18 2019 at 16:27

С ArrayList у тебя стандартная проблема бенчмарк-энтузиаста, кстати. Ты увидел кейс, который в твоей практике случается часто, заточил библиотеку под этот кейс и написал бенчмарк тоже под этот кейс. Почему не потестировать другие кейсы? Если туда HashSet прилетает, сколько съедает лишняя проверка? А если разные реализации прилетают, например emptyList/singletonList/ArrayList/unmodifiableList в равной пропорции (вполне жизненная ситуация)? Насколько ускорится или замедлится каждый случай? Тело метода стало больше, влияет ли это на решения об инлайнинге?

Я не к тому, что твоя идея плоха. Она может и хороша. Я к тому, что надо критически смотреть на свои гениальные идеи.

+2

Не все патчи одинаково полезны

tagir_valeev Dec 18 2019 at 16:14

Мораль сей басни такова: ваш гениальный патч могут зарезать на ревью просто потому, что не увидят в нём особой ценности. Ну да, есть повторяющийся код, но он никому особо не мешает, так что пусть живёт.

Дело не совсем в этом, тебе же сказали. Если делаешь метод в Arrays, нужны как минимум специализации для int/long/double, а желательно и для byte/boolean/short/char/float. В итоге имеем девять методов. И логично иметь версии с диапазоном поиска. Вот уже 18 методов. И ещё lastIndexOf — итого 36. Это уже серьёзная заявка. Люди надеются на светлое будущее и специализацию дженериков, когда можно будет обойтись четырьмя методами. Поэтому не хотят плодить новый код, связанный с речной специализацией. Только когда это будет — неясно.

+1

Java-дайджест за 18 декабря

tagir_valeev Dec 18 2019 at 15:55

ведь 14 — уже ближе к следующему LTS, чем к Java 11

Почему? Вроде ровно посередине.

+1

«Нулевой» ад и как из него выбраться

tagir_valeev Dec 12 2019 at 04:54

Assert::that($amountInCents)->greaterThan(0);

Странно, что это называется assert. Это же precondition. Либо библиотека писалась для ассертов, но используется для прекондишнов. Технически разница может невелика, но семантика у ассерта и прекондишна разная.

0

Пробуем улучшенный оператор instanceof в Java 14

tagir_valeev Nov 30 2019 at 01:11

В плане скоупинга переменных паттерна работает аналогично. Про вывод типов никто ничего не говорил.

0

Пробуем улучшенный оператор instanceof в Java 14

tagir_valeev Nov 29 2019 at 10:58

Но boolean x = obj instanceof String str && !str.isEmpty(); — уже вполне полезный код.

0

Пробуем улучшенный оператор instanceof в Java 14

tagir_valeev Nov 29 2019 at 02:14

Начнём с того, что ни у кого нет цели сделать из Джавы новый Котлин или Скалу. Какой смысл, если Котлин и Скала уже существуют? Джава — это отдельный язык со своей философией. У Котлина и Скалы другая философия. Это прекрасно, что у программистов есть выбор, какой философии следовать. Если сделать из Джавы второй Котлин, выбор пропадёт.

В Джаве есть одна хорошая вещь: в большинстве случаев локального контекста понятно, чтобы выяснить, что делает данная строчка кода. Скажем, если вы видите a[b] = c * d, вы знаете точно, что здесь у вас происходит запись произведения в элемент массива в куче, вне зависимости от того, что такое a, b, c и d, вне зависимости от того, какие у вас есть импорты и библиотеки, в каком классе вы выполняете этот код. Вы точно знаете, что в этой строчке у вас нет сетевого запроса или доступа к базе данных. В Котлине или Скале вы не уверены, эта строчка может делать абсолютно всё что угодно. Я считаю, что ясность — важная отличительная черта Джавы, и Джава перестанет быть Джавой, если потеряет ясность. Причём это усложнит не только чтение кода человеком, но и средства автоматического анализа кода. Некоторые вещи могут вообще перестать работать.

+1

Пробуем улучшенный оператор instanceof в Java 14

tagir_valeev Nov 29 2019 at 02:09

Зависит от проекта. В исходниках IntelliJ IDEA тоже многие тысячи instanceof. По сути дела многие инспекции — это поиск паттернов по дереву, паттерн-матчинг в чистом виде. Ну и в целом нет ничего плохого в instanceof, если правильно его использовать. Часто это существенно лучше, чем visitor pattern, который в джаве выглядит откровенно по-уродски, занимает больше места в исходниках и имеет больше накладных расходов при исполнении.

0

Пробуем улучшенный оператор instanceof в Java 14

tagir_valeev Nov 28 2019 at 03:41

Про перекрытие полей спросил. А про || false — это в amber-dev можно спросить, там открытый мейлинг-лист.

0

Пробуем улучшенный оператор instanceof в Java 14

tagir_valeev Nov 28 2019 at 00:17

Нет, пока не обсуждается. Честно говоря, мне кажется, что это плохая фича для джавы.

+2

1 2 ...

12

13 14 ...