akozyrenko Jul 29 2024 at 11:57

Использование алгоритма бинарного поиска для нахождения квадратного корня числа на Java

Easy

3 min

8.9K

Programming * Java * Algorithms *

Comments 38

GeXoGeN Jul 29 2024 at 12:08

Левая граница в данном случае - это 1, а правая само число Х.

Правой границей можно сразу делать Х/2. и ещё, наверное, умножение будет работать быстрее деления вот тут:

(mid > x / mid)

akozyrenko Jul 29 2024 at 12:46

Нельзя, потому что если х = 1, в ответе вы получите 0, что неверно.

GeXoGeN Jul 29 2024 at 12:50

ну для х = 0 частный случай же Вы определили, можно и для х = 1 определить или даже скорее для 0<x<4, чтобы вообще быть точным, если вдруг захочется в будущем не только целочисленные корни искать

akozyrenko Jul 29 2024 at 12:56

зачем определять 4 таких случая, загрязняя код, если все, кроме того, что обозначено с 0, и так отсеется на первом шаге цикла. Мы ничего не выиграем по скорости, а лишь только накрутим код.

GeXoGeN Jul 29 2024 at 16:47

не ещё четыре, а ещё один. раз в задаче требуется округление путём отбрасывания дробной части, то при 0<Х<4 ответ будет равен 1, можно сразу его вернуть. либо если вдруг мы захотели вычислять дробную часть тоже, то в этой ветке кода можно оставить правой границей Х и дальше просто продолжить выполнять тот же алгоритм.

Proscrito Jul 31 2024 at 17:31

Обработка частных и граничных случаев это не загрязнение, а очистка кода. Объем и чистота не синонимы.

Sigest Jul 29 2024 at 18:43

Умножение может и будет работать быстрее, я так понимаю вы предлагаете (mid*mid>x)? Там при больших числах mid (тест кейс с leetcode x=2147395599) будет переполнение и в бесконечный цикл уйдет, так как проверка будет работать неправильно. А если заморачиваться с BigInt, то может ну его нафик, пусть с делением работает

GeXoGeN Jul 29 2024 at 18:58

Mid*mid ни при каких условиях не будет больше максимального значения X. Я же не просто так написал, что начальную правую границу нужно сделать равной Х/2.

Чето я наврал тут. Не читайте. Можно использовать uint.

GeXoGeN Jul 29 2024 at 19:16

Блин. Uint тоже не хватит. Всё, сдаюсь, посыпаю голову пеплом.

wataru Jul 29 2024 at 18:58

Там не надо BigInt, достаточно long long.

Sigest Jul 30 2024 at 04:23

Мы про джаву же. Что за long long? Ну ок, пусть будет джавовский Long. Но, во-первых по условию задачи (если смотреть инициализированный код на leetcode) вход и выход имеют тип int. Ок значит внутри алгоритма мы туда сюда преобразовываем из int в long и назад когда возвращаем результат. Во-вторых long-овая математика работает дольше int-овой. По сути мы ничего не выигрываем. Конкретно в данном случае.

wataru Jul 30 2024 at 06:43

Ок значит внутри алгоритма мы туда сюда преобразовываем из int в long и назад

Целых 2 перобразования. На самом деле они вообще бесплатные для процессора. Ему без разницы, загрузить 64 бита в регистр EAX или 32 бита в AX.

long-овая математика работает дольше int-овой.

Не правда. Уже очень давно процессоры 64-битные. Там операции с Long и Int занимают одинаковое время.

Единственный минус Long - это работа с памятью. Если у вас большой массив данных, то работа с Int будет быстрее из-за более плотного расположения в памяти и более частого попадания в кеш при чтении. Но наша задача этим не страдает.

По сути мы ничего не выигрываем. Конкретно в данном случае.

Выигрываем то, что умножение действительно быстрее деления. Довольно сильно.

Sigest Jul 30 2024 at 07:13

Не буду спорить. Скорее всего вы правы. Либо они одинаковы по скорости, либо очень не существенно. Я больше ориентировался не на битность процессора, а на его кеш. В голове очень давно , еще при изучении многопоточности, отложилось что в операциях с long на уровне процессора происходят оптимизации и в несинхронизированном коде (точнее без volatile) вполне реальна ситуация когда в одном потоке long переменная обновилась, а в другом потоке первые 32бита прочитались верно, а вторые закешировались и мы имеем вполне легальное, но неверное значение. Вот поэтому у меня такая мысль про long и закрепилась, что математика тут сложнее, чем с int

cpud47 Aug 1 2024 at 18:12

Это неатомарное чтение. Оно невозможно в Яве. Даже для long-ов на 64битном компьютере.

Источником неатомарный чтений является не совсем кеш, а скорее отсутствие (атомарных) машинных инструкций на чтение/запись достаточной ширины. Но для Явы это неважно, потому что спека требует атомарности всех чтений (примитивов).

Sigest Aug 2 2024 at 16:11

Немного не понял. Сейчас amd64 процессоры как лонг читают-пишут? Атомарно или нет? И если нет, то как JVM обходит данное ограничение?

vadimr Aug 3 2024 at 09:12

Все 64-разрядные операции в 64-разрядных процессорах Intel/AMD консистентны относительно своих 32-разрядных половинок. Это не совсем то же самое, что атомарность.

Alexandroppolus Jul 29 2024 at 19:51

если искать в пределах отрезка [0 ... 46340], то без переполнений уместится в int32

akozyrenko Jul 29 2024 at 19:59

По условию задачи заданное число может быть в пределах отрезка от 0 до 2 в 31 степени - 1, поэтому mid выйдет за пределы при использовании умножения.

wataru Jul 29 2024 at 20:00

Но корень-то не может быть больше 46340.

akozyrenko Jul 29 2024 at 20:22

ну, можете прогнать кейс с х = 2^31-1:), mid*mid вылетит за пределы int:)

Alexandroppolus Jul 29 2024 at 20:50

а вы не забыли сделать int right = min(x, 46340); ?

akozyrenko Jul 30 2024 at 01:10

А как вы определили 46340 на этапе, когда мы записываем значение right, без использования встроенных функций?

Alexandroppolus Jul 30 2024 at 03:55

Посчитал на калькуляторе) Условие гарантирует, что прилетит число от 0 до 2^31-1, благодаря чему я могу с чистой совестью захардкодить signed int32 для типа параметра, и (что то же самое) число 46340.

Рамки выглядят искусственно, но от них не уйти. Этот ваш O(ln N) по факту справедлив только если N не больше какой-то константы, чтобы числа и операции с ними стоили O(1). Из-за чего весь алгоритм формально обесценивается до О(1). А для произвольной верхней границы N у нас будет длинная арифметика, числа длиной L = ln(N), стоимость умножения O(L * ln(L)), итого O(ln(N)^2 * ln(ln(N))) на всё про всё, если я нигде не ошибся. Тогда можно не заморачиваться на переполнения и ничего не хардкодить.

VBDUnit Jul 30 2024 at 23:25

Есть же специальная операция int32 × int32 = int64. Как раз для защиты от переполнений

wataru Jul 29 2024 at 12:31

Важно указать, что в условии просят решить задачу без использования встроенных функций извлечения корня или возведения в степень.

Теперь вот вопрос: у вас в статье написано, что бинарный поиск работает на упорядоченном массиве. Но в задаче у вас никакого массива вообще нет. Как так?

Ну и маленькое замечание else if (mid <= x / mid) - тут условие не нужно, ведь это ветка elsе в проверке обратного условия. Оно тут всегда выполняется.

akozyrenko Jul 29 2024 at 12:41

Массива тут как таковой неочевиден, но фактически он есть. Ведь числа, которыми мы огибаем границы, как раз выстраиваются в упорядоченный массив (от 1 до Х)

С остальными замечаниями согласна, поправила/добавила:)

wataru Jul 29 2024 at 13:14

Массива тут как таковой неочевиден, но фактически он есть.

Я к тому, что этот момент стоит расписать поподробнее. Что на самом деле у вас есть мнимый массив, где по индексу i стоит число i^2. Ясно, что если найти в этом массиве самое большое число, не превосходящее x, то его индекс и будет ответом на задачу. Для большей ясности стоило бы задачу еще и формализовать (вроде: $a \rightarrow min : a \in Z, a^2 \le x$ ) Тогда понятно, что мы ищем в массиве.

Вместо хранения массива его значения можно просто вычислять, когда они нужны, m*m в коде - это фактически array[m]. Кстати, хорошо бы описать, почему вы вместо m*m > x используете m > x/m - это же чтобы избежать переполнения, да?

И вообще, в статье много объяснения "что", и почти нет объяснения "почему". Поэтому для людей не имеющих опыт применения дихотомии для решения подобных задач уже, ваша статья мало полезна, ибо это какая-то черная магия получается. Вот так вот двигаем границы, а почему, откуда, где тут вообще квадратный корень - этого из вашей статьи не понять.

akozyrenko Jul 29 2024 at 13:53

Спасибо за фидбек.

Согласна, что этот момент стоило бы расписать подробнее. Возьму на заметку для следующих статей.

wataru Jul 29 2024 at 13:16

Еще тонкий момент, а почему x=0 у вас крайний случай? Почему нельзя просто сделать l=0?

akozyrenko Jul 29 2024 at 13:28

Если вы сделаете left = 0, то словите ArithmeticException для х от 0 до 3 включительно

wataru Jul 29 2024 at 14:12

Только потому что вы решили делить x на m в усорвии, вместо логичного m*m. И об этом надо было написать в тексте статьи. И вообще, этот частный случай - он из-за вот той вот детали реализации, поэтому его стоило бы рассмотреть в конце, а не начинать с него повествование.

vadimr Jul 29 2024 at 14:16

Идея понятна, но пример выбран неудачно. Быстрое вычисление квадратного корня – это очень хорошо исследованная задача, и её можно решить гораздо быстрее бинарного поиска.

Например, вот тут люди обсуждают эту тему.

GeXoGeN Jul 29 2024 at 16:54

да с примером кажется вообще пофиг. ведь этим способом можно искать корни чуть ли не любого уравнения вообще.

vadimr Jul 29 2024 at 16:58

Ну да, известный способ поиска корня методом половинного деления. Есть нюансы, конечно, но в целом рабочий.

GeXoGeN Jul 29 2024 at 17:05

настолько известный, что проходится в программе обычного технического ВУЗа даже не по IT-специальностям. по-моему даже ещё какие-то проходили, но этот лучше всего запомнился, как самый очевидный. там больше всего сложностей, когда корней больше чем один.

NikolayTheSquid Jul 31 2024 at 13:05

Можно вычислять серединным поиском значение любой непрерывной мотонной функции (логарифма, экпоненты и т.д.). Казалось бы, решение подобных простейших задач не заслуживает размазывания на целую статью. Стыдно, но такой уж нынче Хабр победивших продактов, эйчаров и прочих чертей, не знакомых со школьными истинами.

kopn9k Aug 3 2024 at 18:52

Насчёт задач на бинарный поиск(определить их достаточно легко: 1. Отсортированный input, 2. Нас явно просят логарифмическую сложность, 3. В случае с литкодом если размер inputa > 10^6) есть один классный хак, который позволяет легко решать такие любые задачи.

Решаем/смотрим и разбираем проблему с нахождением первого true в отсортированном массиве Boolean, например [false, false, false , true, true] результат равен 3.
Запоминаем этот подход и дальше используем его как фреймворк, все, что остаётся сделать, это придумать такую функцию, которая будет для входных данных возвращать false, либо true, при этом эта функция будет монотонной (сначала только false,потом только true).
По-моему все задачи, которые я встречал на бинарный поиск, решались при помощи такого подхода

fasoGOda Aug 5 2024 at 07:56

Более правильное определение бинарного поиска, особенно в вашей задаче, было бы таким - бинарный поиск, это поисковой алгоритм, который позволяет находить искомую точку на монотонной функции f(x). Зато не нужно рассказывать, что здесь есть какой-то неявный массив.
Задача предполагается для новичков, зачем усложнять код делением вместо умножения, если здесь спокойно можно использовать int64, и код становится сильно проще? Да, можно сказать, что мы экономим память, но во первых, много ли вы экономите? Во вторых, вы при этом жертвуете скоростью (деление дольше умножения), и читаемостью (умножение проще воспринимать, потому что там нет отбрасывания остатка, которое есть при делении).
Если правильно написать бин поиск, то костыль в виде переменной result, которую вы используете, станет не нужен, я не буду писать много букав, просто прикреплю код, в котором ее нет, и в котором используется более читаемый вариант с умножением. Это С++, но особо разницы я думаю нет, просто здесь long long - это int64, остальное, я думаю, все как в Java

class Solution {
public:
    int mySqrt(int x) {
        long long l = 0, r = x;
        while (l < r) {
            long long mid = (l + r + 1) / 2;
            if (mid * mid > x) {
                r = mid - 1;
            } else {
                l = mid;
            }
        }

        return r;
    }
};

P. S.: про пункт 2 - если бы авторы хотели сделать задачу сложнее, они бы вместо int во входных данных, поставили int64, и вот тогда, нужно было бы напрягаться с делением, вместо умножения