PatientZero Dec 28 2023 at 12:45

4 миллиарда операторов if

Medium

7 min

116K

Python*Perfect code*Algorithms*Compilers*C*

Review

Translation

+342

153

Comments 153

lgorSL Dec 28 2023 at 12:57

ОС могла закешировать часть файла и не читать каждый раз (например, первые 10 Гб), во вторых ssd на m.2 обычно заметно быстрее (на уровне 3 или даже 7 гигабайт в секунду на чтение).

Но исходный код в начале статьи вообще на питоне, его исполнение было бы ещё медленнее на несколько порядков.

falcon4fun Dec 29 2023 at 00:13

Именно. Про файл маппинг в память видимо кто-то не слышал. Ох уж этот мир девопсеров.

atd Dec 29 2023 at 12:58

Чтобы что-то замапить в память, надо это прочитать с диска, магическим образом байты в рам не залетают. При размере файла 40гб, рам 32гб и линейном чтении файловый кэш поучаствовать не сможет (даже при всём желании, ну разве что перед измеряющим запуском несколько раз запустить программу и нажать Ctrl+C до того, как она завершится, если подгадать момент, тогда можно успеть оставить бОльшую часть файла в кэше фс).

rexen Dec 29 2023 at 13:55

Погодите, маппинг в память и кэширование - это не одно и то же. Первое - это лишь таблица трансляции виртуальных адресов, доступных программе в реальные, доступные ОС.

atd Dec 29 2023 at 13:59

А где я заявлял, что это одно и то же?

Профит от маппинга будет только если файл уже где-то лежит в памяти (например, в кэше ФС), если его там нет, то данные придётся читать с диска.

kh0 Dec 29 2023 at 19:11

так автор же писал, что, несколько раз запускал код с разными параметрами от меньших к большим, т.о. на третьем пуске закэшировалось Х первых гигабайт, и на четвертом Х первых гигабайт вычитало прям из кэша, а дальше как обычно.

HexGrimm Jan 2 2024 at 11:16

А почему кстати при маппинге при увеличении числа время растёт? Маппинг ведь подразумевает расчёт указателя, верно? Если есть расчёт, то и файл не нужно читать с начала, а с произвольного индекса.

echo10 Dec 29 2023 at 12:40

добавьте еще ELSE к IFам, пожалуйста, а то получается какой-то брут-форс )))

saboteur_kiev Dec 30 2023 at 00:09

а что изменится?

boldape Dec 30 2023 at 01:21

Ну судя по тому что время работы программы у чела меняется в зависимости от введённого значения, то на асме он таки добавил элсы.

Без элсов любой запуск будет тратить одно и тоже время и считывать весь файл, а с элсами он будет считывать до ИФА с совпадающим значенияем введённого числа. Без элсов это аналог алгоритма каунт (посчитать все вхождения), а с элсами алгоритм фаинд (найти первое совпадение).

vldF Dec 30 2023 at 13:05

О, заодно и константную ассимтотику можно получить так!

red75prim Dec 28 2023 at 13:10

И ещё это демонстрация того, как легко получить undefined behavior в программе на C. Если запустить программу без параметров, то значение argv[1] - NULL, а поведение atoi c параметром NULL не определено в стандарте. Если argc равно 0 (впрочем, под Windows этого случится не может), то значение argv[1] не определено.

MinimumLaw Dec 28 2023 at 13:48

Даешь повторение эксперимента на Rust! Я бы посмотрел... на итоговую разницу. И результа запуска без параметров.

red75prim Dec 28 2023 at 14:04

Потенциальные ошибки придётся обрабатывать каким-то образом. Что-то вроде

let number: u32 =
    args().nth(1)
    .expect("The program needs an argument")
    .parse()
    .expect("The first argument should be a positive number");

Ну, а дальше работа с загрузкой и исполнением недоверенного кода, которая не может быть безопасной по определению, так что придётся использовать unsafe.

Большая часть работы тут возложена на OS, так что измеримой разницы в производительности скорее всего не будет.

MinimumLaw Dec 28 2023 at 14:15

Не пойдет, ибо

if (argc < 2) {
  printf("Need argument!\n");
  return -1;
}

Но это уже дополнительный код. А интересно именно без него... Особенно если вернуться к вашему верхнему комментарию.

red75prim Dec 28 2023 at 14:33

Чудес не бывает. Undefined behavior нужно как-то определить, иначе он останется undefined. Раст доопределяет работу с аргументами программы как: "args().nth(n) возвращает None, если аргумента n не существует". Что с этим делать дальше зависит от программиста. Можно даже вернуть UB, используя unreachable_unchecked() в ветке обрабатывающей отсутствие аргумента.

MinimumLaw Dec 29 2023 at 07:35

Т.е. вопрос в целом не к atoi(), а к программисту, который не проверил ввод от пользователя и в целом это не зависит от языка? Я правильно понял?

А что произойдет с вашим кодом, если мы запустим

$ ./prog fortytwo

Вводим дополнительную проверку? Или все же "мусор на входе - мусор на выходе"?

Cerberuser Dec 29 2023 at 08:10

Дополнительная проверка в комментарии выше уже есть - parse вернёт ошибку, если входная строка не будет представлять значение требуемого типа (здесь - u32). Для этого, собственно, и нужен второй expect.

MinimumLaw Dec 31 2023 at 09:46

Т.е. .pase() ведет себя не как atoi(), а как scanf(). Впрочем, при использовании scanf() в C можно было и argv[1] на NULL не проверять...

В целом очень странные чувства от анализа совершенно простого кода. С одной стороны да - при нештатном использовании (запуск без аргумента или с неподобающим аргументом) - и даже откровенно некрасиво написанная программа падает в корку. Чем явно и недвухсмысленно говорит программисту - ты не прав, надо исправляться. С другой стороны... Падение программы, вызывающее DoS - несколько не то поведение, которого ожидает заказчик. Тем более, что для такого поведения надо "нарушить правила" - т.е. создать специально условия, приводящие к ошибке. А война меча и щита - она вечная.

Да, пожалуй, DoS в большинстве случаев лучше, чем RCE. Но нужно быть гурманом...

mayorovp Dec 31 2023 at 10:50

Так не пиши .expect если падение нежелательно, это лишь один из вариантов обработки ошибки. Можно поставить вопросительный знак, тогда ошибка будет проброшена далее по стеку. Или же её можно обработать явно.

Важным моментом является тог, что не выбрав способа обработки ошибки до значения не добраться.

Ах да, ещё паники можно перехватывать, чтобы отправить в какой-нибудь Sentry, так что даже .except не роняет программу безусловно.

CodeRush Dec 28 2023 at 14:04

В результате запуска без параметров там будет что-нибудь вроде thread 'main' panicked at 'called `Option::unwrap()` on a `None` value', т.е. ничего интересного.

Если же повторять эксперимент на Rust, то лучше засунуть все в здоровенный блок match и посмотреть, прожует компилятор 4 миллиарда записей в нем, или тоже решит, что это не для него.

MinimumLaw Dec 28 2023 at 14:20

Точно так. И код возврата не нулевой (надеюсь).

CodeRush Dec 28 2023 at 16:05

Не нулевой, а 101.

aamonster Dec 28 2023 at 16:46

Match не годится, он может быть соптимизирован и вместо полного перебора получите O(log(N)).

Javian Dec 28 2023 at 13:47

Хорошая статья для пятницы.

Shura_m Dec 28 2023 at 13:59

По моему, автор доказал только одну вещь:

-можно реализовать любую фигню, любым образом, особенно если ты не ограничен ресурсами.

NickyX3 Dec 28 2023 at 17:11

ru_perl 90-х
– Парни, а можно на Perl зачитать тектовый файл в 30 миллионов строк?
– А че за железо?
– Sun StarFire, 32 CPU, 196 GB RAM.
– ТЕБЕ - МОЖНО!

Didimus Dec 28 2023 at 20:06

Советским программистам платили за количество строк кода.

terthon Dec 29 2023 at 09:47

я такое слышал только про индусов

rombell Dec 29 2023 at 20:06

такого не было

a-cherepanov Dec 29 2023 at 20:12

Ложь
Да нет, "Клади"
Ты что, в русской школе учился?

Советским программистам платили оклад.

falcon4fun Dec 29 2023 at 00:14

Именно так подумали про оптимизацию в иммортал оф авеум и прочих проектах этого года (:

Ivan22 Dec 28 2023 at 14:13

я думал статья будет про то как нейросети работают....

qfox Dec 28 2023 at 23:03

Нейросеть писала статью!

nochkin Dec 29 2023 at 20:05

Нейросеть сделала пост в ТикТоке, а потом просто тихо хихикала над глупыми людишками в своём нейродоме на берегу нейроморя.

AVX Jan 1 2024 at 16:13

Прочитал как "в нейродурдоме"

nochkin Jan 1 2024 at 23:00

Пишем "дом", а "дурдом" в уме.

panzerfaust Dec 28 2023 at 14:14

Если ваша лайвкодинг-сессия на интервью не похожа на это, то даже не зовите меня.

WFF Dec 28 2023 at 14:16

Все равно надо писать на Питоне: из полученного в качестве параметра числа он должен сделать программу на C, скомпилировать ее, запустить и вернуть результат.

Но глобально хотелось бы то же самое, но на микросервисах..

Conung_ViC Dec 28 2023 at 15:06

для каждого числа - свой микросервис?

aamonster Dec 28 2023 at 16:48

Причём на Erlang, с соблюдением принципа "let it crash".

gun_dose Dec 28 2023 at 22:51

Именно, неизвестно только что потом делать с 32-битным счётом от Amazon

halfworld Dec 29 2023 at 14:57

Проверить на четность?

edogs Dec 28 2023 at 15:10

Ага, и полное покрытие тестами.

antonguzun Dec 28 2023 at 15:41

Не забыть про слоеную архитектуру

Didimus Dec 28 2023 at 20:07

И георезервирование

Boilerplate Dec 29 2023 at 14:01

И желательно потом оптимизировать углеродный след

TEMN1J Dec 28 2023 at 14:36

Было бы интересно посмотреть сравнение производительности. ИМХО куча операторов сравнения медленнее чем операция остатка от деления. Однако, если сделать некую таблицу (число-чётное или нет) и маппинг оффсета на каждое число, и хранить этот файл в RAM, то уже возможно, что будет быстрее. Но опять же, это все надо проверять.

navferty Dec 28 2023 at 14:48

Я слабо представляю, как что-то может быть быстрее, чем получение крайнего бита из бинарного представления в памяти целого числа.

Alexey2005 Dec 28 2023 at 15:12

Так нам ведь нужно не просто получить бит. Нам нужно:

Прочитать аргумент, представленный в виде строки.
Зачем-то сконвертить эту строку в число.
Получить бит от этого числа
В зависимости от бита осуществить переход.

Но ведь можно же никуда строку не конвертировать, а просто взять из неё последнюю цифру и проверять только её символьный код. Там и if'ов будет меньше, и переход можно вообще таблицей переходов (или switch) сделать.

code07734 Dec 28 2023 at 15:20

А можно таки взять младший бит последней цифры) Расположение символов цифр в ascii соответствует четности самих чисел

edogs Dec 28 2023 at 16:09

Вы на полном серьезе рассуждаете как можно оптимизировать код из статьи?:)

aamonster Dec 28 2023 at 16:53

Ну да, а что? Я считаю, что нужна пачка функций типа isEqualTo0, isEqualTo1, isEqualTo2 и так далее, которые проверяют (тоже перебором) равенство конкретному числу, а уже потом проверять пачкой вызовов типа if(isEqualTo3(number)) printf("odd\n"), так хотя бы O(N^2) будет, а не жалкое O(N).

yokotoka Dec 28 2023 at 19:29

Перебором неспортивно. Нужна рекурсия

aamonster Dec 29 2023 at 11:35

Ну можно. Каждый из вызовов isEqualToX вызывает все остальные isEqualToY, чтобы убедиться, что каждый из них вернёт false. А чтобы избежать зацикливания – для каждого храним флаг, что он уже вызван. Правда, это будет не thread-safe, но, сдаётся мне, это наименьшая из проблем.

Boilerplate Dec 29 2023 at 23:01

isEqual(num) {
if(num ==0)

return "odd"
if (num == 1)
return "even";

return isEqual(num - 1);
}

mrqak Dec 29 2023 at 23:12

Ответом всегда будет even, если num > 0

fix:

return isEqual(num - 2);

А еще odd и even местами перепутаны)

Boilerplate Dec 30 2023 at 17:44

Ну тестировщиков тоже нельзя без работы оставлять. А если в исходном варианте с ифами добиваться 100% покрытия, это же сколько тестов-то будет!

mayorovp Dec 28 2023 at 14:59

А где хаб "Ненормальное программирование"?

denis-19 Dec 28 2023 at 18:20

Автор выбрал другие хабы, там 5 ограничение, а так да может подойти.

mayorovp Dec 29 2023 at 06:20

Он не просто "может подойти", он подходит для этого поста больше всего.

Didimus Dec 28 2023 at 20:08

Ещё здоровье подойдёт

edogs Dec 28 2023 at 15:08

if (number == 5)
printf("odd\n");

4 миллиарда сравнений (каждое на 2 строчках), вот что бывает когда за код платят построчно:)

Myclass Dec 28 2023 at 15:41

Забавно. А можно кластер из 2^32 нодов создать, чтобы каждый за свою цифру отвечал и ваш код как функцию распределения взять и ву-а-ля - можно поток цифр в реальном времени обрабатывать. :)

CrazyElf Dec 28 2023 at 15:55

Кажется, вы заново открыли map->reduce ))

pythonist1234 Dec 28 2023 at 16:22

Это не троллинг 80 лвла. Это троллинг 40 ГБ лвла)))

Didimus Dec 28 2023 at 20:08

В следующей версии виндоус калькулятор будет больше

LF69ssop Dec 28 2023 at 16:27

На самом деле, показанный выше код — идеальный пример компромисса между временем и задействованной памятью.

Хорошая попытка, но нет. Автор кода просто не понимает что он делает.

bear11 Dec 28 2023 at 16:28

а gcc -O3 это во сколько раз сожмет?

blind_oracle Dec 28 2023 at 18:58

Просто превратит это в `if i % 2 ...` :)

cb_ein Dec 28 2023 at 22:42

Хм, а если после N миллиардов if будет else { printf("Unknown number\n"); } ?

TheAthlete Dec 29 2023 at 14:17

esaulenka Jan 3 2024 at 11:35

Не сильно-то он это сжимает. Никто просто не догадался написать такую оптимизацию: https://godbolt.org/z/rsbaWx8Tr

А вот clang умеет делать из этого switch-case: https://godbolt.org/z/MnYse7PPc

iliasam Dec 28 2023 at 16:30

Вот это сразу вспомнил: https://github.com/AceLewis/my_first_calculator.py

8street Dec 29 2023 at 08:20

Если это кажется тупым и работает, то это не тупо. (с)

kAIST Dec 29 2023 at 13:10

Дурацкая поговорка, наравне с "работает - не трогай" ;)

Fil Dec 28 2023 at 17:02

Куча if-ов - это уровень мидла, не выше. Сеньерское же решение будет таким:

bool is_even(int n) {
    return n == 0 ? true : is_odd(n - 1);
}

bool is_odd(int n) {
    return n == 0 ? false : is_even(n - 1);
}

Mayurifag Dec 28 2023 at 18:09

Стало быть, в техлидском решении ещё и n == 0 в отдельную функцию вынесется, чтобы соблюдался DRY? :)

VADemon Dec 28 2023 at 18:53

У сеньера стек переполняется, тогда как у мидла нерекурсивное решение и лучше масштабируется (покуда хватит памяти и времени).

vadimr Dec 28 2023 at 19:11

Стек в данном случае не переполнится, компиляторы Си умеют оптимизировать хвостовую рекурсию.

gev Dec 29 2023 at 02:29

Только ее тут нет =)

zagayevskiy Dec 29 2023 at 12:56

есть

Osnovjansky Dec 29 2023 at 03:51

Вот вы тут шутки шутите, а потом вам это всерьез чатжпт напишет

IkaR49 Dec 29 2023 at 11:19

Ну и отлично! Устраняем будущих конкурентов ;)

zzzzzzzzzzzz Dec 28 2023 at 18:46

изучив ограничения формата Portable Executable (.exe) для Windows, я обнаружил, что он не может обрабатывать больше, чем жалкие 4 ГБ

Мне кажется, что подход с автоматизированно-ручным написанием опкодов избыточно сложен для такой простой задачи.

Я бы на вашем месте воспользовался паттерном "разделяй и властвуй" и поэкспериментировал бы с созданием нескольких DLL-файлов, каждый из которых отвечает за свой диапазон чисел.

При таком подходе первичный работающий прототип можно получить довольно быстро. И далее уже смотреть в сторону оптимизации по скорости работы: чем меньше по размеру DLL-файл, тем быстрее он будет отрабатывать, но вместе с уменьшением размера будет расти количество файлов, соответственно, будет замедляться подгрузка файлов средствами ОС.

nronnie Dec 29 2023 at 07:26

"Разделяй и "властвуй" это будет:

public static bool IsEven(int n) => n switch {
    < 0 => IsEven(-n),
    0 => true,
    1 => false,
    _ => IsEven(n / 2) && IsEven(n - n /2) || IsOdd(n / 2) && IsOdd(n - n / 2)
}

public static bool IsOdd(int n) => !IsEven(n);

DrGluck07 Dec 29 2023 at 10:10

Тоже сразу подумал про несколько DLL. Или можно вообще ничего не генерировать заранее, а создавать код в рантайме для диапазонов по миллиону чисел, например. Тогда exe-шник будет маленький, и даже не очень много памяти попросит.

Upd: Кстати, это позволит не ограничивать себя 32-битами.

UGivi Dec 29 2023 at 11:58

Первая мысль при чтении про невлезание в размер "а когда-то для такого использовались оверлеи".

viordash Dec 28 2023 at 19:01

мне кажется у джуна из тиктока более производительный код, за счет else if

ProMix Dec 28 2023 at 19:52

Требую бинарный поиск на if-else!

DBalashov Dec 29 2023 at 12:14

в switch/case он и так может соптимизироваться в бинарный поиск.

Dredlock Dec 28 2023 at 19:49

А зачем писать столько много?

Ведь можно отбросить все цифры, кроме последней. И работать с ней. Всего 10 if.

А можно и двумя обойтись

if(n==1||3||5.... И тд

jaqjaq Dec 29 2023 at 09:47

В вашем примере разве 3 и 5 не будут всегда давать True?

может тогда:

if(n==1 || n==3 || n==5)

Dredlock Dec 29 2023 at 15:21

Да, вы правы. Спасибо что поправили. Я писал в виде псевдокода, в общем вижу что идею мою поняли

krabdb Dec 28 2023 at 19:49

А когда русскоязычное написание фамили Денниса как «Ритчи» сменили на «Ричи»? А Кернигана тоже на кого-то поменяли?

artemisia_borealis Dec 29 2023 at 01:44

Да, Росс ван дер Гуссом предложил несколько вариантов.

glebe Dec 28 2023 at 19:59

А разве недостаточно было проверять только последнюю цифру числа. Десяток ифов всего.

nochkin Dec 29 2023 at 20:15

С таким успехом мы можем скатиться до позорной проверки младшего бита. Это не наш стиль. Мы должны дать отпор возрастающей мощности современных вычислительных систем.

Moog_Prodigy Dec 28 2023 at 20:21

Надо было просто на CUDA все переложить. Я думаю, последние ускорители типа N100 должны справиться с подсчетом четных чисел. /s . Далее нам понадобится суперкомпьютер из топ100 для подсчета числа счастливых билетов.

Ну честно, какая то машина Голдберга получается с этими подходами)

belch84 Dec 28 2023 at 23:36

Вот, с помощью BING'а набросал нечто подобное на SQL

Код для определения четности/нечетности числа на TRANSACT SQL

-- Create a stored procedure named CheckEven with one int parameter
CREATE PROCEDURE CheckEven @num int
AS
BEGIN
-- Declare a variable to store the result of the query
DECLARE @result int, @numint ;

-- Create a table named EvenNumbers with one field of int type
CREATE TABLE EvenNumbers (
Number int
);

-- Set a variable to store the current number
SET @num = 2;

-- Use a while loop to insert numbers from 2 to 32766 into the table
WHILE @num <= 32766
BEGIN
-- Insert the current number into the table
INSERT INTO EvenNumbers (Number) VALUES );

-- Increment the current number by 2
SET @num = @num + 2;
END

-- Select the count of the number from the EvenNumbers table
SELECT @result = COUNT(Number) FROM EvenNumbers
-- Use the parameter as the filter condition
WHERE Number = @num;

-- If the result is greater than zero, the number exists in the table
IF @result > 0
BEGIN
-- Print 'even' as the output
PRINT 'even';
END
-- Else, the number does not exist in the table
ELSE
BEGIN
-- Print 'odd' as the output
PRINT 'odd';
END
END

Преимущество этого кода в том, что данные для определения четности можно хранить во внешней памяти. Не ручаюсь за выполнимость кода, но идея должна быть понятной - создаем таблицу, заполняем ее четными числами, потом определяем, есть ли искомое число в этой таблице

nronnie Dec 29 2023 at 15:19

WITH
    OddOrEven(Num, IsEven)
    AS
    (
        SELECT CAST(0 AS int) Num, CAST(1 AS bit) IsEven
        UNION ALL
        SELECT
            oev.Num + 1 Num,
            CASE
                WHEN oev.IsEven = 0 THEN CAST(1 AS bit)
                ELSE Cast(0 AS bit)
            END IsEven
        FROM OddOrEven oev
        WHERE oev.Num < POWER(CAST(2 AS bigint), 31) - 1
    )
SELECT IsEven
FROM OddOrEven
WHERE Num = @num;

iboltaev Dec 29 2023 at 00:25

Я понимаю, что это чисто поржать, но хоть бы массив забил что ли битовый статический, чтоб за о(1), или каскадировал через <, чтоб хотяб за логарифм...

debagger Dec 29 2023 at 02:27

Тут уже предлагали выше решить такую задачу на микросервисах. Я предлагаю пойти дальше. Чтобы по-настоящему хайпануть на трендах, надо взять какую-нибудь LLM архитектуру где-нибудь на 40B параметров и обучить исключительно на эту задачу. Считаю что это будет гораздо эпичнее.

Melirius Dec 29 2023 at 05:30

И получить после обучения на пятизначное число долларов точность ответа более 90%!

bolk Dec 29 2023 at 12:24

Думаю, нужно сделать клиентское приложение, которое надо качать и ставить себе. Установившие такие приложения становятся нодами единой сети. Нода будет брать задачи из единого реестра, вычислять чётность/нечётность и отдавать результат в сеть. Задачу должны взять себе несколько нод, так чтобы один из ответов (чёт или нечет) был больше 50% мощности сети.

debagger Dec 29 2023 at 12:48

С таким подходом можно уже и на 64 бит замахнуться

amarkevich Jan 5 2024 at 19:42

данные представить в виде блокчейна

prinv Dec 29 2023 at 06:39

Хабр неостановимо пробивает днище за днищем

DrGluck07 Dec 29 2023 at 10:18

А можно няню, плиз? В чём конкретно заключается пробивание дна в данном случае?

nronnie Dec 29 2023 at 15:22

Не забивайте голову, это у некоторых чувство юмора пробивает дно :)

kAIST Dec 29 2023 at 13:13

Редкая статья про программирование, пусть и ненормальное. Это хуже чем все остальное?

Error1024 Dec 29 2023 at 07:40

Я сторонник высокопроизводительного кода, поэтому решил реализовать это на языке программирования C, потому что он и сегодня остаётся самым быстрым языком в мире с большим отрывом от других (благодаря гению Денниса Ричи).

Мне кажется, или тут полное не понимание того, что секрет скорости не в некой «гениальности» си, а в миллиардах, вбуханных, в конкретные компиляторы? Странно такое видеть от человека, заявляющего что он «сторонник высокопроизводительного кода». Впрочем, современные последователи карго культа «блейзинг фаст» +/- все что-то подобное заявляют.

DimaFromMai Dec 29 2023 at 08:42

Не стоит преуменьшать заслуги Ричи, всегда считал, что секрет скорости ЯП в близости к железу, правда стоит уточнить, чем дальше от железа, тем быстрее разработка зато. Автор молодец, так заморочиться, спасибо, интересно было почитать.

mayorovp Dec 29 2023 at 09:12

Если бы автор написал как-то по-другому, ему не удалось бы написать шутку про Python ниже по тексту. А зачем вы пытаетесь искать глубокое понимание чего бы то ни было в откровенно стёбной статье?

Kelbon Dec 29 2023 at 13:28

эм, причём тут компиляторы, если питон в любом случае будет медленнее. На С можно писать код так, что его будет практически невозможно оптимизировать (т.к. он будет оптимален)

alexeyinkin Dec 29 2023 at 08:43

Даже если каждое сравнение будет использовать меньше одного байта, файл всё равно будет слишком тяжёлым.

Не факт.

Mdm3 Dec 29 2023 at 09:05

Надеюсь эта статья не попадет в обучение следующих версий gpt

lamer84 Dec 29 2023 at 13:59

Так наоборот, пускай попадает! Меньше конкуренция будет!

KvanTTT Dec 29 2023 at 16:26

Надеюсь он уже достаточно умный, чтобы не воспринимать такую инфу за чистую монету.

nochkin Dec 29 2023 at 20:18

Его восприятие будет сильно зависеть от комментов.

Panzerschrek Dec 29 2023 at 09:16

https://godbolt.org/z/7qE9863j4
Clang с O2 оптимизирует цепочку сравнений до выборки указателя из таблицы с последующим вызовом puts. Другие компиляторы не осиливают оригинальный код и оставляют кучу инструкций ветвления.

AleksejMsk Dec 29 2023 at 09:47

На C# я могу хоть триллион IF сделать.
Шаг №1 - Генерирую DLL на N штук IF - загружаю в память и использую
...
Шfг №M - Генерирую DLL на N штук IF - загружаю в память и использую

В итоге N * F операторов IF.

Вуаля !

Iridar Dec 29 2023 at 09:47

Зарегался чтобы поставить лайк.

pythonist1234 Jan 8 2024 at 13:04

Но ведь с нулевой кармой лайки ставить нельзя...)

Nikolyanich Dec 29 2023 at 09:47

А не проще проверять последний бит числа

Если 1 четное иначе нечётное?

Всего 1 строка...

DrGluck07 Dec 29 2023 at 10:14

Это не путь самурая.

zagayevskiy Dec 29 2023 at 13:00

Serdjuk Dec 29 2023 at 09:47

Простите, это что за наркомания ?
Value And 1 для слабаков ?
Проверка нулевого бита, алле...

DrGluck07 Dec 29 2023 at 10:16

Этот комментарий пост-мета-ирония? Правда же?

Serdjuk Dec 29 2023 at 17:42

Нет

starik-2005 Dec 29 2023 at 21:27

Ну так задача же стояла сдделать так, как в тиктоках, а не так, как правильно. Ито же стеб над стебом, но с позиции силы.

И да, программа бесполезная, но рабочая. Неужели это приходится объяснять?

Wesha Dec 29 2023 at 10:54

Мы всегда знали, что лучший способ отделить людей от роботов — это обсуждать шутки юмора. Вот ты и попался, железяка!

z3apa3a Dec 29 2023 at 10:53

Тема с оптимизацией алгоритмов не раскрыта КМК, можно было бы на питоне сгенерировать дерево if'ов. Код конечно слегка вырастет, зато какой прирост производительности!

Maccimo Dec 29 2023 at 11:25

Не совсем корректный ассемблерный код

Судя по подсветке синтаксиса, это вообще код на 1С ;)
Считаю, что о читаемости кода забывать нельзя и потому вместо INC EAX обязательно нужно было использовать SETE EAX.

я решил отобразить файл в адресное пространство, а не читать его целиком. Сделав так, мы притворимся, что весь файл уже находится в памяти

Досовские com-файлы восстают из пепла под 64-битной виндой, это ли не новогоднее чудо???

Автор выбрал другие хабы, там 5 ограничение, а так да может подойти.

@denis-19 «Ненормального программирования» здесь всё же больше, чем «алгоритмов».

P.S. При переводе потерялась часть шуток-прибауток из оригинала, читайте оригиналы!

akaluth Dec 29 2023 at 11:27

Прошу рассмотреть возможность оформить это как npm-пакет через ffi, постоянно возникает такая задача

yri066 Dec 29 2023 at 13:01

Когда учился универе, было групповое задние на семестр заниматься разработкой 16-бит ОС (не обязательно чтобы была полностью рабочей), и у меня было одно из заданий: реализовать динамическое распределение памяти malloc. При работе нужно было для теста выводить в консоль распределение памяти, но при этом была проблема, что функция для печати числа использовала память для перевода его в строку при печати. Для того чтобы тестировать память и печатать числа без выделения памяти, пришлось сгенерировать файл на 40к строк:

if(num == 123) {kprint("123");};

x67 Dec 29 2023 at 16:16

Ну, нет предела совершенству, можно же через if-else реализовать бинарные деревья, что сохранит нам один условный оператор и сильно увеличит скорость выполнения программы

KvanTTT Dec 29 2023 at 16:27

Было больно читать статью и комментарии, но я справился.

kh0 Dec 29 2023 at 19:24

Шикарная статья, получил море удовольствия, жду следующую:
"жервуем дисковым пространством ради скорости проверки на четность", где автор забьет ССД файлами с именами четных чисел и потом будет проверять четность наличием файла на диске.
Можно значительно уменьшить пенальти времени поиска файла, если хранить файлы не в виде папки с файлами, а в виде дерева подпапок с файлами, чтобы в каждой папке было не больше. Это был путь слабых.
А путь сильных это создать 4Гб файл на диске из 1 и 0, и при провере сикать по параметру сразу на позицию чтения. Смех-смехом, но подобная парадигма скорей всего это будет самой быстрой проверкой чисел "на простоватость".)

Boggard Dec 29 2023 at 20:40

это уже напоминает попытку хранить настройки файлового менеджера в оракл бд.

AtmosferaVA Dec 29 2023 at 20:12

Очень любопытная тема с написанием огрызка компилятора Си/Ассемблера на Питоне который собирает исходники прямо в код процессора!

Существуют ли примеры компиляторов прямо в машинный код написанных на Питоне?

nronnie Dec 29 2023 at 20:44

Еще вариант (C#) - для int тут не получается (из-за встроенного лимита на длину массивов), но для short вполне:

using System.Linq.Expressions;

var param = Expression.Parameter(typeof(short));

var trueFalse = new[] {
    Expression.Constant(true),
    Expression.Constant(false)
};

var body = Expression.Switch(
    param,
    defaultBody: trueFalse[1],
    Enumerable.Range(0, short.MaxValue + 1)
        .Select(i =>
            Expression.SwitchCase(
                body: trueFalse[i % 2],
                Expression.Constant((short)i)))
        .ToArray());

var isEven = Expression.Lambda<Func<short, bool>>(body, param).Compile();

for (short i = 0; i <= 42; i++)
{
    Console.WriteLine($"{i}: {isEven(i)}");
}

maxcat Dec 30 2023 at 01:52

можно создать массив с длиной расзмером с long или же int64, но конечно не через Enumerable.Range(..)

nronnie Dec 30 2023 at 03:12

Не, по-моему таки нельзя. Для одномерных массивов максимальное число элементов ограничено значением свойства Array.MaxLength - и, во-первых, оно уже объявлено как int и больше чем int.MaxValue быть не может, во-вторых, если покопаться в исходниках, то выясняется, что там оно захардкожено как 0X7FFFFFC7, что даже немного меньше чем int.MaxValue. Для многомерных массивов теоретически методы класса Array поддерживают размеры в long, но, на деле (опять-таки, если посмотреть в исходники) этот long там везде приводится к int, и если он в него не влезает, то мы сразу получаем ArgumentOutOfRangeException, и, даже более того, если он помещается в int, но не помещается в Array.MaxLength то тогда получаем OutOfMemoryException с сообщением "Array dimensions exceeded supported range."

maxcat Jan 1 2024 at 13:25

Вы правы.

Тогда для решения можно попробовать использовать int64[2][int32.MaxValue][int32.MaxValue]

EDIsaev Dec 30 2023 at 03:25

Не уж то чудооптимизатор сей не соптимизировал мильён ифов? Не пробовали? Просто интересно... Он, порой, такие оптимизации лепит, что суть всего алгоритма меняет)

amberovsky Dec 30 2023 at 13:39

Как насчёт использования оптимизированной функции в if-ах

bool optimised_is_even(int number) {
  bool res = true;
  for (int i = 0; i < number; i++)
    res = !res;

  return res;
}

wasd_0 Dec 30 2023 at 22:10

Очень познавательная статья, добавил в закладки везде, даже на микроволновке!

Жду реализацию программы "FizzBuzz". Планируете ли выпускать книгу по вашим работам?

ilsemenov Dec 31 2023 at 13:38

С нетерпением жду захватывающего продолжения с нахождением остатка от деления, реализованного ифами на ассемблере)

NeoCHROM Dec 31 2023 at 20:42

А можна исходник на гитхаб? ?

Afranius Jan 3 2024 at 09:41

Коллеги, кто-нибудь попробуйте решить эту задачу на FreePascal для чисел разрядностью x64

What_Is_L0ve Jan 3 2024 at 19:59

Главный вопрос - зачем?))) Ну а если серьёзно, то только через подобные эксперименты узнаешь о разных тонкостях компиляторов/ОС.

krontill Jan 22 2024 at 08:53

Спасибо что не выложили весь исходный код в статью =)