@haqreu18 сен в 08:05

Санпросвет о плавающей точке, статья первая: компьютеры и числа

Простой

9 мин

13K

Программирование * Математика * C++ * Алгоритмы * Ненормальное программирование *

Туториал

+79

Комментарии 59

@vadimr 18 сен в 08:29

«Плавающая запятая является случайной/ненадежной»: арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754. Результаты могут быть неожиданными, но не произвольными.
Стандарт IEEE требует, что все реализации должны давать точные, бит-в-бит результаты для КАЖДОЙ операции, для которой результат может быть представлен, и ближайшее значение для остальных.

В теории да, но в практических реализациях это не всегда так.

@haqreu 18 сен в 08:36

Ну если вы включили флаг --ffast-math, или каким-либо другим образом ушли от стандарта, то да. Я же говорю про стандарт, которому следует по умолчанию большинство как софта, так и железа.

@vadimr 18 сен в 08:55

Вот это:

арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754

– неверно.

Даже если не касаться того, что есть процессоры, реализующие плавающую арифметику не в соответствии с IEEE754 (например IBM z), но и все остальные следуют IEEE754 только при определённых условиях, и то не факт, поскольку никто не проверял все возможные значения. Поэтому, на мой взгляд, вы тут очень упрощаете реальную ситуацию. Я считал бы предположение о том, что любая конкретная программа на конкретном процессоре работает в точном соответствии с IEEE754 и имеет побитово предсказуемый результат, излишне оптимистичным.

Более того, приходилось сталкиваться с этой проблемой в продакшене.

@haqreu 18 сен в 09:00

Ну проверять все возможные значения ни к чему, достаточно корректно реализовать алгоритмы вычислений. Да, есть некоторое количество железа, которое отходит от ieee754. И более того, существуют вообще другие системы плавающей точки (например, позиты), но это не вносит в жизнь ни недетерминированности, ни магии.

@vadimr 18 сен в 09:08

Магии никакой нет, но недерминированность есть в том смысле, что программист не знает, запустит ли пользователь, например, его программу на процессоре Intel или AMD, а реализация плавающей арифметики на них различается.

достаточно корректно реализовать алгоритмы вычислений

А что такое, по-вашему, корректная реализация? Никто в процессоре бесконечные ряды Тейлора не суммирует, там в любом случае используются аппроксимации, причём иногда весьма неочевидные.

@haqreu 18 сен в 09:13

Ну вообще даже стандарт, насколько я помню, от всяких тригонометрических функций не требует ничего очень строгого. Побитовое воспроизведение должно быть для четырёх арифметических операций, так что про суммирование рядов Тейлора речи не идёт.

Из моего опыта, основной источник недетерминированности результата - это непостоянство порядка вычислений (например, при многопоточных вычислениях).

Я же напрямую в статье сказал, что не нужно надеяться на побитовое сравнение, если были нетривиальные вычисления.

@vadimr 18 сен в 09:20

Насколько я помню, даже одна отдельно взятая машинная команда вычисления квадратного корня даёт разные результаты в младшем бите на разных процессорах.

@haqreu 18 сен в 09:21

Квадратный корень не является одной из четырёх арифметических операций...

@vadimr 18 сен в 09:24

От этого, типа, должно быть легче?

@haqreu 18 сен в 09:32

Видимо, кому как. Мне - да. Я часто и много работаю с точными вычислениями на числах, представленных в плавающей точке. Работает как на интеле, так и на амд. А также на большинстве современных графических ускорителях и т.п.

Приведу пример крайне широко используемого кода/статьи от Джонатана Шевчука:

https://www.cs.cmu.edu/~quake/robust.html

@IgorPie 13 окт в 21:21

денормализованные числа стучат снизу. и если одно действие не врет, то даже перестановка оптимизатором mac операций дает различный результат. + процессоры перед ними сравнительно беспомощны (подаешь на блок фильтров ноль и время выполнения растет в 6 раз)

@haqreu 18 сен в 09:20

Кстати, можете привести пример в несколько строк C++, который даст разные результаты на intel/amd?

@vadimr 18 сен в 09:31

У меня под рукой нет, но я пару раз приводил уже это на хабре в комментариях, можно поискать здесь или в интернете, если интересно.

@vadimr 18 сен в 11:22

Нашёл всё-таки:

#include <stdio.h>
#include <string.h>
int main(void) {
  float in = 256;
  float out;
  unsigned int raw;
  asm ("rsqrtss %1,%0" : "=x"(out) : "x"(in));
  memcpy(&raw, &out, 4);
  printf("out = %x, float = %f\n", raw, out);
  return 0;
}

Intel можно посмотреть, например, здесь: https://onecompiler.com/cpp/43x3t4pmn

out = 3d7ff000, float = 0.062485

AMD можно посмотреть, например, здесь: https://www.codingshuttle.com/compilers/cpp/

out = 3d7ff800, float = 0.062492

@haqreu 18 сен в 11:42

Во-первых, разговор шёл об арифметических операциях, которыми квадратный корень не является. А во-вторых, операция rsqrtss, серьёзно?

Computes an approximate reciprocal of the square root
[cut]
The relative error for this approximation is:
|Relative Error| ≤ 1.5 ∗ $2^{−12}$

@vadimr 18 сен в 11:43

Во-первых, разговор шёл об арифметических операциях, которыми квадратный корень не является

Когда это он шёл?

У вас написано:

арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754

Если вы под "арифметикой с плавающей запятой" подразумеваете только собственно арифметические операции, то это надо бы как-то специально оговорить, потому что обычно этот термин включает все операции процессора над числами с плавающей запятой. Да и примеры в вашей статье ими не ограничиваются, включая возведение в степень.

@haqreu 18 сен в 11:48

И вы тут же цитируете фразу со словом арифметика :)

Конечно, корень можно притянуть за уши к арифметическим операциям, но это надо постараться.

@vadimr 18 сен в 11:51

Слово "арифметика" в инженерном смысле не означает именно арифметические операции в математике.

@haqreu 18 сен в 11:58

Да бог с ней, с арифметикой. Ваш пример, к сожалению, не подходит, поскольку функция rsqrtss не обязана давать точный ответ.

Ещё раз, я не говорю, что не существует железа, которое не соответствует стандарту ieee754, равно как и флаг --ffast-math в GCC никто не убирал (но подозреваю, что вы не найдёте нормального примера, который даст разницу на intel/amd).

Я говорю про то, что в подавляющем большинстве случаев проблемы не в этом, а в неполном понимании того, как компьютеры манипулируют числами.

@vadimr 18 сен в 12:05

Ваш пример, к сожалению, не подходит, поскольку функция rsqrtss не обязана давать точный ответ.

Тем не менее, он отвечает на ваш вопрос о программе, которая даёт разные результаты на intel/amd.

но подозреваю, что вы не найдёте нормального примера, который даст разницу на intel/amd

Пример я вам, действительно, сейчас не в состоянии привести, но практически такую программу, написанную на обычном языке высокого уровня, встречал. Это была не моя программа и я не знаю, докопались ли там до конкретной машинной инструкции. В том случае проще было запретить запуск на AMD.

Однако, как вы верно заметили, флаг --ffast-math никто не убирал.

Я говорю про то, что в подавляющем большинстве случаев проблемы не в этом, а в неполном понимании того, как компьютеры манипулируют числами.

Про подавляющее большинство случаев я с вами никоим образом не спорю. Я возразил только против излишней категоричности вашего утверждения.

@haqreu 18 сен в 12:08

Тем не менее, он отвечает на ваш вопрос о программе, которая даёт разные результаты на intel/amd.

Есть другая функция, которая по дизайну тоже не обязана давать одинаковые значения, rand() называется.

@findoff 18 сен в 11:42

Ну те алгоритм приближенного вычисления обратного квадратного корня дает разные результаты на разных процах, и тут конечно же виновата плавающая точка...

@vened 18 сен в 09:29

В теории да, но в практических реализациях это не всегда так.

Из опыта, основная проблема в том, что разработчики делают неверное обобщение и полагают, что можно обычным способом сравнивать значения переменных, имеющих тип float. То есть, дело не в сравнении конкретной записи – это сравнение определено как побитовое, и в стандарте оно строгое, детерминированное. Формально, два строгих float сравниваются точно. Но это не обобщается. Дело в том, что float – это не число, а некоторый алгоритм. Поэтому, концептуально, нужно сравнение понимать так, как если бы сравнивались алгоритмы.

Собственно, в статье примерно про это и написано:

Настоящее правило: избегайте ==, если значения прошли через сложные вычисления, в которых округление может отличаться.
Не полагайтесь на то, что алгебраические законы (ассоциативность, дистрибутивность) действуют точно.

Я бы только подчеркнул, что ни ассоциативность, ни дистрибутивность – не могут действовать "не точно", по определению. Поэтому-то и не нужно полагать, что эти свойства есть во float. Дистрибутивность, скажем, там не работает в совсем простых случаях – вот я недавно приводил пример: https://dxdt.ru/2025/08/31/16204/

@lgorSL 18 сен в 21:05

Да и с неработающей ассоциативностью несложно привести пример
1е20 + (-1е20) + 1.

@haqreu 18 сен в 21:13

Я ещё люблю накопление ошибок вычислений показывать таким примером. Сравните вывод двух программ:

from fractions import Fraction
x = Fraction('1/10')
for _ in range(80):
    print(x)
    if x>1/2:
        x = 2*x-1
    else:
        x = 2*x

x = 1/10
for _ in range(80):
    print(x)
    if x>1/2:
        x = 2*x-1
    else:
        x = 2*x

@haqreu 18 сен в 21:17

Кстати, с ассоциативностью у меня в статье есть пример куда проще вашего (в том смысле, что никаких огромных чисел не требует).

@forever_live 18 сен в 22:21

Между прочим, большинство целых чисел тоже невозможно невозможно записать в вашем компьютере, даже если вы разрешите использовать int64.

@KvanTTT 18 сен в 22:41

А некоторые операции с вещественными числами можно выполнять точно, если использовать символьные вычисления. Правда это как правило непрактично.

@forever_live 18 сен в 23:07

Ну про некоторые операции с вещественными числами и в статье есть. Которые могут выполняться даже без символьных вычислений.

Я так когда-то подобрал два коэффициента масштабирования, 0.8 и 1.25, для плавного масштабирования графиков.

@haqreu 19 сен в 04:44

Самое главное, что все целые числа вычислимы. Не обязательно хранить все цифры числа в памяти одновременно, для того, чтобы с ним манипулировать.

@forever_live 20 сен в 18:30

Но где-то их хранить всё равно придётся. В какой-то памяти, не обязательно оперативной.

@haqreu 20 сен в 18:42

Смотря для чего оно вам нужно. Если просто посмотреть, то выдавать на экран цифру за цифрой. Если для других вычислений, то наверняка можно их сделать для потока цифр, а не для полного набора.

@forever_live 21 сен в 04:37

Ещё раз. Откуда возьмёте этот поток? Где он лежать будет, ожидая, пока Вы захотите на него посмотреть? Если в целом числе будет двоичных цифр на десять порядков больше, чем атомов во Вселенной? А таких чисел гораздо больше, чем тех, которе можно записать количеством цифр меньше, чем атомов во Вселенной.

@haqreu 21 сен в 13:54

А чем целое число (а оно конечное) хуже бесконечного числа пи, для которого мы умеем строить поток цифр?

Я выдвигаю гипотезу, что для любого наперёд заданного целого числа, даже сколь угодно большого, можно написать программу для современного компьютера, которая выдаст поток его цифр.

Скрытый текст

Тонкий нюанс: я ловко опустил момент, как именно указывать число, которое надо высчитывать.

@Jessy1821 19 сен в 12:34

Наконец-то нашёл людей кто пишет всё с нуля без ненужных библеотек и делают их сами. Я сам пишу сейчас нейронку-компаньёна на Python, но библеотеки не использую вплоть до лингвистического анализатора и автаматического генератора ответов хотя я новичок в этой сфере))

@sci_nov 19 сен в 17:28

А почему вы выбрали знаковый int?

@haqreu 19 сен в 17:31

Не очень понял, для чего?

@sci_nov 19 сен в 17:32

Для моделирования float.

@haqreu 19 сен в 17:37

По-прежнему не очень понимаю. Я не упаковываю всё в четыре байта, у меня есть раздельная структура с полями знака, экспонента и мантиссы:

https://github.com/ssloy/tinyfloat/blob/main/tinyfloat.h

@sci_nov 19 сен в 17:39

А, в коде всё нормально, а в статье идёт упоминание об int32_t.

@haqreu 19 сен в 17:43

А, понял. В моём игрушечном языке только знаковые 32-битные числа, поэтому я извращался, когда рейтрейсер писал. И флоат приходится в int упаковывать, и константы писать, которые влезают в него... Видимо, поэтому я и упомянул про int32_t

    int fp32_flip_sign(int fp) {
        if (fp >= 0) {
            return (fp - 1073741824) - 1073741824;
        } else {
            return (fp + 1073741824) + 1073741824;
        }
    }

@sci_nov 19 сен в 17:47

Ну, если нет битовой магии, то int можно использовать. Фактически, как индекс.

@sci_nov 19 сен в 17:45

Используя float, можно напечатать точное значения любой целой степени двойки насколько позволяет ёмкость выбранного float.

@haqreu 19 сен в 17:47

А как это поможет? Кроме того, используя корректно реализованный флоат, что не совсем тривиальная задача. А у меня вывод на экран идёт ещё до реализации сложения. И нужен, в частности, для отладки реализации.

@sci_nov 19 сен в 17:48

Да это просто интересный факт.

@forever_live 20 сен в 18:50

Кстати, ещё замечание. 10^30 -- довольно небольшое число. Не самый удачный пример.

Это отлично для точности, но плохо для диапазона: вы не можете представить и $10^{-30}$ , и $10^{30}$ , если не используете тысячи битов.

Динамический диапазон 10^60 -- это примерно 2^200. Нужно не больше 200 бит. Если взять 1000 бит, то динамический диапазон вырастет ещё в пять раз.

@haqreu 20 сен в 19:02

Ай, не цепляйтесь к словам. Даже для обычного float вам нужно 277 бит, чтобы вместить все значения. А для double и вовсе 2098 бит...

@forever_live 21 сен в 04:47

Ну да, если бы было написано сотни бит, а не тысячи битов, то придраться было бы гораздо сложнее :)

В любом случае эта работа -- хороший способ для саморазвития.

Кстати, удивлён, что не нашлось никаких открытых софтовых реализаций float арифметики. Как минимум должны же быть библиотеки эмуляции 8087 для многих популярных языков. Ну Борланд мог не распространять свой блоб для Паскаля и Си в исходниках, тем более там не была бы открытая лицензия. Но ведь были и другие.

Как-то видел, и даже использовал чью-то библиотеку трёхбайтного float для 8051, но это несколько не тот стандарт, конечно, который Вам нужен.

@haqreu 21 сен в 13:50

Открытые есть, тот же Беркли софтфлоат. Но оно слишком оптимизировано для моих нужд

@ImidgX 26 сен в 21:25

А можно представить вещественное число, где часть бит используется для хранения числа, как если бы оно было целым, а часть бит для хранения позиции запятой? (извиняюсь, если мой вопрос наивный и я "переизобретаю велосипед")

@findoff 26 сен в 22:16

Ну оно на самом деле так и есть, но с нюансом, что число это в двоичной системе... От туда и проблемы, о чем эта статья и повествует.
В БД для денег есть decimal/numeric тип, который как раз так и работает с десятичными, но в таком виде это все не очень производительно.

@ImidgX 27 сен в 19:27

По-скольку автор пишет про свой язык и самописную библиотеку обработки вещественных чисел к нему, плюс пишет не на ассемблере (где сдвиг бита более чем оправдан), и за высокой производительностью не гонится, я подумал, что у него есть какое-то объяснение по моему вопросу. 🤔

Ведь, если опустить вопрос производительности, работа с данными с фиксированной запятой, как мне кажется, должна полностью снять вопрос о неточности вычислений вещественных чисел. Разве нет?

Как и в денежных операциях, как мне кажется, в большинстве случаев, можно ограничится определенной конкретной и достаточной точностью. 🤔

@findoff 27 сен в 19:39

Сразу оговорюсь, я сам очень любитель, и могу нести чушь...
Но насколько я понимаю, мы либо пользуемся аппаратными методами, которые быстры и оптимально упакованы, но двоичные. Либо используем алгоритмы на вроде деления в столбик/
Иии, если не касаться денег, то во всех остальных случая двоичные выгоднее. Причем не только по производительность, но и по упаковке в памяти.
Потому что в деньгах важна точность относительно документов и именно в 10й системе счисления.
В физиках и прочем, не важная 10я система сама по себе, а важна точность.
Если же говорить про математику в чистом виде, то насколько я это понимаю, например PI мы не запишем в точном виде ни в какой, кроме PIичной системе счисления. Так что та же длинная математика со "столбиками" все равно выгоднее в двоичном виде.

@ImidgX 27 сен в 20:38

В слове выгоднее, я слышу, так аппаратно считают компьютеры, т. е. речь всё же про производительность в ущерб математической точности, с которым приходится мириться. 🤔

И, как пишет автор, в компьютерных вычислениях вещественных чисел погрешность будет всегда. Так почему бы не ограничиться определённой точностью (ведь в большинстве случаев, как мне кажется, этого будет достаточно), в границах которой вычисления будут давать математическую точность, как в примере автора (0.1+0.2)+0.3 = 0.1+(0.2+0.3)

Как вы считаете?

@findoff 27 сен в 20:49

Мне кажется про точность вы не совсем поняли мысль.
0.1+0.2 это не погрешшность компьютера, это погрешность перевода из систему в систему.
Физика и математика не привязаны к десятичной системе счисления, а конкретные константы могут быть как точными в обоих, так и более близкими(при меньшем размере) к двоичной...
Те условно если у нас константа 0.5, это 1 бит данных в двоичной при фиксированной точности, и целых 4 в десятичной при той же фиксированной точности. А если не говорить не про производительность не про хранение, то сравнение ИМХО вообще теряет смысл. (поскольку что 10, что 2, не дают точно записать например PI)

@haqreu 27 сен в 19:46

Если опускать вопрос производительности, зачем фиксировать запятую? Её же невозможно зафиксировать удовлетворительно для всех задач. Рациональные числа с бесконечной точностью покроют любой спектр задач. Только вот производительность всё же диктует...

@ImidgX 27 сен в 20:44

Чтобы это выражение было истинным

Здесь нет необходимости, в бесконечной точности, достаточно одного знака после запятой, как мне кажется в большинстве программистских задач. 🤔

И как программист выбирает подходящий способ решения поставленной задачи, например для денежных операций, почему бы не использовать в вычислениях до определённой точности библиотеку вычислений с фиксированной запятой?

@haqreu 27 сен в 20:50

Так, собственно, никто не мешает использовать целочисленную арифметику, если она вам подходит, например, в финансах. Проблема приходит тогда, когда вам нужно работать одновременно с гигантскими числами, и с очень маленькими. В физике, например, сплошь и рядом такое.

@ImidgX 27 сен в 21:11

💡 Спасибо за пояснение.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий