Comments / Profile of funny

Юрий Соколов@funny_falcon

Программист

@funny_falcon Nov 8 2024 at 05:41

В случае же с явными перечислениями тебя компилятор носом потыкает - что вот тут и тут и еще вот тут с новой версией библиотеки возможен новый код ошибки, а у тебя ее обработка не предусмотрена

А теперь перейдём от компиляции к динамически подгружаемым библиотекам, и снова получаем: библиотека B обновилась, а библиотека A была не в курсе, что ей новый код ошибки обрабатывать.

Те же самые checked exceptions в Джаве были вашими «кодами возврата с обязательной проверкой». И так же программы не собирались, если не обработать новый тип исключения, который может быть выброшен из функции. Т.е. всё то, что вы ставите в плюс, в концепции исключений было. Но почему-то не прижилось.

Jujutsu — новая система контроля версий

@funny_falcon Oct 30 2024 at 21:46

Fossil - это не post-git. Да, это коробочное решение «все-в-одном»: wiki, issue tracker и, собственно, SCM. Да, есть какие-то улучшения благодаря использованию SQLite в качестве стораджа. Но концепция SCM там всё-же очень близка к Git: цепочки снапшотов.

Особенно не приятно, что в Fossil нет ребейзов веток. Ричард Хипп говорит, что в компании (разрабатывающей SQLite3) ребейзы объявлены вредными, и потому в Fossil они не реализованы. Это удерживает меня от экспериментов с Fossil, т.к. на примере некоторых old-school открытых проектов я вижу пользу линейной истории главной ветки.

Важные языки. Часть 1. Forth

@funny_falcon Oct 24 2024 at 21:43

Присоединюсь к соседнему комментарию: есть ли возможность использовать Оберон как промышленный язык? Если да, то какой стэк окружения вы посоветуете?

Корутины: stackful vs stackless

@funny_falcon Oct 16 2024 at 15:09

У Ruby Fiber - это Stackful корутины. Причём используют C стэк.

А у Lua хоть и stackful, но используют стэк виртуальной машины. (Кроме LuaJIT: он, емнип, тоже C стэк использует)

Размышления о Нобелевской премии по физике 2024

@funny_falcon Oct 11 2024 at 07:30

Спасибо, что расшифровали, за какие именно особенности нейросетей дали награду.

На самом деле, машинное распознание образов и поиск новых паттернов уже давно неотъемлемая часть современной науки. Точно знаю про астрономию: большинство открытий совершаются автоматизированным анализом снимков и данных уже десятилетия. Наверняка в других науках похожая история.

Под таким углом зрения считаю присужденную премию вполне заслуженной. Они действительно способствуют прорывам и в физике, и в других естественных науках.

Доктора Кнут, Моррис и Пратт, или Как я перестал бояться и полюбил префикс-функцию

@funny_falcon Sep 17 2024 at 03:53

И отсюда же следует, что для поиска первого вхождения подстроки нужен массив только для паттерна. А для итерационного нахождения всех подстрок, считать, что паттерн совпал только что при продолжении поиска.

А вообще, огромное спасибо! Очень круто всё разложено по полочкам! Вы сделали моё утро!

Удивительная история развития сортировки в JDK

@funny_falcon Sep 11 2024 at 19:31

На самом деле, если нет NaN, float легко сортировать как целые числа. Если только положительные, то вообще телодвижений делать не нужно.

Строки по первым символам тоже можно разбросать на мелкие бакеты, и потом применить обычную сортировку внутри бакетов. Правда, это если первые символы хоть как-то отличаются: массив интернетовских ссылок весь будет начинаться с http:// и https://

Оптимизация Linux задерживается: ушел главный разработчик проекта Rust for Linux. Но почему?

@funny_falcon Sep 11 2024 at 11:19

Я читал, что он был не главным и не самым активным.

Но одним из трёх, так что это всё равно потеря.

Удивительная история развития сортировки в JDK

@funny_falcon Sep 6 2024 at 21:39

Помню, как восхищенно читал про dual-pivot и пытался его реализовать для Go. Но в итоге реализовал обычный, т.к. с интерфейсом, основанным на Less многовато сравнений выходило, а вокруг каверзных паттернов все равно ворк-эраунды приходилось строить.

И всё равно продолжаю восхищаться.

В поисках оптимальной модели итераторов

@funny_falcon Sep 2 2024 at 06:41

Ещё забыли модель итераторов Lua.

-1

Применения Continuation-passing style в Go

@funny_falcon Aug 25 2024 at 17:16

Простите, но это не CPS. В CPS после вызова продолжения нет возврата в вызывавшую функцию, а у вас это везде. Т.е. tail call в продолжение - это не опциональная вещь, а обязательная. И defer тоже противоречит CPS.

CPS - это прежде всего способ либо промежуточного представления кода для оптимизации (доказано, что он эквивалентен SSA представлению), либо способ развертки синхронного кода в асинхронный (поищите CPC - Continuation Passing C).

Ещё, например, Chicken Scheme реализован через CPS: код Scheme транспиллится в C функции оригинального вида - функции всегда оканчиваются tail call в continuation и никогда не зовут return. Стэк растёт «бесконечно». А вернее, он параллельно используется как eden generation в GC, т.е. для аллокации объектов. И когда размер стэка доходит до предела, live объекты с него копируются в кучу, а стэк обрезается под корень (через longjmp). Не устаю восхищаться этим трюком.

Кстати, в Go тоже можно было бы реализовать через panic+recover. А в кучу Go и сам скопирует что нужно.

Исследование: российские работодатели разочаровались в стажёрах

@funny_falcon Aug 24 2024 at 17:22

За полгода можно обезьяну кодить научить

Я только после двух лет перестал хотеть уволить своего стажёра. Два года, чтобы из студента получился нормальный разработчик, за которым нужно проверять не каждую строчку подряд, а лишь каждую третью.

JPEG XL лучше всех, но Google против

@funny_falcon Aug 19 2024 at 16:52

ЕМНИП, у jpeg2000 были серьезные проблемы с лицензией. Т.е. он (был?) далеко не «бесплатный» и не «свободный».

Если я правильно понимаю статью, jpegxl лишён этого фатального недостатка. Но могу ошибаться.

Reflection в Go

@funny_falcon Aug 18 2024 at 08:19

Ну, не на пуговицах. Все же хранение хранение сложных структур в скомпиленном бинаре и потом десериализация по требованию в рантайме заметно сложнее, чем просто строк.

Но согласен: это известная хотелка и недоумение пользователей языка. Парсить тэги самому кажется очень странным занятием.

Простая красота XOR-сжатия чисел с плавающей запятой

@funny_falcon Aug 9 2024 at 09:22

Да, действительно такая схема есть, только ещё проще: не в битовые колонки, а в байтовые. И даже без предварительного XOR, емнип.

Если цель только сжать по сильнее, то это вполне рабочий вариант. Gorilla хороша тем, что для анализа значений не требуется предварительная распаковка всего массива. А классические алгоритмы сжатия требуют сохранять выходной буфер до окончания декомпрессии.

Хотя, конечно, можно сочетать этот подход с RLE + Хафман. Причём объединить байты и повторы в один алфавит для Хафмана. Тогда можно действительно доставать по байту из 8ми последовательностей и соединять в число. Это будет медленнее, чам Gorilla, но компрессия, наверное, будет лучше.

Простая красота XOR-сжатия чисел с плавающей запятой

@funny_falcon Aug 9 2024 at 08:50

А вас ни кто и не заставляет его разделять. Не нравится, не используйте/не следуйте этому подходу.

А другие экономят своё время и довольны этим.

Простая красота XOR-сжатия чисел с плавающей запятой

@funny_falcon Aug 9 2024 at 08:48

Датчик - это в широком смысле. Много разных показателей может быть в программах. Думать над каждым, как его представлять - пустая трата времени. Проще сказать: мы складываем в float/double с максимумом 20 бит мантиссы (что соответствует 6 знакам точности). А дальше уже умные алгоритмы сожмут это до приемлемых размеров.

А сжатие Гориллой тем и хорошо, что оно автоматически адаптируется к диапазону: ты можешь в него и миллисекунды выраженные в секундах складывать, и террабайты выраженные в байтах. Мосле xor экспоненты и те значения, и другие сожмутся примерно одинаково.

Простая красота XOR-сжатия чисел с плавающей запятой

@funny_falcon Aug 9 2024 at 06:07

Повторю: https://habr.com/ru/companies/sportmaster_lab/articles/834840/#comment_27144872

Простая красота XOR-сжатия чисел с плавающей запятой

@funny_falcon Aug 9 2024 at 06:04

“Несовместимый сжатый формат” придумал Google. С тех пор его много где повторили. Повторили потому, что померили и увидели выгоду.
Произвольные вещественные числа действительно имеют много рандомных бит. Особенно, если десятичные дроби используются. Если же намеренно округлять до двоичных дробей (а когда ты сам делаешь датчики, то вполне можешь загрубить значения слегка), то нулей в хвосте получается много.
Сомневаюсь, что generic алгоритм сжатия нормально сожмёт. Во-первых, сжатие работает побайтово, а тут границы повторов на байты не выровнены. Во-вторых, повторы достаточно маленькие, и кодирование повторов плохо сжимается обычно.
Кроме степени компрессии играет роль, во-первых, скорость сжатия/разжатия, а во-вторых, возможность использования разжатых чисел немедленно, один-за-другим, без ожидания разжатия всего входного буфера, и без выходного буфера в принципе.

-2

Простая красота XOR-сжатия чисел с плавающей запятой

@funny_falcon Aug 9 2024 at 05:52

Видимо, когда в Google разрабатывали алгоритм, их данные имели много повторений. Возможно, они снимали показания быстрее, чем они менялись.

1 2 3 4

6 7 ...

22 23