Comments / Profile of KanuTaH / Habr

Пользователь

Subscribers

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 13 2025 at 18:23

Вот мне кажется, что текущие компиляторы для х86/х64 кинут литерал в сегмент данных и ссылка никогда не пропадёт. Но это стандартом для всех систем и оптимизаторов! не гарантируется.

Вообще-то гарантируется: строковые литералы гарантированно имеют static storage duration:

Evaluating a string literal results in a string literal object with static storage duration.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 18:26

Точно не могу сказать :)

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 14:53

Ну то есть в своих широковещательных заявлениях основываетесь не на какой-то статистике, а на собственных каких-то представлениях "из головы" и собственном опыте. Тогда стоит добавлять к своим заявлениям "ИМХО", а не преподносить их как факт. Не ведите себя как растофанатик, ведите себя как инженер.

какое-то C++ сектантство в духе конторы на букву "я", вынуждающее вас оставлять агрессивные комментарии и прибегать к демагогическим приемам

Здорово, здорово. Нечем подкрепить свои утверждения - обвини собеседника в сектантстве и демагогических приемах. С вами я на обозримое будущее разговор закончил.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 14:24

Вас не смущает, что почти все программисты на Rust это и есть бывшие программисты на C++?

Я вот заметил, что вы очень любите делать широковещательные и ничем не подкрепленные заявления. Откуда дровишки что "почти все программисты на Rust это и есть бывшие программисты на C++"? Где можно ознакомиться с соответствующей статистикой?

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 13:52

Есть механизмы контекстозависимого отключения предупреждений, например.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 13:50

а почему не foo(y >= 0 ? (unsigned)y : 0) (второй 0 можно заменить на логгирование/исключение/::exit(-146)/whatever)

Ну вообще это далеко не всегда нужно, особенно если ситуация когда y < 0 вполне штатная - просто в этом случае вызывать foo() не нужно вообще. Лично я предпочитаю использовать контекстозависимые линтеры типа сонара, в которых предупреждение можно пометить как "accepted", но при изменении контекста предупреждение будет расценено как "новое" и будет снова отображено. А явные касты тут только мешают.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 13:34

Проверка не является одним целым с вызовом и при очередном рефакторинге может быть (ошибочно) стёрта.

Конечно! Но вся штука в том, что точно так же она может быть ошибочно стерта и при наличии явного приведения foo((unsigned)y), и компилятор тут вам ничем не поможет.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 13:20

С точи зрения простого компилятора эта проверка ничего не добавляет.

Это уже другой вопрос. Для надежного отлавливания ошибок конверсии между знаковыми и беззнаковыми типами одного требования явного приведения мало - прописывание этого приведения само по себе ничего не дает, ошибка остается. Если в приведенном мной куске кода завтра один джун пропишет foo((unsigned)y), чтобы заткнуть компилятор, а послезавтра другой джун выкинет if по ошибке, то компилятор ничего не заметит (как и в расте, кстати).

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 13:03

Безопасности тут добавляет проверка if(y < 0), а не явное приведение y к unsigned. Если есть проверка, то явное приведение не добавляет никакой "безопасности". Бездумное приведение же без проверки просто заткнет компилятор, а ошибка останется - как и в расте, кстати.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 12:56

А тут не на что ругаться, абсолютно ничего "небезопасного" в приведенном мной коде нет. Прописывание явного приведения никакой "безопасности" тут не добавляет.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 12:54

Ну вообще зависимости обычно собирают отдельно с их родными ключами с использованием одного из пакетных менеджеров (я лично предпочитаю vcpkg), а собственный код - отдельно.

Как Мэтт Годболт «продал» мне Rust (рассказав о C++)

KanuTaH May 9 2025 at 12:43

Ну вообще-то флаги, заставляющие компилятор делать соответствующие проверки, существуют - -Wconversion, -Wsign-conversion, и так далее, просто они не включены по умолчанию. А не включены они по умолчанию потому, что существует дофига абсолютно валидного и беспроблемного кода типа такого:

void foo(unsigned x) { ... }

void bar()
{
  int y = baz();
  if (y < 0) return;
  foo(y);  
}

Те, кому надо, могут включить.

Canonical планирует в Ubuntu 25.10 перейти на использование по умолчанию утилиты sudo-rs на языке Rust

KanuTaH May 9 2025 at 09:28

Ошибки при работе с памятью тут всё равно возможны

Более того - они совершенно реальны (специально привожу пример такой ошибки в одной из coreutils, переписанной на раст "ради безопасности"). Забавно здесь то, что если бы автор писал на C, то этой ошибке было бы неоткуда взяться, он просто автоматически использовал бы "правильную" структуру из /usr/include/pwd.h. В расте же нужны специальные телодвижения, которые автор, по-видимому, не осилил, и решил эту структуру просто захардкодить.

const fn может делать намного больше

KanuTaH Apr 11 2025 at 09:54

Главный прикол этой статьи в том, что никто, включая автора, по-видимому даже не пытался запустить эти примеры. Все эти compile-time парсеры CSV, JSON и INI не компилируются, так как в них используются конструкции, недоступные в const fn.

Rust 1.86.0: преобразование в родительский трейт, поддержка изменяемой индексации для HashMap и срезов

KanuTaH Apr 6 2025 at 17:55

Перевод кода, написанного в лучшем стиле C++98 на C++11 (до состояния без предупреждений компилятора) - это вообще задача сродни глубокому рефакторингу.

Неоднократно приходилось заниматься подобными вещами, в том числе в некоторых опенсорсных проектах типа того же fheroes2 (который писался старой командой еще в нулевые - до C++11, разумеется). Да, какие-то предупреждения компилятора бывали, особенно если до меня они были включены по минимуму, не без этого, но в целом проект как правило собирался и работал на новом стандарте без всякого "глубокого рефакторинга", а новый код (с конструкциями из новых стандартов) всегда можно было встраивать прямо "посреди старого" без особых проблем.

Rust 1.86.0: преобразование в родительский трейт, поддержка изменяемой индексации для HashMap и срезов

KanuTaH Apr 6 2025 at 16:55

Одно дело - раздувается компилятор. Это где-то там кого-то там проблема.

Ошибаетесь. Как только вам нужно будет исправить ошибку в старом коде или добавить какой-то функционал, это тут же станет вашей проблемой. Причем эта проблема усугубляется еще и тем, что в отличие от языков, развивающихся с поддержкой обратной совместимости, вы не сможете реализовать этот функционал в старом коде с помощью новых подходов и конструкций языка (и просто указать компилятору ключ -std поновее), а только с помощью старых, потому что старая ревизия еще не поддерживает новые конструкции, а новая ревизия уже не поддерживает старые.

Безопасная работа с массивами? Нет, не слышали

KanuTaH Apr 1 2025 at 22:25

Теперь, по логике того объяснения, которое было в оригинальном примере, здесь UB нет, верно?

По идее, да. Смотрим:

every byte that would be reachable through the result is reachable through p (bytes are reachable through a pointer that points to an object y if those bytes are within the storage of an object z that is pointer-interconvertible with y, or within the immediately enclosing array of which z is an element).

p в данном случае указывает на объект типа int, который находится внутри immediately enclosing array типа int[10] (то есть все элементы этого массива доступны через адресную арифметику), который в свою очередь занимает все пространство x2, т.е. любой байт внутри x2 достижим через этот p, так же как он достижим и через int(*)[10].

Безопасная работа с массивами? Нет, не слышали

KanuTaH Mar 31 2025 at 20:32

В этом смысле объектов типа "массив" не существует. Косвенно это можно обнаружить по тому, что квалификаторы const/volatile к самому массиву не применимы, только к типам самих элементов.

Ну, это натянутое утверждение. Для типов "массив" любой вложенности можно создавать алиасы через тот же using, существует тип "указатель на массив", decltype тоже прекрасно в курсе, что там за массив в конкретном случае и какие размерности он имеет. У компилятора нет никаких проблем отличить один массив от другого, коль скоро у него есть доступ к соответствующей декларации.

Но они не говорят, как всё устроено, и что за всеми этими штуками стои́т.

Вы слишком много внимания уделяете конкретной гипотетической реализации. Я же воспринимаю стандарты как описание некоей виртуальной машины, в котором написано, что эта виртуальная машина гарантированно может/должна прожевать (с тем или иным результатом), и на что не дается никаких гарантий.

Если снять одно измерение и повторить рассуждения, то получается следующее:

Ну вообще-то не получается, ибо в данном случае, имея массив типа int[2]и указатель на первый элемент этого массива, есть легальный способ получить доступ к любому из его элементов. А с многомерными массивами (или, если угодно, массивами массивов), имея лишь указатель на первый элемент первого массива, нет легального способа получить доступ к элементам остальных массивов (требование "every byte that would be reachable through the result is reachable through p" не выполняется).

Безопасная работа с массивами? Нет, не слышали

KanuTaH Mar 30 2025 at 21:10

Здесь важнее то, где он примени́м и как.

std::launder применим только если по "отмываемому" адресу действительно уже существует объект типа T. Об этом недвусмысленно написано в его описании по ссылке. Нельзя пытаться "отмывать" многомерный массив в одномерный, это не будет работать, потому что по соответствующему адресу находится многомерный массив, а не одномерный, и std::launder для этого не предназначен.

Как x2[1] может быть доступен через указатель на массив из 10 элементов?

Там написано не про это. Там написано, что x2[1] недоступно через &x2[0][0], а через приведенное сочетание reinterpret_cast и std::launder кто-то пытается притвориться, что доступно - ведь через int(*)[10] оно действительно должно быть доступно, но фактически в данном случае это не так. В некотором роде этот пример обратен вашей ситуации - тут одномерный массив (точнее, указатель на первый элемент одномерного массива) пытаются превратить в многомерный через std::launder.

Скорее, это намекает на то, что сначала допустили какую-то ошибку, а теперь лихорадочно пытаются костылить, чтобы эту ошибку обойти.

Ни std::launder, ни std::start_lifetime_as не являются "костылями" для обхода воображаемой "проблемы" с превращением многомерных массивов в одномерные (ну, или наоборот).

В частности, если они годятся для решения обсуждаемого вопроса, то не имеет значения, для чего они были задуманы изначально.

Могу сразу сказать, что вряд ли годятся :) По той же причине, по которой в C++ нельзя обращаться к "неактивным" элементам union- по одному адресу не могут одновременно "жить" (выражаясь казенным языком - быть within their lifetime) несколько объектов разных типов.

Безопасная работа с массивами? Нет, не слышали

KanuTaH Mar 30 2025 at 15:42

Это верно в отсутствие std::launder.

Нет. std::launder не предназначен для волшебного превращения одного типа по адресу в другой тип. Рекомендую ознакомиться с примерами в соответствующей статье на cppreference, там есть например такой:

int x2[2][10];
auto p2 = std::launder(reinterpret_cast<int(*)[10]>(&x2[0][0]));
// Undefined behavior: x2[1] would be reachable through the resulting pointer to x2[0]
// but is not reachable from the source

Однако, само название намекает, что данные "трюки" настолько востребованы, что для них даже добавили специальные функции.

А еще это как бы намекает что одних трюков с реинтерпрет кастами и лаундерингом недостаточно. Не говоря уж о том, что start_lifetime_as предназначены скорее немного для другого: например, есть у вас память, замапленная через mmap из файла какого-нибудь, и вы хотите превратить ее в объект (или массив объектов), чтобы потом с ней структурированно работать.

1 2

4 5 ...

95 96