nickolaym Jun 9 2021 at 15:51

C++20: удивить линкер четырьмя строчками кода

4 min

13K

Abnormal programming*C++*Compilers*

+34

Comments 28

UFO just landed and posted this here

nickolaym Jun 9 2021 at 19:59

Очень похоже.

Вот, если мы поможем компилятору, чтобы он давал разные имена разным перегрузкам, — то всё будет работать.
https://gcc.godbolt.org/z/K8d9vv8oT

namespace a {}
namespace b {}

using namespace a;
using namespace b;

namespace a {
template<class T> void f() { std::cout << __PRETTY_FUNCTION__ << std::endl; }
}

void g() { f<int>(); }  // a::f

namespace b {
template<class T> void f() requires true { std::cout << __PRETTY_FUNCTION__ << std::endl; }
}

void h() { f<int>(); }  // b::f подошло лучше, чем a::f

nickolaym Jun 9 2021 at 22:30

Кажется, чувака по ссылке удалось переубедить.

CSharperSuper Jun 9 2021 at 21:36

В современном С++ это скорее норма, чем исключение. Надо иметь голову как дом советов чтобы всё понимать досконально. «Штудируй стандарт который меняется почти каждый год.»

nickolaym Jun 9 2021 at 21:44

Не соглашусь. Если не лазить по обочинам языка, то странное поведение — исключение, а не норма. А обочины были с самого рождения. Тут, конечно, С++ показывает кузькину мать.

В конце концов, если не использовать модные фичи, то поведение предсказуемо.
Это позволяет поддерживать на плаву гигантский объём существующего кода. Если бы стандарт менялся так, что его надо перештудировать, то старым исходника приходил бы песец.

А новые фичи — это с некоторой вероятностью и новые дефекты стандарта, и новые баги компиляторов. Которые рано или поздно будут устранены.

Нужно ли штудировать дефекты стандарта? Наверно, нет, до тех пор, пока именно в вашем коде эти дефекты не начинают проявляться.
Вот в коде домашней работы студента они проявились, — возник повод об этом поговорить.
Через три года, надеюсь, повод рассосётся.

Amomum Jun 9 2021 at 21:52

Интересно, почему даже в 2021 году компилятор не может сделать два прохода по файлу, а не заставлять программиста писать предварительное объявление :(

nickolaym Jun 9 2021 at 22:34

На самом деле, компилятор делает два прохода, когда ему это нужно по стандарту.
Инлайновые определения внутри объявления класса.

Amomum Jun 9 2021 at 22:36

Зачем же тогда все еще требуются эти предварительные объявления, если они не всегда требуются? Т_Т

KivApple Jun 9 2021 at 23:53

Обратная совместимость. C был однопроходным, C++ старался по максимуму сохранить с ним совместимость. То есть в классах, как принципиально новых сущностях, сделали как удобно, а для свободных функций, которые были и в С сделали как совместимо. И сейчас вряд ли кто-то это будет менять, потому что неизвестно сколько кода это сломает.

Amomum Jun 9 2021 at 23:55

Не вижу, почему "необязательная" однопроходность может сломать старый код, но да, наверняка может как-нибудь максимально неожиданно. Эх.

nickolaym Jun 10 2021 at 01:21

Пример, как можно что-нибудь сломать. Да, надуманный, но почему бы и нет.

// some.h
int f(char);

const size_t N = sizeof(f(0));
long arr[N];

// does_not_break.cpp
#include "some.h"
double f(int);

// breaks.cpp
double f(int);
#include "some.h"

В старом коде мы могли договориться, что "давайте будем следовать определённому порядку инклудов, и всё будет хорошо".
Двухпроходность эту договорённость частично отменяет, и "всё будет хорошо" уже не гарантируется.

Amomum Jun 10 2021 at 01:23

Спасибо за пример :)

monah_tuk Jun 21 2021 at 07:12

Но ведь инклуды отрабатываются не компилятором. Если я правильно препроцессировал и скомпилировал в мозгу, то во втором случае получится что-то вроде на входе компилятора:

double f(int);
int f(char);

const size_t N = sizeof(f(0));
long arr[N];

И sizeof(f(0)) выберет double f(int). И как тут может повлиять многопроходность компилятора? А в случае C, оба вариант не должны скомпилироваться ("conflicting types for 'f'; have 'int(char)'").

Меня не покидает ощущение, что я чего-то недопонял, хочу разобраться :)

nickolaym Jun 21 2021 at 14:49

С точки зрения автора клиентского кода, инклуды - это

такой импорт для бедных
препроцессорная магия

Правила хорошего тона как бы намекают, что порядок импорта не должен влиять, если это не специально оговорено.

Именно поэтому и делают инклуд-гарды и pragma once, - чтобы все, кто надо, спокойно импортировали зависимости в свои хедеры, и чтобы эта этажерка инклудов не мешала друг другу.

Есть известные антипаттерны, как сделать больно на инклудах. Самый очевидный - (пере)определение макросов. Особенно, когда имя макроса конфликтное. Тогда код до и после инклуда будет компилироваться заметно по-разному.

Здесь мы наблюдаем более тонкий эффект: наличие/отсутствие желательных/нежелательных перегрузок функций в точке некоторого использования в хедере (определение инлайн функции, статической функции, константы и т.п.)

Если бы компиляция была двухпроходной, то все перегрузки были бы видны отовсюду, и проблема выстреливала бы всегда, и её пришлось бы чинить. А так мы получаем неочевидность и шевелёнку.

Естественно, смотреть в сторону Си тут нет смысла - проблема именно в перегрузках, а Си перегрузки не поддерживает.

monah_tuk Jun 22 2021 at 05:07

Именно поэтому и делают инклуд-гарды и pragma once, — чтобы все, кто надо, спокойно импортировали зависимости в свои хедеры, и чтобы эта этажерка инклудов не мешала друг другу.

Спокойно всё равно не получится, пример, когда два класса друг на друга ссылаются. Да и на практике встречал, когда порядок инклудов влиял на успешность сборки (кто-то не видел банальные uint32_t, поэтому перед подключением требовался cstdint, но это локальные косяки). Ну и делали, как мне кажется не именно из-за правил хорошего тона, а что бы не появлялось два struct foo {};, что вступало бы в конфликт и вызывало бы ошибку компиляции.

И это, кстати, хорошо. Вон, в Linux Kernel для генерации Device Tree тоже используют C Pre-Propcessor, только там не принято обкладываться инклуд-гардами и в сложном случае что-то молча переписать и получить не то, что ожидалось очень легко. Недавно баг с этим связанный разбирал. Ужасно неприятно.

Самый очевидный — (пере)определение макросов.

В курсе, как минимум привет _POSIX_C_SOURCE, как максимум, специфическая "кодогенерация".

Если бы компиляция была двухпроходной, то все перегрузки были бы видны отовсюду, и проблема выстреливала бы всегда, и её пришлось бы чинить.

Я правильно понял, что под многопроходностью понимается не несколько проходов по единице трансляции, а… как бы по всему коду? Уточняю, так как то, что заинклудилось видится только в этой единице трансляции, и как это может стать видимым в другом месте мне не совсем понятно.

nickolaym Jun 24 2021 at 17:43

Под многопроходностью понимается именно в единице трансляции. А уже потом по всему коду - это компетенция линкера :)

Естественно, что шаблоны, как и любой другой инлайн, подвержены проблеме ODR. Но эту боль мы пока трогать не будем. Когда в одной единице трансляции инлайн реализуется одним способом, а в другой - другим.

---

Если два класса ссылаются друг на друга, - для этого есть предобъявления. И написать такой код, который не будет чувствителен к порядку инклудов, - в общем-то, несложно.

Можно проворонить проблему - например, забыть `#include <cstdint>`, потому что он приехал по зависимостям.

---

Вон, в Linux Kernel для генерации Device Tree тоже используют C Pre-Propcessor, только там не принято обкладываться инклуд-гардами

Это уже не импорты, а препроцессорная магия, это другое.

nickolaym Jun 10 2021 at 01:47

Или, например, трюки со счётчиками времени компиляции.
Общая схема такая

#define SET_TAG(value) ..... // вводит новую перегрузку функции
#define LAST_TAG() ..... // лучше всего подходит к последней перегрузке

SET_TAG(123);
.....
static_assert(LAST_TAG() == 123);
.....
static_assert(LAST_TAG() == 123);
.....
SET_TAG(456);
.....
static_assert(LAST_TAG() == 456);
.....

В какой-нибудь автоматической кодогенерации, макросной магии может пригодиться.

Пример, как это можно реализовать нечувствительно к одно-двух-проходности

template<unsigned N> struct argument : argument<N-1> {};
template<> struct argument<0> {};

#define SET_TAG(V) \
    static constexpr int tag_func(argument<__COUNTER__>*) { return V; }
#define LAST_TAG() \
    tag_func((argument<__COUNTER__>*)nullptr)

https://gcc.godbolt.org/z/3vThTex4P

Тут фокус в том, что argument<N> лучше всего приводится к ближайшей базе argument<M>, где M<N.
И, поскольку __COUNTER__ монотонно растёт, то будет выбрана самая последняя из перегрузок.
static нужно для того, чтобы не нарушить ODR, если в разных единицах трансляции одинаковым __COUNTER__'ам будут соответствовать разные значения тэгов.

Однако, это не единственный способ. Я когда-то встречал реализации, где новая перегрузка утилизировала старую. Без __COUNTER__.
И вот там уже однопроходность была существенна.
Но на ходу не вспомню, как это делается.

Amomum Jun 10 2021 at 01:52

Резонно, такое я даже на практике сам использовал, но боже мой, насколько все это ужасно выглядит все-таки...

nickolaym Jun 10 2021 at 02:04

В пучине разных библиотек, типа того же буста, может и не такой ад скрываться.
И тут прибегает некто с -ftwo-pass...

Amomum Jun 10 2021 at 02:09

Кажется, процесс обсуждения С++ можно описывать семью стадиями принятия…
Как вы справляетесь с отчаянием?

nickolaym Jun 10 2021 at 02:25

Мою посуду вот в такой последовательности:

Кружки и стаканы
Вилки, ложки и ножи
Тарелки и контейнеры
Отрицание
Гнев
Торг
Депрессия
Принятие
Кастрюли
Сковородки

11. Противень

Мой фокус в том, что я давно нахожусь в стадии противня. Чтобы вернуться к отчаянию, мне нужно перепачкать слишком много посуды обратно.

Amomum Jun 10 2021 at 02:59

Я думал в стадии противня только члены Комитета :D

nickolaym Jun 10 2021 at 03:57

Они этот противень подсовывают!

monah_tuk Jun 21 2021 at 07:16

Они включают под ним огонь.

DjPhoeniX Jun 10 2021 at 00:35

А если добавить какой-то флаг вида -ftwo-pass? Очередной способ выстрелить себе в ногу, конечно, но как минимум осознанно.

wslc Jun 10 2021 at 01:06

Например, если нижние инклуды будут влиять на верхние, будет еще более печально, чем сейчас

Amomum Jun 10 2021 at 01:08

Ну, если два инклуда содержат объявления одних и тех же функций или типов, то это, по-моему, уже сейчас стреляние в ногу.

nickolaym Jun 10 2021 at 02:01

Нет, просто очень хрупкий код. Приглашение к прилёту дятла из известной поговорки.