Комментарии / Профиль marsianin / Хабр

Как стать автором

Пользователь

Профиль Публикации Комментарии 183Закладки 284

Про память, теги и когерентность

marsianin 15 мая 2017 в 14:01

Всё-таки память под thread-local данные выделяется не там же, где выделяется память под разделяемые данные. Например, на стеке не будет храниться разделяемых данных, а операции на стеке выполняются сильно чаще, чем в разделяемой памяти. Соответственно, обеспечивать когерентность для стека не только бессмысленно, но и тяжело с точки зрения затрат ресурсов.

Что касается прикладного программиста, ему и не нужно знать размер страниц. Ему нужен только механизм выделения памяти с описанием того, как он эту память собирается разделять между потоками. Всё остальное — задача операционки.

Посмотреть

Про память, теги и когерентность

marsianin 15 мая 2017 в 12:15

Отдельного комментария заслуживает часть про когерентность кэша. То, что вы написали, справедливо для x86, однако, например, в ARM каждая страница памяти может быть в таблицах страниц помечена как Non-shareable, Inner Shareable или Outer Shareable. Соответственно, когерентность для Non-shareable памяти в ARM не обеспечивается, а для Inner Shareable памяти обеспечивается только внутри Inner Shareable-домена, куда обычно входят только процессорные ядра, но не входит периферия, которая может производить DMA-запросы.

Посмотреть

Про память, теги и когерентность

marsianin 15 мая 2017 в 11:42

Таблицы страниц — это полностью задача операционки. И WXN может включать и выключать только операционка.
Но на ARM любой self-modified code работает через кучу манипуляций. Instruction Cache в ARM не является когерентным остальной памяти, поэтому прежде чем исполнять код, который только что был записан в память, необходимо сделать Data Cache Clean и Instruction Cache Invalidate для всех cachelines, в которых находится модифицированный код. Если эту процедуру не выполнить, результат непредсказуем. При этом, в 32-битном ARM Cache Maintenance операции доступны только операционке. В AArch64 эти операции стали доступны и в application mode, но операционке может их там запретить.

Посмотреть

Про память, теги и когерентность

marsianin 15 мая 2017 в 11:20

На ARM для этого разрешают запись и исполнение одновременно, и не включают WXN. Но на ARM self-modified code вообще отдельная история

Посмотреть

Про память, теги и когерентность

marsianin 15 мая 2017 в 10:54

Вообще, в таблицах страниц MMU современных архитектур (x86-64, ARM) присутствует бит запрета исполнения (eXecute Never, eXecute Disable). И этот бит кэшируется в TLB. Попытка исполнить код из страницы с выставленным битом приводит к page fault exception. Кроме того, в ARM есть режим Write-eXecute Never, в котором нельзя исполнять код из страниц, доступных для записи.

Посмотреть

Как я писал предложение к стандарту С++

marsianin 23 апр 2017 в 12:12

Посмотрите документ «Intel® 64 and IA-32 Architectures Software Developer’s Manual», Volume 2, Chapter 4, раздел «4.3», описание инструкции «MOVS/MOVSB/MOVSW/MOVSD/MOVSQ—Move Data from String to String». Документ можно скачать здесь: https://software.intel.com/en-us/articles/intel-sdm

Посмотреть

Как я писал предложение к стандарту С++

marsianin 22 апр 2017 в 07:30

По поводу доли на рынке: мир не ограничен x86 и десктопами. В телефонах, например, ARM. А в сетевое оборудование часто ставят MIPS. А в серверах можно и SPARC найти, правда тяжеловато. И что, на них C++ не использовать?

Посмотреть

Как я писал предложение к стандарту С++

marsianin 22 апр 2017 в 07:25

Ещё следует упомянуть о флагах. В x86 и amd64 поддерживается один набор флагов, в ARMv7/v8 другой, в MIPS вообще флагов нет, а целочисленное переполнение на signed сложении генерирует исключение. И семантика у операций может быть разная: например в x86 инструкция SUB устанавливает Carry Flag, если был заём. А в ARM логика противоположная, Carry Flag выставляется, если заёма не было.

Посмотреть

Как я писал предложение к стандарту С++

marsianin 21 апр 2017 в 22:47

А вы не думали, как Ваше предложение скомпилируется, скажем, для процессора архитектуры MIPS, где нет флагового регистра и операции AddWithCarry? Боюсь, работать не будет

Посмотреть

Как я писал предложение к стандарту С++

marsianin 21 апр 2017 в 22:38

Увы, но C++-код должен компилироваться на множестве аппаратных платформ. И на многих из них нет операций типа сложения с переносом, SIMD и прочих. Поэтому сомневаюсь, что кто-то решит затащить эти операции в стандарт языка — они очень платформозависимы. А если они кому нужны на конкретной платформе, народ использует intrisincs.
Что касается «платформонезависимых ассемблерных вставок», хотелось посмотреть, как вы себе это представляете.

Посмотреть

Генератор тестовых данных для C++

marsianin 16 апр 2017 в 21:55

Для генерации вещественных чисел, как мне кажется, имеет смысл посмотреть на алгоритмы из Berkley Testfloat. http://www.jhauser.us/arithmetic/TestFloat.html

Посмотреть

Генератор тестовых данных для C++

marsianin 15 апр 2017 в 21:21

Почему был выбран именно такой метод генерации случайных float и double? Правильно ли я понимаю, что библиотека не вернёт NaN в качестве случайного float или double? Также, как мне кажется, крайне мала вероятность получить subnormal или бесконечность.

Посмотреть

Почему мы злые?

marsianin 18 дек 2016 в 21:09

Восхитительная попытка хабрасуицида (-:

Посмотреть

Оптимизация сравнения this с нулевым указателем в gcc 6.1

marsianin 28 авг 2016 в 22:20

Ещё раз: если вы попали в метод экземпляра класса, то this != nullptr. Так должно быть по стандарту. И компилятор имеет право генерировать код исходя из этого условия. Если программист допустил преобразование nullptr к указателю на объект, а потом вызвал метод у этого объекта, то этот программист сам себе злобный Буратина.

А отлавливать такие вещи можно если gcc подать опцию -fsanitize=undefined. Это заставляет компилятор вставлять рантайм-проверки во все места, где может возможно undefined behavior. Естественно, это имеет смысл применять только в дебажных сборках.

Посмотреть

Оптимизация сравнения this с нулевым указателем в gcc 6.1

marsianin 26 авг 2016 в 22:03

this может принять значение nullptr в следующем случае:

class foo {
public:
    void bar() { assert(this == nullptr); }
};

int main() {
    foo *p = nullptr;
    p->bar();
}

В этом случае проверка на равенство nullptr имеет право даже не выполняться. Если мы вызвали метод экземпляра класса, считается, что указатель p содержит валидный адрес обьекта. Правильно было писать так:

class foo {
public:
    void bar() {}
};

int main() {
    foo *p = nullptr;
    if (p != nullptr)
        p->bar();
}

Посмотреть

Оптимизация сравнения this с нулевым указателем в gcc 6.1

marsianin 26 авг 2016 в 21:33

GCC и не должен вставлять проверку — это задача того, кто написал кастомный operator delete.

Посмотреть

Оптимизация сравнения this с нулевым указателем в gcc 6.1

marsianin 26 авг 2016 в 20:18

В вашем примере необязательно проверять указатели на равенство nullptr в обработке исключений — оператор delete должен работать корректно, если ему передадут nullptr, то есть ничего не делать.

Посмотреть

Оптимизация сравнения this с нулевым указателем в gcc 6.1

marsianin 25 авг 2016 в 16:43

Не следует писать код, приводящий к undefined behavior. Собственно, в чём смысл этой статьи? Показать какой GCC плохой — считает что в пользовательском коде никогда не встретится UB? Ну так он по стандарту должен это делать.

Кстати, какая альтернативно одарённая личность могла догадаться использовать в продакшене GCC с минорным номером версии меньше двойки?

Посмотреть

Последние новости о развитии C++

marsianin 14 июл 2016 в 20:05

Без модулей и так неплохо. А кому нужна рефлексия, тот знает, где скачать Java.

Посмотреть

Последние новости о развитии C++

marsianin 14 июл 2016 в 07:46

Это, конечно, интересные фичи. Только зачем они в стандарте?

Посмотреть

1 2 ...

9