Компиляторы *

Из исходного кода в машинный

СтатьиПостыНовостиАвторыКомпании

ru_vds 15 июл 2024 в 13:00

Побеждаем компилятор в скорости при помощи ассемблера

Средний

13 мин

7.3K

Блог компании RUVDS.comРеверс-инжиниринг * Компиляторы * Rust * Assembler *

Туториал

Перевод

В наше время все знают, что писать ассемблерный код — занятие для дураков. Компиляторы — это результат буквально человеко-веков разработки, и они понимают процессор гораздо лучше, чем вы.

Тем не менее, иногда до нас доносятся слухи.

Написанные в древних томах, подслушанные в тайных покоях, начертанные на стенах разрушенных храмов, упоминаемые в загадочных текстах, они рисуют чёткую картину:

Компиляторы плохо справляются с генерацией кода для интерпретаторов, и можно превзойти их, написав интерпретатор на языке ассемблера.

Читать дальше →

+53

Sivchenko_translate 15 июл 2024 в 10:39

У меня нет конструктора, но я должен инициализироваться

13 мин

8.7K

Компиляторы * C++ * Программирование *

Перевод

Так прошло три дня. В комнате темно и холодно, но мониторы слепят. Ты дезориентирован настолько, как будто тебя кидает из одного диссоциативного эпизода в другой. Тебя то и дело пробивает нервный смех, хотя смеяться нечему. Как я здесь оказался? В чём моя вина?

Главная ошибка была в том, что ты в это вообще ввязался — в этом никаких сомнений.

Ещё когда я впервые взялся проходить курс по C++ несколько лет назад, меня учили, что, если я не предоставлю собственного конструктора, то компилятор сам подберёт ему замену — своего рода конструкторы, действующие по умолчанию. Я решил подробнее в этом разобраться, особенно меня волновали случаи, которые выглядят примерно так:

+18

Sivchenko_translate 9 июл 2024 в 14:07

UB или не UB – вот в чём вопрос: как gcc и clang обрабатывают статически известное неопределённое поведение

7 мин

Программирование * C++ * Компиляторы *

Перевод

Недавно у нас в команде зашла дискуссия о неопределённом поведении (UB) в C. Напомню для тех, кто не знает: если мы пишем такой код, эффект от выполнения которого (и события в процессе его выполнения) строго не определён в спецификации языка, то возникает неопределённое поведение. Таким образом, встретив такой код, компилятор может действовать по собственному усмотрению, и нет никаких гарантий, что выполнение этого кода пойдёт по предсказуемому пути. Следовательно, нужно избегать неопределённого поведения любой ценой, поскольку мало того, что оно может приводить к глюкам программы, но и часто становится источником уязвимостей и угрозой безопасности. Примеры кода, в котором проявляется неопределённое поведение: выход за границы массива при его индексировании, целочисленное переполнение, деление на ноль, разыменование указателя на null [1].

Компиляторы нередко пользуются неопределённой семантикой языка, чтобы делать те или иные допущения о программе. Например, если написать что-то вроде int x = y/z, компилятор может предположить, что z не может быть равно нулю, так как деление на ноль приводит к неопределённому поведению, а программист явно не собирался писать такой код. На основе этой информации он может попытаться далее оптимизировать программу так:

+13

Koshey_Immortal 8 июл 2024 в 11:29

Насекомое 13 лет сидит в вашем компиляторе и не собирается оттуда вылезать

Простой

4 мин

8.7K

Блог компании PVS-StudioC++ * Компиляторы *

Мнение

Представим, что у вас идеальный проект. Таски пилятся, компилятор компилирует, статические анализаторы анализируют, релизы релизятся. В какой‑то момент вы принимаете волевое решение открыть древний файл, в который никто не залезал уже много лет, и видите, что он в кодировке Windows-1251. При том, что весь проект уже давно перешёл на UTF-8. «Непорядок!» — думаете вы, и лёгким движением руки меняете кодировку. На следующий день на вашем тестовом сервере случается локальный апокалипсис. Думаете, такого не может быть? Тогда предлагаю это обсудить.

+40

Albert_Wesker 7 июл 2024 в 08:05

Компиляторные оптимизации сложны, так как компиляторы забывчивы

Сложный

10 мин

5.6K

Блог компании Timeweb CloudВысоконагруженные системы * C++ * Компиляторы * C *

Обзор

Перевод

Как именно вы спроектировали бы оптимизирующий компилятор? Точнее, как именно вы спроектировали и реализовали бы конкретные оптимизации? Попытка решить эту задачу за один присест — дело ошеломительно сложное и, пожалуй, даже невозможное, так как оптимизации компилятора во многом заключаются в следующем...

+29

varanio 3 июл 2024 в 11:43

А что если исходные коды программ хранить в бинарном формате?

3 мин

24K

Блог компании KarunaКомпиляторы * Программирование * Текстовые редакторы и IDE *

Эта статья — просто идея, не судите строго.

TLDR: предлагаю рассмотреть хранение исходных кодов программ в некоем бинарном формате вместо голого текста.

Компилятор и IDE

Как примерно работает компилятор: сначала происходит лексический анализ, т.е. разбиение исходного кода на токены. Потом происходит синтаксический анализ — полученные токены объединяются в синтаксическое дерево. Потом семантический анализ: вывод типов данных, проверка видимости переменных, и т.д.

И только потом идут этапы, приводящие в конце концов к появлению исполняемого файла.

Как работает типичная IDE: да точно так же. Лексический анализ, синтаксический анализ, семантический анализ, вывод типов, и всё прочее. Т.е. по сути ребята пишут полкомпилятора, чтобы вы могли получить все современные возможности IDE.

Т.е. сам текст программы нужен только человеку на этапе ввода информации. Потому что ему для понимания происходящего AST-дерево не подойдёт.

Но что если хранить исходный код по-другому?

Читать дальше →

241

RustLangRu 18 июн 2024 в 07:30

Rust 1.79.0: встроенные const, ограничения в ассоциированном типе, продление автоматического времени жизни

Простой

4 мин

Системное программирование * Программирование * Компиляторы * Rust * Open source *

Перевод

Команда Rust рада сообщить о новой версии языка — 1.79.0. Rust — это язык программирования, позволяющий каждому создавать надёжное и эффективное программное обеспечение.

Если у вас есть предыдущая версия Rust, установленная через rustup, то для обновления до версии 1.79.0 вам достаточно выполнить команду:

$ rustup update stable

Если у вас ещё не установлен rustup, вы можете установить его с соответствующей страницы нашего веб-сайта, а также посмотреть подробные примечания к выпуску на GitHub.

Если вы хотите помочь нам протестировать будущие выпуски, вы можете использовать канал beta (rustup default beta) или nightly (rustup default nightly). Пожалуйста, сообщайте обо всех встреченных вами ошибках.

Читать дальше →

+14

Albert_Wesker 14 июн 2024 в 15:05

Macroni: рецепт поступательного улучшения языка программирования

Сложный

12 мин

3.4K

Блог компании Timeweb CloudC * C++ * Компиляторы * Программирование *

Обзор

Перевод

Хотя, Clang и используется в качестве инструмента для рефакторинга и статического анализа, у него есть серьёзный недостаток: в абстрактном синтаксическом дереве не предоставляется информации о происхождении конкретных расширений-макросов на CPP, за счёт которых может надстраиваться конкретный узел AST. Кроме того, Clang не понижает расширения-макросы на уровень LLVM, то есть, до кода в формате промежуточного представления (IR). Из-за этого оказывается запредельно сложно конструировать такие схемы статического анализа, при которых учитывались бы макросы. Сейчас эта тема активно исследуется. Но ситуация налаживается, поскольку прошлым летом был создан инструмент Macroni, упрощающий статический анализ именно такого рода.

В Macroni разработчики могут определять синтаксис новых языковых конструкций на C с применением макросов, а также предоставлять семантику для этих конструкций при помощи MLIR (многоуровневого промежуточного представления). В Macroni используется инструмент VAST, понижающий код C до MLIR. В свою очередь, инструмент PASTA позволяет выяснить, откуда те или иные макросы попали в AST, и на основании этой информации макросы также удаётся понизить до MLIR. После этого разработчики могут определять собственные MLIR-конвертеры для преобразования вывода Macroni в предметно-ориентированные диалекты MLIR, чтобы анализировать предмет с учётом многочисленных нюансов. В этой статье будет на нескольких примерах показано, как Macroni позволяет дополнять C более безопасными языковыми конструкциями и организовать анализ безопасности C.

Читать дальше →

+23

Alphrixus 11 июн 2024 в 08:56

Сколько UB в моём компиляторе?

Средний

13 мин

4.5K

Блог компании PVS-StudioOpen source * Программирование * C++ * Компиляторы *

У C и C++ программистов две головные боли в плане ошибок: утечки памяти и неопределённое поведение. И как вы догадались из названия, речь пойдёт о неопределённом поведении. И каком‑то «моём» компиляторе. Если точнее, то о наборе компиляторов и инструментах для их разработки, а именно LLVM. Почему «моём»? Потому что мы очень любим Clang, входящий в состав LLVM, и пользуемся им на постоянной основе.

+24

PatientZero 4 июн 2024 в 10:39

Укрощаем суммы с плавающей запятой

Простой

9 мин

6.9K

Rust * Математика * Компиляторы * Алгоритмы * Программирование *

Туториал

Перевод

Допустим, у нас есть массив чисел с плавающей запятой, и мы хотим их суммировать. Можно наивно подумать, что их достаточно просто сложить, например, на Rust.

Однако это запросто может привести к произвольно большой накопленной погрешности. Давайте проверим:

naive_sum(&vec![1.0; 1_000_000]) = 1000000.0 naive_sum(&vec![1.0; 10_000_000]) = 10000000.0 naive_sum(&vec![1.0; 100_000_000]) = 16777216.0 naive_sum(&vec![1.0; 1_000_000_000]) = 16777216.0

Ой-ёй… Что произошло? Проблема в том .что следующее 32-битное число с плавающей запятой после 16777216 — это 16777218. Так что при вычислении 16777216 + 1, значение округляется до ближайшего числа с плавающей запятой, имеющей чётную мантиссу, то есть снова до 16777216. Мы зашли в тупик.

К счастью, есть более совершенные способы суммирования массива.

+34

YuriPanchul 4 июн 2024 в 05:03

Мысли по поводу доклада на FPGA-Systems про маршрут ИРИС из МГУ

Средний

7 мин

C++ * Алгоритмы * Компиляторы * FPGA * Программирование микроконтроллеров *

На конференции FPGA-Systems был предоставлен маршрут проектирования блоков микросхем на основе использования C++ под названием ИРИС. Докладчик - заведующий кафедрой Мехмата МГУ Эльяр Гасанов. Его группа имеет значительный опыт проектирования оптимизированных по производительности блоков, например LDPC декодера, и ведет свои истоки из сотрудничества с LSI Logic в середине 1990-х годов.

Мои мысли после просмотра презентации:

+22

Andrey2008 30 мая 2024 в 07:53

Объявляю ошибку вида if (x = 42) вымирающей и заношу её в Красную книгу C и C++ багов

Простой

5 мин

32K

Блог компании PVS-StudioC * C++ * Компиляторы * Качество кода *

Редкий вид бага
Если спросить программиста, какие баги чаще всего можно встретить в C и C++ коде, он назовёт разыменование нулевого указателя, неопределённое поведение, выход за границу массива и другие, на его взгляд, типовые паттерны ошибок. Скорее всего, он назовёт и случайное присваивание в условии. Но действительно ли эта ошибка распространена в наше время?

Читать дальше →

+80

109

Alphrixus 29 мая 2024 в 09:22

Какие ошибки есть в коде LLVM?

Средний

10 мин

4.1K

Блог компании PVS-StudioOpen source * C++ * Компиляторы *

LLVM — open-source проект с огромной кодовой базой. Лучший из лучших, если говорить о качестве кода, учитывая его размеры и открытость. Ведь кому, как не разработчикам инструментов для компиляторов, лучше знать о возможностях языка и правильном их использовании. Их код всегда на высоте, а найти ошибки в нём всегда вызов для нашего анализатора, который мы принимаем.

+18

ZergsLaw 24 мая 2024 в 15:00

Protobuf и buf: блеск, нищета и импортозамещение

11 мин

22K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Ozon БанкКомпиляторы * Go *

Если для компиляции proto-файлов вы всё ещё используете protoc, самое время перестать и перейти на buf. Разберём, как это сделать и почему это необходимо. Также рассмотрим проблемы доступа к buf.build.

Меня зовут Эдгар Сипки, я Go-разработчик в Ozon Fintech. buf — мощная утилита для линтинга протофайлов, проверки обратной совместимости API, генерации кода и валидации запросов. Однако, из-за санкций она недоступна в России. Поэтому я расскажу, как мы разрабатывали собственное решение в рамках импортозамещения.

+17

ru_vds 20 мая 2024 в 13:00

Compiler Explorer — уникальный проект для исследования компилируемого кода

Средний

7 мин

19K

Блог компании RUVDS.comAssembler * Компиляторы * Программирование *

Обзор

Перевод

Этот пост посвящён замечательному инструменту, полезному для каждого, кто интересуется компиляторами или архитектурой компьютеров. Это Compiler Explorer, который я в дальнейшем будут называть CE.

CE — потрясающий инструмент. Если вы с ним не знакомы, то прервите чтение и перейдите на веб-сайт CE, где вы увидите примерно такой экран:

Предупреждение: вы забираетесь в «кроличью нору», на которую можете потратить несколько часов своего времени.

В основе CE лежит очень простая идея. Достаточно ввести исходный код в левую панель, и сайт мгновенно покажет вам на правой панели скомпилированный результат (обычно на языке ассемблера).

CE поддерживает 69 языков, более двух тысяч компиляторов и широкий спектр архитектур, включая x86, arm, risc-v, avr, mips, vax, tensa, 68k, PowerPC, SPARC и даже древний 6502.

То есть теперь для просмотра результата работы компилятора достаточно открыть godbolt.org и скопировать туда блок кода.

Это само по себе удивительно, но у CE есть гораздо больше возможностей. Это инструмент, который должны знать все интересующиеся компиляторами и архитектурами компьютеров. В статье мы сможем лишь поверхностно рассмотреть функции CE. Вам стоит самим перейти на сайт CE и попробовать всё самостоятельно.

Читать дальше →

+80

MAX1993M 8 мая 2024 в 13:39

Как новый компилятор K2 ускоряет компиляцию Kotlin на 94%

Средний

10 мин

20K

Блог компании KTSKotlin * Компиляторы * Android * Разработка мобильных приложений *

Обзор

Перевод

Привет, меня зовут Мялкин Максим, я занимаюсь мобильной разработкой в KTS.

Не за горами выпуск новой версии Kotlin 2.0, основной частью которого является изменение компилятора на K2.

По замерам JB, K2 ускоряет компиляцию на 94%. Также он позволит ускорить разработку новых языковых фич и унифицировать все платформы, предоставляя улучшенную архитектуру для мультиплатформенных проектов.

Но мало кто изучал, как работает K2, и чем он отличается от K1.

Эта статья освещает нюансы работы компилятора, которые будут полезны разработчикам для понимания, что же JB улучшают под капотом, и как это работает.

+74

RustLangRu 3 мая 2024 в 18:25

Rust 1.78.0: Диагностические атрибуты, проверка предусловий unsafe и детерминированное повторное выравнивание

Простой

5 мин

Open source * Rust * Компиляторы * Программирование * Системное программирование *

Перевод

Команда Rust рада сообщить о новой версии языка — 1.78.0. Rust — это язык программирования, позволяющий каждому создавать надёжное и эффективное программное обеспечение.

Если у вас есть предыдущая версия Rust, установленная через rustup, то для обновления до версии 1.78.0 вам достаточно выполнить команду:

$ rustup update stable

Читать дальше →

+15

CodeDroidX 24 апр 2024 в 09:00

Рисуем рабочий процессор в Paint и запускаем на нём ОС | Ритуал по призыву демона Тьюринга

Простой

28 мин

17K

Блог компании RUVDS.comAssembler * Forth * Компиляторы * Ненормальное программирование *

Кейс

✏️ Технотекст 7

Однажды в тёмном-тёмном городе, в тёмном-тёмном подвале, очередной обезумевший контентмейкер за паяльной станцией подключал программатор к умному термосу.

Термос этот он нашёл на улице и хотел перепрошить его маленький и беззащитный Cortex-M0+.
Человек бредил. Раз в пару минут его глаза загорались и он издавал душераздирающий крик: «Если что-то существует, то на этом можно запустить Doom!».

Но действительно ли это так? И что вообще значит «запустить»?

Почему нельзя просто вывести изображение логотипа или распиновать VGA для вывода изображения на дисплей абсолютно любого устройства?

Ведь все так и делают)

Сегодня мы узнаем, как может выглядеть самый примитивный девайс, обладающий свойствами компьютера и способный полноценно запустить любой алгоритм.

С этой целью мы обратимся к немного странным, но всё же незаслуженно забытым языкам программирования. Когнитивная сложность дальнейшего текста обещает быть минимальной, даже непосредственно ассемблерного программирования в статье не будет.

Ну а если вы всё ещё здесь — добро пожаловать под кат.

Читать дальше →

+101

ivan_anikin 23 апр 2024 в 09:15

Где мне это пригодится в жизни или применение Nothing в Kotlin на примере

Средний

5 мин

9.7K

Kotlin * Компиляторы *

Из песочницы

В данной статье я хочу показать, почему развитая система типов в языке программирования это здорово. Я попробую провести небольшой ликбез о таких на первый взгляд сложных вещах, как sealed-иерархии, ковариантность и тип Nothing на понятном практическом примере создания своей реализации типа из функционального программирования Either.

+26

PatientZero 19 апр 2024 в 07:44

Как я снизил время инкрементальных сборок Rust на 40%

Средний

9 мин

4.5K

Программирование * Компиляторы * Rust *

Туториал

Перевод

Я форкнул и модифицировал компилятор Rust rustc. Одна фича — кэширование раскрытия процедурных макросов — привела к снижению времени инкрементальных сборок на 11-40% в различных реальных крейтах. Благодаря этому ускорились dev-сборки и меньше стал тормозить rust-analyzer (IDE IntelliSense).

Если вы специалист в повышении производительности компилятора Rust, то можете сразу перейти к разделу «Кэширование раскрытия макросов: ускорение инкрементальных сборок Rust на 40%».

+18

1 2 ...

7 8

10 11 ...

52 53

Компиляторы *

Побеждаем компилятор в скорости при помощи ассемблера

У меня нет конструктора, но я должен инициализироваться

UB или не UB – вот в чём вопрос: как gcc и clang обрабатывают статически известное неопределённое поведение

Насекомое 13 лет сидит в вашем компиляторе и не собирается оттуда вылезать

Компиляторные оптимизации сложны, так как компиляторы забывчивы

А что если исходные коды программ хранить в бинарном формате?

Компилятор и IDE

Rust 1.79.0: встроенные const, ограничения в ассоциированном типе, продление автоматического времени жизни

Macroni: рецепт поступательного улучшения языка программирования

Сколько UB в моём компиляторе?

Укрощаем суммы с плавающей запятой

Мысли по поводу доклада на FPGA-Systems про маршрут ИРИС из МГУ

Объявляю ошибку вида if (x = 42) вымирающей и заношу её в Красную книгу C и C++ багов

Какие ошибки есть в коде LLVM?

Ближайшие события

Protobuf и buf: блеск, нищета и импортозамещение

Compiler Explorer — уникальный проект для исследования компилируемого кода

Как новый компилятор K2 ускоряет компиляцию Kotlin на 94%

Rust 1.78.0: Диагностические атрибуты, проверка предусловий unsafe и детерминированное повторное выравнивание

Рисуем рабочий процессор в Paint и запускаем на нём ОС | Ритуал по призыву демона Тьюринга

Где мне это пригодится в жизни или применение Nothing в Kotlin на примере

Как я снизил время инкрементальных сборок Rust на 40%

Вклад авторов