Bunikido Feb 21 2022 at 06:30

arr[-1] или самые редкие конструкции в С

13 min

26K

Programming * C *

From sandbox

+17

169

Comments 169

sergio_nsk Feb 21 2022 at 06:58

А как же 1[arr]?

auto int x; в C и старом C++ и auto idx = 1 в современном C++ - совсем не одно и то же.

int *dyn_arr = (int*)malloc(... Привидение типа в C здесь вообще лишнее, void* приводится к любому указателю.

Стоило упомянуть, что в C функция, объявленная без параметров принимает произвольное число аргументов.

Bunikido Feb 21 2022 at 10:56

1[arr] - я рассказывал про это явление:

Индекс с массивом, но вверх ногами
Простой пример:
int arr[ARR_SIZE], i = ARR_SIZE-1;while (i>=0) {i--[arr] = i+1;}

Возьму на заметку.
Здесь я сделал это для наглядности. На самом деле как по мне каст увеличивает читабельность подобных записей:
char** mat = (char**)malloc(...
Если в C++ это необходимость, то в С это на вкус и цвет, и всё равно этот каст никому не навредил =) (Разве что исходный код будет весить на пару байт больше)
Добавил в раздел Функции с переменным количеством параметров, спасибо

oldnomad Feb 21 2022 at 14:11

Каст malloc в C (и вообще, явные касты из void *) -- вредная практика. Пример:

#include <stdio.h>

int *foo(void) {
  return (int *)malloc(10);
}

Здесь функция malloc не объявлена (она объявляется в <stdlib.h>, а не в <stdio.h>). По умолчанию в отсутствие объявления будет считаться что функция возвращает int, и результат будет непредсказуем. Конечно, компилятор, скорее всего, выдаст предупреждение, но, если бы каста не было -- была бы более наглядная ошибка.

Bunikido Feb 21 2022 at 15:08

Спасибо, буду знать

quaer Feb 22 2022 at 00:44

А как без кастов делать?

oldnomad Feb 22 2022 at 01:13

А как без кастов делать?

А тут каст и не нужен. По стандарту, указатель void * автоматически приводится к любому указателю (за исключением указателя на функцию) -- так же как можно, скажем, константу 42 (без суффиксов тип int) присвоить переменной типа long без всяких кастов.

quaer Feb 22 2022 at 10:15

Подобные автоматические приведения типов могут быть источником ошибок, поэтому мне больше нравятся явные. Поэтому и интересно какие ещё есть варианты получить явную ошибку в данном случае.

unsignedchar Feb 22 2022 at 10:55

Нет проверок на размер кастуемых данных — это проблема. Можно даже так вот сделать:

char foo(void) {
  return (char )malloc(3);
}

Или так:

int foo(void) {
  return (int )malloc(3);
}

И оно скомпилируется (с варнингами), и даже как-то запустится. А если привести к указателю — возможно, даже будет работать более-менее правильно с некоторыми данными, за счет того, что malloc выделит не ровно 3 байта, а выровненный по каким-то границам кусок. ;)

UFO landed and left these words here

lz961 Feb 21 2022 at 07:23

int brr[100] = {0};

int *arr = brr+50;

arr[-1] = 3;

Есть ли здесь "undefined behaviour" ?

Gordon01 Feb 21 2022 at 07:33

По стандарту, arr указывает на 51й элемент, то есть валиден всего для четырех байтов.

Код содержит UB, потому что эксплуатируется особенность компилятора не проверять границы адресов для указателей. arr[-1] указывает на последний байт 50го элемента, чего быть не может.

lz961 Feb 21 2022 at 07:42

int brr[100] = {0};
int *arr = brr+50;
arr[-1] = 3;
printf("%d, %d, %d\n", arr[-1], brr[49], arr[0]);
printf("%p, %p, %p\n", &(arr[-1]), &(brr[49]), &(arr[0]));
return 0;

вывод

3, 3, 0
0x7ffd3b2f0eb4, 0x7ffd3b2f0eb4, 0x7ffd3b2f0eb8

вроде, соответствует написанному в статье

Gordon01 Feb 21 2022 at 10:01

Код на си иногда выводит правильный результат как доказательство что он корректен? Вы серьезно?

https://godbolt.org/z/6s3a15ee1

#include <stdio.h>

int main(void) {
    int a1[10] = {0};
    int a2[10] = {1};
    int *arr = a2;
    arr[-3] = 3;
    printf("%d, %d\n", arr[-3], a1[9]);
    printf("%p, %p\n", &(arr[-3]), &(a1[9]));
    return 0;
}

Как вышло?

Program returned: 
3, 0
0x7ffe46167f24, 0x7ffe46167f24

Указатель в Си — это не адрес памяти. Это просто абстракция.

DistortNeo Feb 21 2022 at 13:28

Как вышло?

Вы, используя указатель на a2, поменяли значение в массиве a1. Естественно, это будет UB.

viordash Feb 21 2022 at 13:43

оптимизация? я про адреса

Bunikido Feb 21 2022 at 15:11

Указатель в Си — это не адрес памяти. Это просто абстракция.

Брайан Керниган писал что это именно адрес в памяти.

Gordon01 Feb 21 2022 at 17:40

Брайан Керниган писал что это именно адрес в памяти.

Спасибо деду за победу, конечно, но мог бы еще тогда догадаться что:

int arr[5] = { 0, 1, 2, 3, 4 };
i0 = arr[0];
assert(i0 == 0);
i1 = arr[-2];
assert(i1 == 3);
assert(&arr[-2] == &arr[3]);

Много бы крови сэкономил

Bunikido Feb 21 2022 at 17:57

Assertion failed!
Program: C:\Users\Random_User\ \a.exe
File: tmp.c, Line 10
Expression: i1 == 3

Дальше программа естественно не выполняется.

А что не так? Вы выполнили переход к области памяти, в которой никто не знает что лежит: arr[-2]. Конечно там не может быть 3.

Gordon01 Feb 21 2022 at 18:17

Ну так да, диды не догадались сделать отрицательные индексы — индексацией с конца. Как это сейчас во многих языках, даже в том же пхп.

Тогда бы они еще тогда поняли, что вместе с массивами и указателями на них, надо таскать их размер (хотя бы во время компиляции).

Я имел в виду, что arr[-2] и arr[3] в случае массива из 5 элементов указывали бы на одинаковый элемент.

Скажете перф? Только вот из-за этого в си невозможны аггрессивные оптимизации, когда сразу инвестно что указатели не пересекаются. Всякие расты оказываются быстрее си, как раз благодаря тому что гарантируют что уникальные ссылки уникальны (не пересекаются).

А современные компиляторы все равно надеятся на strict aliasing даже в дефолтных настройках (-О3), что я вам и показал.

Bunikido Feb 21 2022 at 18:33

Я имел в виду, что arr[-2] и arr[3] в случае массива из 5 элементов указывали бы на одинаковый элемент.

До сих пор не понимаю как так-то

Вот массив:

{0 1 2 3 4}

Вот i1 = arr[-2]:

x x {0 1 2 3 4}
^
i1

То есть мы взяли какую-то другую неизвестную нам память. Так каким образом тогда мы получим arr[3]?

Gordon01 Feb 21 2022 at 18:54

Я не про историческую реализацию си, а про то как надо было делать (легко говорить из будушего).

https://www.php.net/manual/ru/function.substr.php

Положительный индекс — считать с начала, отрицательный — считать с конца.

Bunikido Feb 21 2022 at 19:03

Положительный индекс — считать с начала, отрицательный — считать с конца.

Полный бред =) Тогда смысл этих "отрицательных" индексов если можно написать просто:

extern int arr[];
extern size_t i;
... = arr[ARR_SIZE-i];

Ох уж эти ленивые пхпшники... Мы Сишники, с нами стандарт!

Gordon01 Feb 21 2022 at 19:07

extern size_t i;

ptrdiff_t

... = arr[ARR_SIZE-i];

error: ARR_SIZE undefined

Мы Сишники, с нами стандарт!

Крииинж %)

https://gcc.gnu.org/bugzilla/show_bug.cgi?id=30475

Почему сишникам меньше всего платят тогда?

Bunikido Feb 21 2022 at 19:29

ptrdiff_t

Заглядываем в стандартную библиотеку и видим:

typedef long long ptrdiff_t;
typedef long long ssize_t;
typedef unsigned long long size_t;

Чем вас ssize_t тогда не устраивает? Да и вообще какая разница тем более в таком простом примере который я привёл =)

error: ARR_SIZE undefined

Ладно, теперь сойдёт?

#include <stdlib.h>
#include <stdio.h>
#define ARR_SIZE	5
int main(int argc, char *argv[]){
  int arr[ARR_SIZE] = {0, 1, 2, 3, 4};
  long long i = -2;
  printf("%i\n", arr[(i < 0) ? ARR_SIZE-(-i) : i]);
  return EXIT_SUCCESS;
}

Крииинж %)

Ох уж эти ваши ~~тиктоки~~

Gordon01 Feb 21 2022 at 19:39

Вы почти выполнили задание "выведите n-ый аргумент командной строки".

Осталось сделать обработку ошибок и можно будет:

> leetcode_easy.exe 2 a b c d
c
> leetcode_easy.exe -1 a b c d
d
> leetcode_easy.exe 22 a b c d
index out of bounds

Bunikido Feb 21 2022 at 19:31

Почему сишникам меньше всего платят тогда?

Откуда такая информация? C занимает 2 место по популярности по рейтингу TIOBE

Gordon01 Feb 21 2022 at 19:36

Откуда такая информация? C занимает 2 место по популярности по рейтингу TIOBE

С рынка труда)

Bunikido Feb 21 2022 at 19:37

Я пишу на С потому что удобно - а не потому что много платят :) Это тот самый язык «что написано то и сделано»

Balling Feb 21 2022 at 22:17

Именно поэтому unsigned арифметика быстрее signed. Это классная фича, а не баг. stackoverflow.com/a/4712784/11173412

>Undefined signed integer overflow allows the compiler to assume that overflows don't happen, which may introduce optimization opportunities.

Одна из важнейших фич в Си, как по мне. В ffmpeg постоянно int меняют на unsigned (unsigned это синоним unsigned int).

Например, github.com/FFmpeg/FFmpeg/commit/bf33a384995ac21aa41422c6246ebdc5d9632452

ИЛИ вот этот ужас github.com/FFmpeg/FFmpeg/commit/203b0e3561dea1ec459be226d805abe73e7535e5

tabtre Feb 22 2022 at 08:53

Undefined signed integer overflow allows the compiler to assume that overflows don't happen, which may introduce optimization opportunities.

Немного странный коментарий на SO. Исходя из него можно подумать что как раз signed integer быстрее раз для него оптимизации возможны)

В том ответе есть ссылка на интересную статью о Signed Overflow www.airs.com/blog/archives/120
Там есть пример с оптимизацией ф-ции

int f(int x) { return 0x7ffffff0 < x && x + 32 < 0x7fffffff; }

до return 0
Однако из описания непонятно почему так происходит. У меня есть предположение, что компилятор считает
x + 32 для x > 0x7ffffff0 — всегда будет выходить за 0x7fffffff. Это так?

Balling Feb 22 2022 at 13:00

Имеются в виду оптимизации от противного. Signed overflow надо как-то обязательно проверять (так как есть консенсус, как обрабатывать это неопределенное поведение), даже если это выделенная инструкция ассемблера с флагами overflow.

wataru Feb 21 2022 at 21:41

Ну так да, диды не догадались сделать отрицательные индексы

И не зря. В каком-нибудь высокоуровневом питоне это можно сделать почти бескровно, там и так все еле ворочается. Ну подумаешь, еще и длину массива хранить. А в довольно низкоуровневом Си так делать нельзя. Если у вас массив статический, то еще худо бедно компилятор может помнить какой же размер этого массива. А вот если это указатель, переданный в функцию. Или, прости господи, нуль-терменированная строка? Таскать везде еще и длину массива — лишние накладные расходы. Если кому надо с конца считать, то пусть сами где-то длину массива протащат и в квадратных скобочках перед минусом вставят.

Gordon01 Feb 22 2022 at 06:58

А в довольно низкоуровневом Си так делать нельзя.

Но приходится, так как сразу же оказалось, что можно сделать оптимизации, когда регионы памяти не пересекаются, но си этого гарантировать не может, пришлось подпирать костылями вроде restrict, генерировать два варианта кода и прочий бред

wataru Feb 22 2022 at 10:06

Ну да. Если программист хочет использовать эту фичу, он пишет restrict. Также как с выходом за границы массива. Программист сам проверяет, а не компилятор не спрашивая пихает везде проверки.

Gordon01 Feb 22 2022 at 14:54

Если программист хочет использовать эту фичу, он пишет restrict.

Чтобы ее юзать, о ней надо знать, а даже если знаешь, то надо доказывать что регионы и правда не пересекаются.

Как показывает практика — это интересно целым 0 разработчикам. (поискал сейчас в кодовой базе в одной очень крупной российской софтовой компании, нашел одно упоминание restrict в библиотечном коде).

UFO landed and left these words here

DistortNeo Feb 24 2022 at 10:17

В общем случае это вообще нерешаемая задача. Виртуальная память, страницы, ссылающиеся на одну и ту же область памяти. Удачи анализировать таблицу страниц.

Gordon01 Feb 24 2022 at 20:57

В безопасных языках эта проблема решена

UFO landed and left these words here

Inspector-Due Feb 24 2022 at 14:06

Ни разу не программист на C, но про UB интересно стало.

Вот моя реализация:

#include <stdio.h>
#include <stdint.h>
#include <stdbool.h>
#include <stdlib.h>

bool doesOverlap(int *arr1, int size1, int *arr2, int size2) {
    uintptr_t a1 = (uintptr_t) arr1;
    uintptr_t a2 = (uintptr_t) arr2;

    if (a1 > a2) {
        a1 ^= a2;
        a2 ^= a1;
        a1 ^= a2;

        size1 ^= size2;
        size2 ^= size1;
        size1 ^= size2;
    }
    return a2 < a1 + size1 * sizeof(int);
}

int main() {
    int* arr = (int *) malloc(10 * sizeof(int));
    int* arr2 = (int *) malloc(10 * sizeof(int));

    printf("%d\n", doesOverlap(arr, 10, arr2, 10));

    return 0;
}

Пока знакомился с темой узнал, что если указатели указывают на разные объекты, то их нельзя сравнивать с помощью <, >, >=, <=. (Ведь мы как раз и хотим узнать, указатели на один и тот же объект или нет). Поэтому нам нельзя использовать эти операторы. Можно лишь использовать == и !=. Но тогда придётся пройтись по всем возможным значениям, чтобы выяснить, есть ли совпадение.

bool doesOverlap(int *arr1, int size1, int *arr2, int size2) {
    bool isOverlap = false;
    for (int i = 0; i < size1; i++) {
        for (int j = 0; j < size2; j++) {
            isOverlap |= (arr1 + i) == (arr2 + j);
            if (isOverlap) break;
        }
        if (isOverlap) break;
    }

    return isOverlap; 
}

Gordon01 Feb 24 2022 at 20:59

Можно лишь использовать == и !=

И эти тоже не сработают. Я выше привел пример. В сети еще куча вариантов (надо только погуглить).

А разгадка одна: указатель в си - это не адрес в памяти.

Inspector-Due Feb 25 2022 at 07:06

Забавная ситуация, кстати

#include <stdio.h>
#include <stdint.h>

int main(void) {
    int a, b;
    int *p = &a + 1;
    int *q = &b;
    printf("%p %p %d %d\n", (void *)p, (void *)q, p == q, (uintptr_t) p == (uintptr_t) q);
    return 0;
}

Компилировал с флагом -O2, вывод: 0x... 0x... 0 1

Может быть, стоит использовать uintptr_t, чтобы написать функцию doesOverlap?

UFO landed and left these words here

Bunikido Mar 8 2022 at 21:18

костылями вроде restrict

Не костыль, а принятый стандартом С99 инструмент

UFO landed and left these words here

wataru Feb 23 2022 at 10:24

Про статический массив и VLA — да, но только в текущей функции. Уже передать в другую функцию — надо не только указатель передавать, но и размер. Теоретически, компилятор мог бы это как-то сам сделать, но это не всегда надо. Вот и оверхед.

Что касается маллока, то размер есть у системы. Вы уверены, что рантайм Си хранит этот размер? Зачем ему копию у себя поддерживать? Она не всегда нужна. А есть этот размер у системы, потому что нельзя доверять пользователю системного апи тащить его от malloc'а до free из соображений безопасности. Потому что можно передать в free больше, чем вы запросили и потом утащить память другого процесса.

Как раз необходимость протаскивать самому размер массива — оверхед

Нет. Вы или протаскиваете его сами, если оно вам надо, или он не нужен и он нигде не протаскивается (как, например, с нуль-терминированными строками). Альтернатива, когда рантайм его помнит и как-то везде протаскивает, даже если оно не используется — это и есть ненужная работа, или как я ее назвал — оверхед.

Ну вообще, теоретически, компилятор мог бы сам определять, а используется размер или нет и как оптимизацию не передавать туда, где не надо. Но во времена дизайна Си это было наверно не реализуемо. Да и философия не в том, что оптимизатор потом все лишнее уберет, а не вводить ничего лишнего, если не надо.

DerRotBaron Feb 23 2022 at 20:04

Что касается маллока, то размер есть у системы. Вы уверены, что рантайм Си хранит этот размер?

Да, размер есть именно у аллокатора, который является частью рантайма. На каждую аллокацию маппить страницу памяти в здравом уме никто не будет. И ровно поэтому же система ничего не будет знать.

Ну вообще, теоретически, компилятор мог бы сам определять, а используется размер или нет и как оптимизацию не передавать туда, где не надо. Но во времена дизайна Си это было наверно не реализуемо. Да и философия не в том, что оптимизатор потом все лишнее уберет, а не вводить ничего лишнего, если не надо.

И именно это в современных реалиях осложняет как написание на Си безопасного и эффективного кода, так и его хорошую оптимизацию.
А что до "философии", то уже много лет оптимизирующие компиляторы с ней упорно борются, удаляя или эквивалентно заменяя то самое "лишнее". И судя по бенчмаркам и то и дело всплывающим историям с "оптимизациями UB", делают это они довольно успешно

Gordon01 Feb 24 2022 at 21:04

И именно это в современных реалиях осложняет как написание на Си безопасного и эффективного кода, так и его хорошую оптимизацию.

this.

Раст (и его потомки) показали на практике, что безопасность еще и может приносить перф, причем такой, что можно си обогнать. И все это без боли и страданий, автоматически.

UFO landed and left these words here

AnthonyMikh Feb 24 2022 at 20:31

Ну, то есть, да, в С как он написан это действительно невозможно, потому что типы не позволяют.

Таки позволяет, начиная с C99 (описано в блоке, который начинается со слов "In function parameter lists, additional syntax elements are allowed within the array declarators"):

void accept(int num[static 5]) {
    return;
}

void foo() {
    int arr[] = {1, 2, 3, 4, 5};
    accept(arr); // ок
}

void bar() {
    int arr[] = {1, 2, 3};
    accept(arr); // предупреждение от компилятора
}

Правда, это не мешает передать массив размера большего, чем требует функция :/

UFO landed and left these words here

AnthonyMikh Feb 26 2022 at 16:51

А, простите, я думал, вы говорите исключительно в контексте массивов со статически известной длиной.

UFO landed and left these words here

Gordon01 Feb 23 2022 at 19:18

Эх, я к этому и подводил, но что-то надоело болтать со студентами. Последнее время много от них статей стало, действительно что ли зачеты ставят за это...

Bunikido Mar 8 2022 at 21:12

Только вот из-за этого в си невозможны аггрессивные оптимизации, когда сразу инвестно что указатели не пересекаются.

Почему же? Есть такое ключевое слово, которым гарантируется что данный указатель является единственным способом получения доступа к объекту:

static void foo (int * restrict p1, const void * restrict p2);

Здесь указатели p1 и p2 могут быть «агрессивно» оптимизированы так как программист гарантирует что они ни с чем не пересекаются

lz961 Feb 21 2022 at 16:07

https://godbolt.org/z/ah46avxb6

поломалось, в выводе указатели отличаются, хотя код не изменен. Т.е. у вас настоящее UB

3, 0
0x7ffe1dae5124, 0x7ffe1dae5184

Gordon01 Feb 21 2022 at 17:33

Мне дальше говорить не интересно, сорян.

Т.е. у вас настоящее UB

И оно наглядно показывает что "Указатель в Си — это не адрес памяти. Это просто абстракция."

lz961 Feb 21 2022 at 18:52

Вот гляжу я на ваш ассемблированный пример (строки 22-24, соответствуют строке 6 исходной программы на языке С, оптимизация отключена), и вижу вполне конкретное действие (с точностью до некоторых тонкостей): в регистр rax кладётся значение указателя arr. Из этого значения вычитается 12 (=sizeof(int)*3). По адресу, хранящемуся в регистре rax кладётся тройка. Как видим, все адреса вполне конкретные.

mov rax, QWORD PTR [rbp-8] ; rax = arr sub rax, 12 ; rax = arr - 3 mov DWORD PTR [rax], 3; *rax = 3

https://godbolt.org/z/7ej4K376W

DistortNeo Feb 21 2022 at 13:29

arr[-1] указывает на последний байт 50го элемента

Абсолютно неверно. У вас тип arr — это int *, он будет указывать на 50-й элемент.
Никакого UB в данном случае не будет.

UFO landed and left these words here

Myxach Feb 21 2022 at 07:12

Указатели на функции

Серьезно? Это средство для реализации калбека. С чего это она не полезна?

Bunikido Feb 21 2022 at 11:03

Я не говорил что она не полезна. Каждому инструменту найдётся своё применение, статья о редких а не бесполезных инструментах. Конечно я не отрицаю того факта, что указатели на функции редко встречаются только на моей практике, может вы работайте в той сфере где без них никуда.

DrGluck07 Feb 21 2022 at 12:06

Например всё API X-Plane сделано на коллбеках. Да и на железе это очень часто используемая фича.

JerleShannara Feb 21 2022 at 12:27

STM32 HAL весь на коллбэках построен

firehacker Feb 25 2022 at 13:13

может вы работайте в той сфере где без них никуда.

Они нужны, полезны и частоиспользуемы в любой сфере, если только вы не работаете в сфере написания Hello world программ.

DoHelloWorld Mar 10 2022 at 08:02

Еще, как пример, часто их использую при реализации конечных автоматов. Чем по свичам прыгать, проще массив с указателями на функции сделать( на мой вкус).

aamonster Feb 21 2022 at 07:15

бОльшая часть – реально используемая.
А в примере с преобразованием указателя – вообще ошибка: в числе 0x2E6D6172676F7270 все 8 байт ненулевые, значит, после 8 символов начнёт печатать то, что дальше в памяти.

eurol Feb 21 2022 at 10:01

Не говоря уже о том, что приведенные двоичные числа вовсе непонятно, к чему относятся…

Bunikido Feb 21 2022 at 16:30

Двоичные числа в разделе с каламбуром типов относятся к примеру со строкой - это то самое длинное число только в двоичном виде, чтобы как бы показать что в памяти всё хранится одинаково.

eurol Feb 21 2022 at 17:01

Даже близко не вижу ничего похожего. Мало того, что в двоичном виде нулевой байт есть, а в исходном числе его нет, так там только одно четное число, которое в 16-ричном виде будет выглядеть как E8, а остальные числа все нечетные, в то время как в исходном числе четных несколько есть...

Bunikido Feb 21 2022 at 16:35

бОльшая часть – реально используемая.

Не спорю - если вы видели много проектов с такими конструкциями, то значит вы решайте те специфичные проблемы, которые трудно было бы решить без этих инструментов. Просто здесь приведены именно они потому, что они редко используются в средне-статистических программах на С. И учитывайте:

Сначала расскажу о базовых и часто встречаемых конструкциях, которые могут и вовсе не удивить опытных программистов на С, но вот уже ниже идут всё более редкие и интересные конструкции, которые уже далеко не часто можно где-либо встретить.

Если вы опытный программист на С то могу предположить что бОльшая часть находится именно вверху

А в примере с преобразованием указателя – вообще ошибка: в числе 0x2E6D6172676F7270 все 8 байт ненулевые, значит, после 8 символов начнёт печатать то, что дальше в памяти.

Поправил формат

unsignedchar Feb 21 2022 at 16:40

редко используются в средне-статистических программах на С

Знать бы, что это такое, среднестатистическая программа на С ;)

Xeldos Feb 21 2022 at 07:52

Временный файл, двойные указатели, указатели на функции, константные указатели - это для вас странные технологии? Разбиение строки на токены - странная технология? Вы точно пишете на C? Вы точно программируете?

aamonster Feb 21 2022 at 09:49

strtok – странная, да. Как минимум, strtok_s, а то strtok, хранящая свой контекст неизвестно где (а мало ли между вашими вызовами будет вызов strtok из какой-то библиотеки?) – лютый зашквар.

Bunikido Feb 21 2022 at 16:25

абсолютно согласен по поводу strtok.

Bunikido Feb 21 2022 at 16:28

Константные указатели находятся вверху, поэтому есть шанс что они не так уж и редко используются. Применение временному файлу я практически не нашёл, да и не особо видел. Смело присылайте свои идеи и применения, может добавлю их. Как упоминал @aamonster strtok действительно странная и нестабильная вещь. Лично я в большинстве случаев пишу свои функции для разбиения на токены.

Вы точно пишете на C? Вы точно программируете?

Тише, если бы я не писал на С и не программировал то вы бы эту статью не увидели )

Myxach Feb 21 2022 at 17:24

Ощущение, что вы только hello world писали

Devoter Feb 22 2022 at 22:28

strtok, действительно,имеет ограниченный спектр применения, так как требует крайне аккуратного применения, что для однопоточных программ при грамотном проектировании (большинство из coreutils), впрочем - не проблема (с strtok_s по производительности не сравнивал). tmpfile, действительно, с ходу не вспомнить, где встречалось, но идея-то понятна: можно подсунуть библиотекам, которые умеют работать только с файлами такой вот "файл". С натяжкой можно сравнить это с подходом интерфейсов Reader и Writer в Go.

RomanArzumanyan Feb 21 2022 at 07:54

Указатели на функции
И всё, что вообще с ними связано. Я думаю они не сильно полезны, максимум как аргумент для другой функции

В крупных проектах на С используются для реализации полиморфизма.

Например, в ядре Linux и 100500 мультимедиа библиотеках.

shaykemelov Feb 21 2022 at 08:53

что-то мне подсказывает, что это не такие уж и редко используемые возможности языка. про них я узнал всего лишь из одной книги https://www.ozon.ru/product/yazyk-programmirovaniya-c-lektsii-i-uprazhneniya-147927650/?sh=Lrd_YwAAAA, которая рассчитана на начинающих.

UFO landed and left these words here

Gordon01 Feb 21 2022 at 10:02

Так что удивляться тут нечему, надо просто использовать С для написания быстрых и лаконичных программ.

Жаль, только что компиляторы си не умеют сами разбираться, какие диапазоны памяти пересекаются, а какие нет

UFO landed and left these words here

Bunikido Feb 21 2022 at 16:24

делать предположения о психологическом состоянти автора программы.

Это уже какая-то новая фича. Ещё вспомнил прикол про то, что компилятор отказывается компилить неотформатированный код. Восстание машин не за горами =)

iliasam Feb 21 2022 at 19:32

«компилятор отказывается компилить неотформатированный код»
Python?

Bunikido Feb 21 2022 at 19:35

Не, это была картинка-прикол где компилятор выдавал сообщение об отказе компиляции из-за отсутствия отступов в коде на C++

UFO landed and left these words here

Gryphon88 Feb 21 2022 at 09:53

#undef широко используется при злоупотреблении макросами, в частности, при использовании x-macro, когда макрос с одним и тем же именем (традиционно Х, отсюда и название) разворачивается по-разному. Из безобидных примеров вспомню генерацию массива строк для enum, но вообще можно и полиморфизм реализовывать, и RAII, и много чего ещё. Дебажить, конечно, весело, но это всё равно лучше преобразования к void*.

unsignedchar Feb 21 2022 at 10:48

uint64_t x = 0x2E6D6172676F7270;
printf ("%s\n", (char*)&x);

Аффтар жжот. Если в программе есть ещё переменные — printf может вывести что угодно кроме ожидаемой строки.

Bunikido Feb 21 2022 at 11:12

uint64_t x = 0x2E6D6172676F7270;
printf ("%.8s\n", (char*)&x);

Поправил - поставил ограничение на вывод максимум 8 символов строки.

Gordon01 Feb 21 2022 at 11:19

uint64_t x = 0x2E006172676F7270;

Напечатает не то, что ожидалось

Bunikido Feb 21 2022 at 16:20

Правильно - у вас 7 байт другой. В оригинале он 6D а у вас 00.

unsignedchar Feb 21 2022 at 17:17

Дело в том что uint64_t* и char* - это сильно разные обьекты с сильно разными свойствами. У одного длина фиксированная, у другого может быть любая. Не нужно приводить их к друг другу. Просто не нужно. Даже в примере из 2 строк сделать более-менее ~~правильно~~ ожидаемо у вас получилось со 2 раза.

viordash Feb 21 2022 at 19:00

Дело в том что uint64_t* и char*

вы пишете именно про uint64_t* (указатель на uint64_t)? как может быть фиксированная длина у одного указателя, а у другого нет?

unsignedchar Feb 21 2022 at 19:42

У объекта, на который указывает указатель. Ну, вы поняли ;)

Gordon01 Feb 22 2022 at 07:21

Гениальное наблюдение, конечно, но вы попробуйте не просто думать (тут вам опыта не хватает), а запустить программу и посмотреть что именно она выведет.

uint64_t x = 0x2E006172676F7270;
printf ("%.8s\n", (char*)&x);

Bunikido Feb 22 2022 at 07:37

Вот моя версия:

#include <stdio.h>
#include <inttypes.h>

int main(void){
    uint64_t x = 0x2E6D6172676F7270;
    printf ("%.8s\n", (char*)&x);
}

Вывод: program.(правильный вывод)

А вот ваша версия:

#include <stdio.h>
#include <inttypes.h>

int main(void){
    uint64_t x = 0x2E006172676F7270;
	  printf ("%.8s\n", (char*)&x);
}

Вывод: progra (неправильный вывод)

Потому что как только printf доходит до предпоследнего байта (который у вас превратился в 00) вывод других символов завершается. Из-за этого мы потеряли букву m и точку. Всё верно

Gordon01 Feb 22 2022 at 14:51

Вывод: program.(правильный вывод)

С чего это он правильный? Такой же UB'шный, как и любые другие варианты.

Осталось только запустить на машине с другим порядком байтов, другим положением старшего бита или запретом невыравненного доступа к памяти...

И главное — повторять мантру:

Bunikido 21.02.2022 в 22:37
Я пишу на С потому что удобно - а не потому что много платят :) Это тот самый язык «что написано то и сделано»

Bunikido Feb 22 2022 at 18:05

Это тот самый язык «что написано то и сделано»

А у вас есть что возразить насчёт этого? Написал допустим + или -> и сразу можешь предсказать что будет на выходе

Gordon01 Feb 22 2022 at 18:34

А у вас есть что возразить насчёт этого?

Так вы не можете написать сниппет, который работал бы на чем-то кроме х86, но утверждаете что понимаете Си.

Написал допустим + или -> и сразу можешь предсказать что будет на выходе

Это не имеет никакого значения для бизнеса.

Bunikido Feb 22 2022 at 19:50

Почему же не могу? Пишите что должен делать сниппет (только не гигантский проект) а я реализую его как кросс-платформенный

Это не имеет никакого значения для бизнеса

Я здесь не для заработка денег :)

Gordon01 Feb 22 2022 at 19:56

Почему же не могу? Пишите что должен делать сниппет (только не гигантский проект) а я реализую его как кросс-платформенный

Вы себе сами выше придумали задачу: распечатать текст, который хранится в uint64. Ее хотя бы доделайте до конца.

Я здесь не для заработка денег :)

Бизнес-задача — это полезная работа, которую должен делать код. Мелочи одного единственного (причем одного из самых простых) языка для этого не играют никакого значения.

Даже если деньги не зарабатываются и это пет-проект.

Bunikido Feb 22 2022 at 20:39

Вы себе сами выше придумали задачу: распечатать текст, который хранится в uint64. Ее хотя бы доделайте до конца.

А кросс-платформенное решение я уже опубликовал в статье, вот оно краткое и лаконичное:

extern uint64_t x; //сама строка
if (!x)
    return;                    //если строка нулевая то завершаем работу функции
do {
    putchar((char)(x & 0xFF)); //печатаем байт
    x >>= 8;                   //удаляем байт
} while (x);                   //пока число не станет нулем

Это немного переделанная версия чтобы не возникло претензий к стилю написания. Я буду удивлён если такой код не заработает на какой-либо платформе имеющей хорошую реализацию С. И так этот код может НЕ заработать только по следующим причинам:

Платформа не поддерживает С
Платформа не имеет файла inttypes.h/stdint.h
uint64_t не хранится в памяти на этой платформе по порядку в одной ячейке и его байты раскиданы по памяти как связный список.
Платформа не имеет файла stdio.h

Не знаю как вы но платформы с выше перечисленным списком я не знаю и поэтому не могу полностью отрицать факта её существования. Можно ли такой код назвать кросс-платформенным?

oldnomad Feb 22 2022 at 21:41

Платформа не имеет 64-битного беззнакового типа без набивочных бит (и, соответственно, не определяет uint64_t).

Пункт 2 невозможен, наличия заголовка <stdint.h> требует стандарт (по крайней мере, для современного C). Пункт 3 также невозможен (C17 draft, 6.2.6.2). Пункт 4 вполне реален (freestanding implementation, C17 draft, 4 (6)), я писал для таких платформ.

Вдогонку, char может быть больше 8 бит (см. определение константы CHAR_BIT). Для такого я не писал, но знаю о существовании платформ с CHAR_BIT==32.

Полностью переносимый код -- это сложно. Порой, непереносимо сложно.

Devoter Feb 22 2022 at 22:38

А почему вы, собственно, решили, что порядок байт будет именно LE, а не BE? Стандарт это никак не регламентирует и ваш >> окажет совсем не тот эффект, что вы ожидаете.

Devoter Feb 22 2022 at 23:37

Вынужден покаяться, для unsigned типов сдвиг определен арифметически, то есть, как я понимаю, проблем в данном случае быть не должно.

viordash Feb 23 2022 at 10:30

А кросс-платформенное решение я уже опубликовал в статье, вот оно краткое и лаконичное:

ваш вариант с

printf ("%.8s\n", (char*)&x);

тоже такой же кросс платформенный, но имхо более понятный, так как не потребует рефакторинга.

Единственная проблема в обоих решениях это BE/LE, а это можно обойти директивой препроцессора, каким-нибудь #ifdef__BYTE_ORDER__ , или compile-time проверкой через определение положения не нулевого байта в переменной int32 == 1.

Gordon01 Feb 23 2022 at 19:14

Там, где запрещен невыравненный доступ к памяти этот код может упасть.

Также, этот код не соберется каким-нибудь IAR c включенными MISRA. Ну и главное - этот код не пройдет сертификацию у более-менее серьезных людей.

viordash Feb 23 2022 at 19:48

Какую из переменных, в упоминаемом мной коде вы считаете не выровненым?

Код не упадет, так как переменная uint64_t x выровнена естественным образом, и в printf передается адрес на эту переменную. А как внутри printf уже будут обрабатываться эти байты не очень важно.

уверен что и иар с MISRA норм соберет, но наверно для самой printf возникнет нюанс, какое-то из правил касалось переменного кол-ва аргументов

viordash Feb 23 2022 at 19:52

а код может не пройти ревью, согласен. Я не пропускаю подобные хаки

unsignedchar Feb 22 2022 at 19:22

Написал допустим + или -> и сразу можешь предсказать что будет на выходе

undefined behavior in c. 100500 примеров.

Bunikido Feb 22 2022 at 19:52

Опытные программисты на С умеют избегать UB жертвуя объёмом кода, и я стремлюсь следовать этому совету. Мы же тут не за краткостью кода собрались, а если да то тогда Python будет хорошим вариантом

UFO landed and left these words here

Bunikido Feb 21 2022 at 11:59

Спасибо за комментарий!

Если это программа на Си — то она достаточно близка к железу

Я тут рассказывал преимущественно про ту сферу которой я занимаюсь - разработка на С под Windows/Linux. Правда иногда чисто как любитель могу и микроконтроллеры программировать, но не так часто.

? А где тут редкость или ненужность?

В таких простых тестовых проектах на С (учебных или уже готовых но состоящих из одного файла) такой инструмент не нужен. Если вы работайте в компании которая пишет большие программы с большим кол-вом файлов и системами сборки - моё уважение.

>Константный указатель
Серьёзно?

Вполне. Лично я в большинстве случаев знаю и так что это read-only указатель и не пишу лишнего. Но когда хочу быть максимально уверен, то всё же делаю его const. Ну а что - функция большая и всё может быть.

Да что за бред? Откройте любой std-файл, там таких undef'ов выше головы. В пользовательском коде тоже иногда приходится делать, когда дело доходит до компиляции под Win.

Конечно их будет много, это же библиотека как никак. Там надо всё учесть для каждой платформы. Я же имел ввиду проекты на С пользовательские а не заголовочные файлы и библиотеки. (С компиляцией вы правы - иногда без них никуда), но опять таки они используются не так часто. Поэтому и попали в список.

Чего? Статью писал человек который в первый раз учебник открыл? Да любые таблицы коллбеков, обработчиков роутов, подвязки на сигналы, события — это всё указатели на функции и массивы.

Возьму на заметку, не имел дела с такими проектами.

Автор несет дичь. Массивы в школе видимо не проходил.

Я вот тут не совсем понял. Я написал:

void free_and_setto_NULL (void** ptr){free(*ptr);*ptr = NULL;}
Но что-то я сомневаюсь что в таком случае нельзя обойтись макросом, или вовсе сделать все эти операции на месте вызова.

А при чём тут free(), указатель на указатель и массивы? Я же выше писал в комментариях к коду что это может быть двумерный массив:

int **p; /* это всё ещё переменная, а может быть двумерный массив. А может надо изменить указатель через его адрес */

Всё я прекрасно проходил )

Это не запрещено, но так никто не делает, ...

Так никто не делает.

Конечно - этот список является сборником редких конструкций. А эти - настолько редкие что так никто и не пишет, потому что незачем. Но вот знать о таких моментах надо, может на собеседовании спросят...

Автор никогда не писал парсеров, поэтому видимо считает что можно парcер написать на sscanf. Для безопасности есть strtok_r. Strtok небезопасна не из-за того что редактирует строку а из-за отсутствия внешнего стейта.

Я не считаю что парсер можно написать на sscanf. Вот:

Хотя для парсинга простых шаблонных строк больше подходит sscanf()

Я написал для парсинга простых шаблонных строк. Я писал что-то про обычные парсеры? Как-раз интересная тема и хочу в ней разобраться. Скоро планирую создать парсер PDF-файлов, обязательно напишу пост про это - поделюсь опытом. То что strtok() редактирует строку это тоже небезопасно - об этом необходимо знать хотя-бы для того чтобы не обнаружить "сюрпризов" в строке после того как скормили её strtok().

Да откройте вы уже хоть один проект, связанный с железом!

Да я писал под Attiny13, Attiny45, Arduino Nano/Uno но не разу не использовал volatile. Не отрицаю факта что он используется в сложных комплексных проектах.

Редко, но встречаются.

В этом и есть фишка

Автор путает C++ auto и C auto. В С auto используется для указания расположения переменной (register, static, extern, auto)

Да, мне уже писали об этом. Спасибо что упомянули

Автор на С не писал, да? printf редко проверяется, scanf нужно проверять ВСЕГДА. Иначе есть шанс что вы будете читать мусор.

Да что-ж так жёстко ) Конечно писал, если бы не писал то и статью бы вы не увидели. Про проверку scanf() я не слышал, но спасибо за хорошую практику

А каламбур где? Автор не парсил входной поток байт от устройств?

Мы же используем научные понятия. Каламбур типизации (англ. type punning) — термин, который используется в информатике для обозначения различных техник нарушения или обмана системы типов некоторого языка программирования, имеющих эффект, который было бы затруднительно или невозможно обеспечить в рамках формального языка. Вот я здесь и обманул систему типов.

Это плохо, не делайте так

Я то не делаю - просто рассказываю

UFO landed and left these words here

Bunikido Feb 21 2022 at 12:25

Если у вас исходная переменная уже является указателем, то вам нужен еще один чтобы её поменять.

Я это знаю. Почитайте мои комментарии, я об этом писал:

int **p; /* это всё ещё переменная, а может быть двумерный массив. А может надо изменить указатель через его адрес */

UFO landed and left these words here

Bunikido Feb 22 2022 at 07:28

А что, в ардуино по-другому бывает?

Ардуино создавалась как лайтовая платформа для практики электроники (как конструктор). Библиотеки на любой вкус и цвет. Там конечно можно и на ассемблере писать, но зачем если есть прекрасный средне-уровневый С который в каждой микроволновке работает. Если интересно как работают железяки и процессоры на низком уровне и хочется разбираться то как по мне лучше сразу брать какой-нибудь MOS 6502 и писать на нём на чистом ассемблере. Правда у меня его пока нет =)

UFO landed and left these words here

Bunikido Feb 22 2022 at 09:06

А уж про саму оболочку вообще ничего нематерного сказать не смогу, это вообще какой-то конец 90х в плане комфорта и эффективности разработки

Ну да среда и правда сомнительная но наоборот заточена под комфорт как бы это парадоксально не звучало. В Arduino IDE (если вы о нём говорите) как по мне удобное решение - простой редактор, две кнопки для прошивки и компиляции. А что именно вам пришлось не по вкусу?

И учить с ассемблера я бы никому не рекомендовал начинать, есть предел того, куда стоит лезть с отсутствием понимания, на данный момент и Си работает отлично

Вот это да но почему никому? Если человек работает и прошивает или пишет прошивки для железа он хочет чтобы программа работала настолько быстро насколько это возможно в теории. Я не спорю - Си это один из немногих языков где можно писать дичь - while($>>=x^28+~10) f("89!"+op<<1);, и на том же языке можно писать вполне себе читабельные высокоуровневые программы. А если захочется - с помощью инструментов языка можно вставить ассемблерный код напрямую в С - тогда компилятор его компилировать не будет. Вот это я понимаю комбо =)

Си работает отлично

Несомненно. Правда иногда задумываешься - какую следующую коварную оптимизацию применит компилятор чтобы испортить твою программу?)

Gordon01 Feb 22 2022 at 14:58

Если человек работает и прошивает или пишет прошивки для железа он хочет чтобы программа работала настолько быстро насколько это возможно в теории

Нет конечно, скорость даже самых дохлых современных микроконтроллеров достаточна. Людям важна корректность.

В >50% случаев в финальные устройства заливаются прошивки скомпилированные в дебаге, о чем речь вообще?

Devoter Feb 22 2022 at 23:02

Да я писал под Attiny13, Attiny45, Arduino Nano/Uno но не разу не использовал volatile. Не отрицаю факта что он используется в сложных комплексных проектах

Как-то писал совсем небольшой проект на ATTiny13. Так вот, volatile просто необходим при работе с железом. Смысл его в том, что данный модификатор запрещает компилятору оптимизировать строки с доступом к переменной, объявленной как volatile. Например:

char working = 1;

void main(void)
{
  while (working)
  {
    // do something
  }
}

Имея такой код компилятор может запросто подставить 1 вместо обращения к переменной и дать на выходе бесконечный цикл. Но что, если мы хотим изменять значение в прерывании? Компилятор по-прежнему не знает, что эта переменная могла измениться, ведь она не изменяется нигде до чтения. Таким образом, без volatile изменение переменной в прерывании может быть проигнорировано, а с ним - не будет. Насчёт конкретно глобальных переменных уже точно не помню (давно дело было), но кто нам мешает глобально хранить лишь указатель на вполне локальную переменную? Надеюсь, смысл использования volatile теперь стал более прозрачен.

Gordon01 Feb 23 2022 at 19:29

Зато вопрос про volatile на собеседовании позволяет сделать хороший отсев)

DoHelloWorld Mar 10 2022 at 08:14

На эмбеддера это вообщепервый вопрос даже для джунов. Мне кажется, когда на С++ стандартный вопрос спрашивают: три основные понятния ООП, то в эмбеде три основных ключевых слова: volatile, static, register/extern и совсем для тех кто угарает: restrict.

cosmo68 Feb 21 2022 at 11:55

Конечно претензий к статье много, но спасибо автору за то, что вызвал бурную дискуссию в комментариях))) многим будет полезно

Bunikido Feb 21 2022 at 12:03

Спасибо)

претензий к статье много

Классика - это же первая статья

jakushev Feb 21 2022 at 11:57

volatile
Иногда компилятор может оптимизируя удалять целые куски кода. Чтобы такого не было желательно ставить ключевое слово volatile перед объявлением переменной, если вы хотите чтобы компилятор 100% не применил свои коварные оптимизации к этой переменной. (Хорошо что слово volatile не может игнорироваться, как иногда бывает с register, а то в этой жизни пришлось бы больше ни в чём не быть уверенным)

Ну сколько можно транслировать эту ошибку? volatile говорит о том, что переменная может измениться в другом месте (потоке / прерывании / аппаратном регистре).

dlinyj Feb 21 2022 at 12:14

80-90% использую на практике.

Bunikido Feb 21 2022 at 12:28

Вы большой молодец! Наверняка работайте с железом?

dlinyj Feb 21 2022 at 15:58

Именно так.

wataru Feb 21 2022 at 12:16

Про указатели на указатели на указатели… Не могу не поделиться своей болью, хоть это и C++. Сигнатура MFEnumDeviceSources:

HRESULT MFEnumDeviceSources(
  [in]  IMFAttributes *pAttributes,
  [out] IMFActivate   ***pppSourceActivate,
  [out] UINT32        *pcSourceActivate
)

Туда передается указатель на место, куда будет записан массив указателей на интерфейсы...

Вообще winapi полно подобных перлов.

Kelbon Feb 21 2022 at 12:21

не похоже на С++ (особенно in out)

wataru Feb 21 2022 at 12:24

Это типа комментарии на docs.microsoft.com

Bunikido Feb 21 2022 at 15:33

Интересная идея определить такие имена:

#define IN
#define OUT

А потом при объявлении функции с указателями в качестве аргументов указывать что именно она с ними делает:

void foo(IN const uint8_t * const some_input, OUT uint8_t *some_output){...}

Kelbon Feb 21 2022 at 15:37

интересная идея это использовать возвращаемое значение в качестве возвращаемого как ни странно значения, а то что тут обозначено как in делать const или принимать по значению

DrGluck07 Feb 21 2022 at 12:27

А какие глубины глубин скрыты внутри виндового API для драйверов. Структура из юнионов, которые являются структурами, ммм…

JerleShannara Feb 21 2022 at 12:32

Спасибо, у меня опять винддкшные флешбэки начались.

DrGluck07 Feb 21 2022 at 12:52

Двадцать лет назад мне на работе досталась поддержка VXD-драйвера к железке под ISA-слот. Естественно на ассемблере. И это, кстати, довольно простая штука, по сравнению с WDM. Потом пришлось писать под WDF, но к сожалению не пригодилось. Зато было весело и я узнал что такое Syser Kernel Debugger (или как оно там называется, уже забыл).

UFO landed and left these words here

DrGluck07 Feb 21 2022 at 12:19

Пост выглядит как «хипстеры познают язык C». Это я не со зла, просто пост вызывает некоторое недоумение, это основы языка C.
Вот ещё одна полезная штука при инициализации массива. В некоторых ситуациях очень удобно, но почему-то не все об этом знают.

int x[ 10 ] = { [ 0 ] = 42, [ 1 ] = 22, [ 2 ] = 73 /*и так далее, можно даже в любом порядке*/ }

Bunikido Feb 21 2022 at 12:36

Как по мне просто удлиняет программу (или по крайней мере пример такой).

Пост выглядит как «хипстеры познают язык C».

А это неплохое название кстати. Я сам новичок в С - прямиком из Паскаля. Может поэтому для опытных программистов С с опытом >10 лет этот пост может показаться странным.

Вот ещё одна полезная штука при инициализации массива. В некоторых ситуациях очень удобно, но почему-то не все об этом знают.

Глядя на ваш пример сразу вспомнилась такая конструкция:

return (vec2){
	.x = 10.0f,
  .y = 62.0f
};

Не знаю правда, можно и вернуть структуру традиционным путём:

return (vec2){10.0f, 62.0f};

Но кажется с именами компонентов более наглядно. Но то, что такое и к массивам применимо - не знал. Спасибо за приём осталось придумать как его использовать =) Ну разве что когда хотите не по порядку элементы указывать:

int x[ 10 ] = { [ 1 ] = 21, [ 0 ] = 30 ...

Интересно а так вообще можно делать? Надо будет проверить. В случае со структурами знаю что 100% можно менять поля местами.

DrGluck07 Feb 21 2022 at 13:05

Например у меня есть здоровенный enum, в котором перечислены типы самолётов. Мне нужно напечатать название в зависимости от типа. Получается вот такая конструкция:

static const char *aircraftNames[ AircraftTypesCount ] =
{
    [ AircraftTypeUnknown ] = "Undefined"
    , [ AircraftTypeWindow ] = "Unknown aircraft, Window mode"
    , [ AircraftTypeB737Zibo ] = "Boeing 737NG family by Zibo"
    , [ AircraftTypeB737700Eadt ] = "Boeing 737NG family by EADT"
    , [ AircraftTypeB737Default ] = "Boeing 737-800 default"
    , [ AircraftTypeB747Default ] = "Boeing 747-400 default"
// Ну и т.д.

Ну или большая таблица с параметрами для GPWS mode 4:

static const Mode4Params mode4Params[ GpwstMode4TypeCount ] =
{
    [ GpwsMode4Type1 ] = { .mode4A = { .gearDownSpeed = 190.0
                                           , .maxAltitude = 1000.0
                                           , .k = 8.333333
                                           , .b = -1083.0 }
                               , .mode4B = { .flapsDownAltitude = 245.0
                                             , .flapsDownSpeed = 159.0
                                             , .maxAltitude = 1000.0
                                             , .k = 8.2967
                                             , .b = -1074.1758 } }
    , [ GpwsMode4Type5 ] = { .mode4A = { .gearDownSpeed = 178.0
                                             , .maxAltitude = 1000.0
                                             , .k = 22.72727272
                                             , .b = -3545.0 }
                                 , .mode4B = { .flapsDownAltitude = 200.0
                                               , .flapsDownSpeed = 148.0
                                               , .maxAltitude = 1000.0
                                               , .k = 15.3846153
                                               , .b = -2076.923 } }

Что касается «удлиняет программу», то у меня нет задачи сделать короче, у меня есть задача написать так, чтоб и я об этом не забыл через год, и другие люди могли понять что происходит.
upd: Когда перечисление большое, можно облажаться с количеством элементов. Особенно при добавлении новой строки. А при такой инициализации можно случайно пропустить один элемент, и это плохо, но хотя бы не поедут все остальные. Короче, мне удобно. Как и инициализация с указанием имени члена структуры.

Bunikido Feb 21 2022 at 15:29

Ага, понятно теперь. То есть таким образом можно не запутаться в коде.

static const char *aircraftNames[ AircraftTypesCount ] =
{
    [ AircraftTypeUnknown ] = "Undefined"
    , [ AircraftTypeWindow ] = "Unknown aircraft, Window mode"
    , [ AircraftTypeB737Zibo ] = "Boeing 737NG family by Zibo"
    , [ AircraftTypeB737700Eadt ] = "Boeing 737NG family by EADT"
    , [ AircraftTypeB737Default ] = "Boeing 737-800 default"
    , [ AircraftTypeB747Default ] = "Boeing 747-400 default"
// Ну и т.д.

А это вообще хорошая практика каждый элемент enum называть с одного и того-же слова? Если да то возьму на заметку - нередко такое видел в больших программах.

Bunikido Feb 21 2022 at 15:35

А ещё какая-то у вас не сильно понятная форматировка (я привык что запятые ставятся на текущей строке, а не на следующей) - а у вас тут такие записи:

, .k = 15.3846153
, .b = -2076.923 }

Немного запутывает, также как и static перед массивом строк. У вас программа много-файловая?

DrGluck07 Feb 21 2022 at 16:30

1. Ну так табличное выравнивание по заветам PVS-Studio. Мне так удобнее.
2. Этот массив используется только в данном файле.

Bunikido Feb 21 2022 at 16:36

Понял, спасибо

UFO landed and left these words here

Bunikido Feb 22 2022 at 07:04

о том, что часть конструкций языка непонятно для чего нужны и их никто не использует

У вас абсолютное непонимание смысла статьи. Вот:

Сначала расскажу о базовых и часто встречаемых конструкциях, которые могут и вовсе не удивить опытных программистов на С, но вот уже ниже идут всё более редкие и интересные конструкции, которые уже далеко не часто можно где-либо встретить.

Где здесь упоминание что они не для чего не нужны и их никто не использует?

зачем вы написали этот пост

Я захотел попробовать себя в чём-то новом. Я уже давно читаю Хабр и решил тоже присоединиться - делиться и получать опыт. И несмотря на критику я буду продолжать это дело, и это нормально: как я понял хабрасообщество не всегда положительно относится к новичкам, но здесь как мы видим статья ушла в плюс, а это означает что кто-то нашёл или подчеркнул для себя что-то новенькое. Ошибки делают сильнее

unsignedchar Feb 22 2022 at 09:18

Не знаю правда, можно и вернуть структуру традиционным путём:

Можно ;)
C — язык возможностей ;)

darkdaskin Feb 21 2022 at 13:14

Отрицательные индексы у указателей вполне можно встретить в библиотечном коде. По этим адресам обычно хранятся метаданные, например, количество элементов для массива или тип объекта для сишной реализации ООП.

Bunikido Feb 21 2022 at 15:22

Про библиотечный код вы верно упомянули. В пользовательских программах на С редко такое встретить можно.

сишной реализации ООП.

Сам одно время рассматривал этот момент, и базовые вещи по типу методов через указатели на функции. Но зачем, когда есть плюсы =)

UFO landed and left these words here

Bunikido Feb 21 2022 at 15:19

brightness это массив из индексов (яркостей). К примеру такой:

const uint8_t brightness[10] = {2, 3, 4, 5, 6, 7, 6, 5, 4, 3};

Если запустить упомянутый вами код вместе с приведённым массивом на выводе будет простой ASCII градиент: c;:,. .,:;

Я этот пример привёл потому что таким приёмом часто пользуются при создании ASCII графики, а массив записывают сразу, дабы сэкономить память.

Myxach Feb 21 2022 at 15:36

В самом деле, немногие начинающие программисты знают что можно объявить массив/строку и взять элемент из неё.

стоп, что? А почему? А Можно ли их назвать хотя-бы начинающими? Звучит как те, кто язык вообще в жизни не видел

Bunikido Feb 21 2022 at 16:57

А по вашему мнению начинающие программисты на С - это сколько лет человек должен программировать чтобы стать хотя-бы начинающим?

Myxach Feb 21 2022 at 17:23

Хотя бы Книгу или редактор открывать это уже будет выше уровнем, чем то что вы описали

pronvit Feb 21 2022 at 20:09

Это статья-стёб, или почему кто-то ее плюсует?

Bunikido Feb 21 2022 at 20:27

Плюсует - значит понравилось. И нет статья не стеб - какие-то сомнения? Я жду конструктивной критики, а не вот это вот всё =)

unsignedchar Feb 22 2022 at 06:38

Авторское видение ненужности некоторых фич С вызывает интерес ;) Если бы в каждом утверждении были бы слова ИМХО - было бы более правильно. А критиковать то, что автор не знает, зачем указатель на функцию, или указатель на указатель, это неконструктивно.

win32asm Feb 22 2022 at 09:29

В Си статическими удобно делать мелкие функции определяемые в хедерах.

Sizeof это оператор, такой же как +, - или ?:. Формально в скобках (как вызов функции) пишется напрямую тип, а без скобок - выражение, размер типа которого нам нужен. Практически gcc и clang считают оба использования синонимичными, но есть люди которые настаивают на различии для большего контекста.

Bunikido Feb 22 2022 at 09:37

В Си статическими удобно делать мелкие функции определяемые в хедерах.

А зачем писать функции в хедерах если можно сразу написать их в том файле который подключает этот хедер так ещё и статические. Может тут какой-то трюк?

win32asm Feb 22 2022 at 10:36

Ну, например, если в хедере определена общая для нескольких файлов структура, и обращение к каким-то полям удобно выделить в функцию:

struct Object {
    enum State state;
    ...
};
static bool objectInTransition(struct Object *obj) {
   return obj->state == STATE_TRANSITION_1 ||
          obj->state == STATE_TRANSITION_2;
}

andy_p Feb 22 2022 at 17:21

Соответственно scanf() возвращает кол-во считанных байт.

Нет. scanf возвращает количество успешно считанных полей.

Devoter Feb 22 2022 at 23:27

Про union как способ реинтерпретации тут уже написали (использовать с осторожностью), но главный, как по мне смысл: экономия памяти. Например, у нас некоторое значение может быть как int так и double, а то и что поэкзотичней (разные структуры), но мы знаем, что значение может быть только одно в один момент времени. Таким образом, нам не нужно выделять память под два поля в структуре, например, а лишь под объединение, которое будет иметь размер максимального типа: sizeof(double) < sizeof(int) + sizeof(double).

И небольшое напутствие на будущее: не стоит считать себя сколь угодно серьезным разработчиком и пытаться давать экспертные заключения, если все ваши приложения состоят из одного файла (а если это файлы по 4000+ строк - стоит обратиться к специалисту...)).

BitLord Feb 23 2022 at 14:19

Прошу прощения у сообщества, не имею возможности поставить банальный плюс статье, поэтому выражаю благодарность комментарием. Весьма познавательно и вызвало интересную дискуссию в комментариях.

Bunikido Feb 23 2022 at 14:22

Спасибо =)

redf1sh Mar 9 2022 at 18:44

Статья довольно странная, но основной профит от комментариев. Сам пишу кусок компилятора на С11, но о некоторых вещах и не догадывался. Пора уже создавать себе склад таких заковыристых вещей, чтобы потом знать что с ними делать.

Bunikido Mar 10 2022 at 11:23

А что именно странного в статье вы заметили?