Ukrainskiy Feb 28 at 14:57

Эффективное межпроцессное взаимодействие с использованием IPC и Shared Memory

Medium

10 min

3.5K

C * C++ * Programming * Development for Linux *

Tutorial

В данной статье рассматривается использование механизма разделяемой памяти (shared memory) для эффективной передачи данных между независимыми процессами в рамках одной машины. Цель статьи — продемонстрировать не только базовые принципы работы с разделяемой памятью, но и показать, как размещать в ней высокоуровневые контейнеры, такие как хеш-таблицы (unordered_map), а также рассмотреть практический пример потоковой обработки данных при помощи кольцевого буфера.

Введение

В современном программировании минимизация издержек на передачу данных между системами играет ключевую роль. Быстрое и эффективное межпроцессное взаимодействие (IPC, Inter-Process Communication) позволяет существенно улучшить производительность приложений. Одним из самых быстрых методов организации такого взаимодействия является использование разделяемой памяти. Этот подход даёт процессам возможность обращаться к одним и тем же данным напрямую, минуя промежуточные каналы — такие как сокеты или файлы.

Существуют популярные инструменты для межсетевого взаимодействия, такие как Redis, Apache Kafka, RabbitMQ и др., которые широко используются для обмена данными между распределенными системами. Однако для задач, где все процессы запущены на одной машине, такие решения могут оказаться излишними и неоптимальными по производительности.

Применение межпроцессного взаимодействия с использованием разделяемой памяти оправдано в случаях, когда у нас есть несколько процессов, выполняющихся на одной машине, и эти процессы должны обмениваться данными. Это могут быть системы реального времени, управляющие каким-либо оборудованием, где один процесс считывает данные, а другой их обрабатывает; системы видеонаблюдения с обработкой данных технологиями компьютерного зрения; обработка мультимедиа данных или финансовые системы, где важна мгновенная реакция на поступающий поток данных.

Немного теории

IPC (Inter-Process Communication) — набор механизмов, позволяющих процессам координировать действия и обмениваться информацией. Одним из таких механизмов является разделяемая память (shared memory), используемая в данном примере. Мы рассматриваем POSIX-совместимую реализацию в Linux. Существует ещё реализация System V (System Five - одна из первых Unix-подобных операционных систем, разработанных компанией AT&T и выпущенных в начале 1980-х годов), иногда на нее все еще можно наткнуться.

Рассмотрим функции для работы с разделяемой памятью в linux:

shm_open: Открывает или создает объект разделяемой памяти POSIX.

int shm_open(const char *name, int oflag, mode_t mode);

name: Имя разделяемой памяти.
oflag: Флаги открытия (например, O_RDWR, O_CREAT).
mode: Режим доступа при создании (например, S_IRUSR | S_IWUSR).

Возвращает файловый дескриптор, к которому применимы такие же функции, как и к обычному файлу: ftruncate, close, fstat, fchmod и т.д.

shm_unlink: Удаляет объект разделяемой памяти POSIX.

int shm_unlink(const char *name);

name: Имя разделяемой памяти для удаления.

Важно помнить, что shm_unlink не освобождает память и она может продолжать использоваться другими процессами пока они ее не освободят.

Области разделяемой памяти, создаваемые с помощью shm_open, находятся в файловой системе "tempfs" — виртуальной файловой системе, которая хранит файлы в оперативной памяти, а не на диске. Обычно эти файлы располагаются по пути /dev/shm. Далее мы можем «замапить» (привязать) участок разделяемой памяти в локальное адресное пространство процесса, используя mmap. В результате появится участок памяти, общий для всех процессов, открывших этот же shm-объект.

При работе с разделяемой памятью важно помнить, что она не освобождается автоматически при завершении процесса, который её создал. В отличие от обычной динамической памяти, привязанной к конкретному процессу, разделяемая память продолжает существовать в системе, пока не будет явно удалена. Это может привести к утечкам памяти и переполнению доступного адресного пространства, особенно если программы, использующие shared memory, перезапускаются без корректного освобождения ресурсов.

Пример: размещение boost::unordered_map в Shared Memory

Ниже приведён минималистичный пример, демонстрирующий, как можно расположить boost::unordered_map в разделеяемой памяти с помощью Boost.Interprocess. Код создаёт сегмент разделяемой памяти, объявляет в нём хеш-контейнер на основе unordered_map<string, string> и вставляет несколько элементов.

#include <functional>
#include <iostream>
#include <string>

#include <boost/unordered_map.hpp>
#include <boost/container_hash/hash.hpp>
#include <boost/interprocess/managed_shared_memory.hpp>
#include <boost/interprocess/allocators/allocator.hpp>
#include <boost/interprocess/containers/string.hpp>

namespace ipc = boost::interprocess;

using ShmCharAllocator = ipc::allocator<char, ipc::managed_shared_memory::segment_manager>;
using ShmString = ipc::basic_string<char, std::char_traits<char>, ShmCharAllocator>;

using KeyType = ShmString;
using MappedType = ShmString;
using KeyValuePair = std::pair<const KeyType, MappedType>;

using ShmemAllocator = ipc::allocator<KeyValuePair, ipc::managed_shared_memory::segment_manager>;
using SharedMap = boost::unordered_map<KeyType, MappedType,
                                       boost::hash<KeyType>,
                                       std::equal_to<KeyType>,
                                       ShmemAllocator>;

auto shm_name = "MySharedMemory";

int main() {
    // Создаем или открываем сегмент разделяемой памяти размером 64 KB
    ipc::managed_shared_memory segment(ipc::open_or_create, shm_name, 65536);
  
    // Конструируем или открываем объект SharedMap в shared memory с именем "SharedMap"
    SharedMap* myMap = segment.find_or_construct<SharedMap>("SharedMap")
        (10, boost::hash<KeyType>(), std::equal_to<KeyType>(), segment.get_allocator<KeyValuePair>());

    // Создаем аллокатор для символов из сегмента shared memory
    ShmCharAllocator charAlloc(segment.get_segment_manager());

    // Создаем ключи и значения с использованием аллокатора, чтобы их внутренние данные также были в shared memory
    KeyType key1("hello", charAlloc);
    MappedType value1("world", charAlloc);
    KeyType key2("ключ", charAlloc);
    MappedType value2("значение", charAlloc);

    // Вставляем элементы в SharedMap
    myMap->insert(std::make_pair(key1, value1));
    myMap->insert(std::make_pair(key2, value2));

    std::cout << "Value for 'hello': " << myMap->at(key1) << std::endl;

    // Удаляем контейнер и сермент разделяемой памяти
    segment.destroy<SharedMap>("SharedMap");
    ipc::shared_memory_object::remove(shm_name);
    return 0;
}

Давайте разберем, что тут происходит. Для начала мы определяем псевдонимы типов для работы со строками, мы определили ShmString как тип ipc::basic_string с аллокатором ShmCharAllocator, который выделяет память из сегмента shared memory. В библиотеке boost::interprocess есть умный указатель offset_ptr, в отличии от обычного указателя, он хранит не абсолютный адрес, а смещение относительно начала сегмента памяти, это гарантирует, что он будет корректно работать в других процессах, в которых локальный адрес разделяемой памяти может отличаться.

Контейнер SharedMap создается с типами KeyType и MappedType, которые теперь являются ShmString. При вызове segment.construct<SharedMap>("SharedMap") передаются параметры конструктора (начальное число бакетов, функции хеширования, сравнения и аллокатор), который также получает память из общего сегмента.

При вставке элементов мы создаем объекты ключей и значений, используя аллокатор charAlloc, полученный из сегмента. Это гарантирует, что все данные (включая строки) будут корректно размещены в shared memory и их смогут использовать другие процессы смонтировав разделяюмую память в свое локальное адресное пространство.

Потоковая обработка данных через Ring Buffer размещенный в Shared Memory

В качестве примера работы с разделяемой памятью напишем две программы, которые обмениваются данными через Ring Buffer, расположенный в разделяемой памяти. Первая программа — генератор — заполняет буфер случайными значениями от 0 до 255, вторая — анализатор — ищет в буфере восходящие последовательности из n элементов и печатает их в консоль.

Такой подход особенно полезен в сценариях, где важна высокая скорость передачи данных и минимальные задержки, например:

Обработка потоков данных с датчиков в системах реального времени.
Видеонаблюдение и анализ мультимедийных данных.
Локальное межпроцессное взаимодействие в высоконагруженных системах.

В этом примере мы не будем продумывать механизм защиты от потери части данных при перезаписи кольцевого буффера в случае если скорость поступления данных выше чем скорость обработки.

Структура буфера

#include <iostream>
#include <vector>
#include <random>
#include <atomic>
#include <thread>
#include <chrono>

#define BUFFER_SIZE 1024

struct RingBuffer {
    std::atomic<uint32_t> write_index{0};  // Потокобезопасный индекс записи
    std::atomic<uint32_t> read_index{0};   // Потокобезопасный индекс чтения
    uint8_t data[BUFFER_SIZE];  
};

write_index — указывает, куда будет записываться следующий байт данных.
read_index — указывает на позицию, с которой будет прочитан следующий байт.
data — сам буфер фиксированного размера BUFFER_SIZE.

Этот буфер работает по принципу FIFO (First In, First Out). При достижении конца массива запись и чтение продолжаются с начала (write_index % BUFFER_SIZE).

Генератор данных

void generate_data(RingBuffer* ring_buffer) {
    std::random_device rd;
    std::mt19937 gen(rd());
    std::uniform_int_distribution<uint8_t> dist(0, 255);

    while (true) {
        const uint8_t value = dist(gen);
        uint32_t write_index = ring_buffer->write_index.load(std::memory_order_relaxed);
        uint32_t next_write_index = (write_index + 1) % BUFFER_SIZE;

        // Проверяем, не догнали ли мы read_index (буфер полон)
        if (next_write_index == ring_buffer->read_index.load(std::memory_order_acquire)) {
            std::this_thread::yield();  // Даем время анализатору обработать данные
            continue;
        }

        ring_buffer->data[write_index] = value;
        ring_buffer->write_index.store(next_write_index, std::memory_order_release);
    }
}

Для генерации случайных данных используется std::random_device и std::mt19937 для генерации случайных чисел в диапазоне 0–255. Значение записывается в позицию write_index % BUFFER_SIZE. Индекс записи увеличивается циклически ((write_index + 1) % BUFFER_SIZE).

Этот код не учитывает возможность перезаписи данных, если write_index догонит read_index. В данном случае мы просто ждем когда обработчик сделает свою работу, это может привести к потере информации.

Анализатор данных

void analyze_data(RingBuffer* ring_buffer, int sequence_length) {
    std::vector<uint8_t> sequence;

    while (true) {
        uint32_t read_index = ring_buffer->read_index.load(std::memory_order_relaxed);

        if (read_index == ring_buffer->write_index.load(std::memory_order_acquire)) {
            std::this_thread::yield();  // Буфер пуст, ждем
            continue;
        }

        uint8_t value = ring_buffer->data[read_index];
        uint32_t next_read_index = (read_index + 1) % BUFFER_SIZE;

        // Запоминаем последовательность восходящих чисел
        if (sequence.empty() || value > sequence.back()) {
            sequence.push_back(value);
        } else {
            if (sequence.size() >= static_cast<size_t>(sequence_length)) {
                for (uint8_t num : sequence) {
                    std::cout << (int)num << " ";
                }
                std::cout << std::endl;
            }
            sequence.clear();
            sequence.push_back(value);
        }

        ring_buffer->read_index.store(next_read_index, std::memory_order_release);
    }
}

Анализатор сравнивает read_index и write_index, чтобы убедиться, что есть новые данные. Читается очередное значение, и read_index сдвигается. Если значение больше предыдущего — добавляется в последовательность. Если последовательность прерывается — проверяется её длина и выводится в консоль. Этот код является базовым примером, но он закладывает основу для высокопроизводительных систем передачи данных с использованием разделяемой памяти.

Альтернативы разделяемой памяти

Хотя разделяемая память является одним из самых быстрых методов межпроцессного взаимодействия (IPC), она не всегда является оптимальным решением. В зависимости от требований к синхронизации, надежности и масштабируемости можно рассмотреть следующие альтернативные механизмы:

Сокеты (Unix Domain Sockets, TCP/IP, ZeroMQ) – подходят как для локального, так и для сетевого взаимодействия. Хотя передача данных через сокеты требует дополнительных копирований, они обеспечивают гибкость, поддержку масштабирования и более удобное управление жизненным циклом соединений.
Очереди сообщений (Message Queues, например, POSIX MQ, System V MQ, Boost.Interprocess Message Queue) – удобны для организации асинхронного взаимодействия между процессами. Они обеспечивают упорядоченную передачу данных и встроенные механизмы синхронизации, но могут иметь накладные расходы на управление очередями.
Каналы (Pipes, Named Pipes – FIFO) – позволяют передавать потоковые данные между процессами. Подходят для линейного обмена, но не обеспечивают произвольного доступа к данным, как shared memory.
Файлы и mmap (Memory-mapped files) – данные могут храниться в файлах и отображаться в адресное пространство нескольких процессов. Такой подход удобен для работы с большими объемами данных и допускает персистентность, но вносит задержки при взаимодействии с файловой системой.
Базы данных и брокеры сообщений (Redis, Kafka, RabbitMQ, PostgreSQL NOTIFY/LISTEN) – используются для надежного и структурированного хранения и передачи данных. Эти решения подходят для сложных сценариев, но могут быть избыточными для локального IPC.

Выбор метода IPC зависит от конкретного случая: если важны минимальные задержки и высокая производительность – shared memory отличный выбор; если критична надежность передачи данных – очереди сообщений или брокеры могут быть предпочтительнее.

Заключение

IPC (Inter-Process Communication) — это важнейший механизм современного системного программирования. Он позволяет нескольким процессам координировать работу и передавать данные друг другу. Разделяемая память (shared memory) является одним из самых быстрых методов IPC, так как процессы фактически работают с общим адресным пространством, избегая копирования через ядро. Однако такой подход требует аккуратного управления синхронизацией и ответственным обращением с данными, чтобы избежать гонок.

Многие широко используемые программы активно применяют разделяемую память для ускорения работы и повышения эффективности. Например, веб-браузеры (Chrome, Firefox) используют shared memory для передачи данных между процессами рендеринга страниц и основным процессом, что снижает задержки и экономит ресурсы. СУБД (PostgreSQL, MySQL) применяют её для кэширования данных и ускорения работы с запросами. Графические системы (например, X11, Wayland, Vulkan, OpenGL) используют разделяемую память для быстрого обмена данными между приложениями и видеокартой. Также shared memory активно задействуется в мультимедийных приложениях (например, в обработке аудио и видео), а также в виртуализации (например, для обмена данными между гостевой ОС и хостом в системах типа QEMU/KVM и VMware).

Используя разделяемую память, мы можем существенно повысить производительность систем, где процессы часто обмениваются большими объёмами данных. Примеры с unordered_map и кольцевым буфером показывают две стороны работы с shared memory: хранение высокоуровневых контейнеров (через Boost.Interprocess) и реализацию низкоуровневых структур (своих буферов). При этом не стоит забывать о синхронизации и выборе политики при переполнении буфера. Правильное проектирование IPC — это баланс между скоростью, надёжностью и удобством разработки.

Hubs: