Разбор уровней валидации / Хабр

Введение

Валидация и обработка ошибок — это фундаментальная задача, с которой сталкивается каждый разработчик, будь то работа с HTTP-запросами, управление очередями задач, обработка событий или асинхронная коммуникация между компонентами системы.

Почему это важно?
Выбор стратегии напрямую влияет на:

Производительность: синхронные запросы могут блокировать выполнение кода, а асинхронные подходы разгружают сервер.
Масштабируемость: очереди задач и брокеры сообщений позволяют распределять нагрузку между сервисами.
Безопасность: некорректная валидация входящих данных или игнорирование CSRF-токенов может привести к уязвимостям.

Важно: Даже идеальный фронтенд не заменяет валидацию на бэкенде!

Когда бекенд принимает данные с фронтенда/стороннего апи или скрипта, принцип «Never Trust User Input» (никогда не доверяй пользовательским данным) — это основа безопасности. Валидация данных в бэкенде — многоуровневый процесс, где каждый этап решает свои задачи:

1. Фреймворк — первый фильтр, который проверяет структуру запроса: типы данных, обязательные поля, базовые форматы (например, валидность email через регулярные выражения).

2. Доменный слой (DDD) — здесь данные проверяются в контексте бизнес-логики. Например, нельзя создать заказ на дату из прошлого, даже если она технически корректна. Такие правила инкапсулируются внутри сущностей (Entities) или агрегатов (Aggregates), чтобы сохранить целостность домена.

3. ORM — библиотеки вроде Doctrine или ActiveRecord ORM обеспечивают валидацию на уровне объектной модели. Они проверяют форматы данных, соответствие типов и бизнес-правила до выполнения запросов к БД. Например, валидация электронной почты по формату, проверка диапазонов значений. ORM также защищает от SQL-инъекций за счет подготовленных выражений и экранирования входных данных.

4. База данных — последний рубеж защиты данных. Здесь работают встроенные ограничения БД: CHECK, UNIQUE, FOREIGN KEY, а также триггеры и хранимые процедуры. Эти механизмы обеспечивают целостность данных независимо от кода приложения. Например, CHECK (price > 0) на уровне БД гарантирует, что товар с отрицательной ценой не будет сохранен, даже если все предыдущие уровни валидации пропустили ошибку.

5. Безопасность — специализированные проверки: санитизация HTML-тегов (против XSS), проверка CSRF-токенов, авторизация доступа. Эти механизмы часто встраиваются в мидлвары или фильтры API-шлюзов.

Пример взаимодействия уровней: Пользователь отправляет дату рождения 2077-01-01.

- Фреймворк проверяет формат даты (корректно).

- Домен обнаруживает, что дата в будущем, и отклоняет запрос.

- Если ошибка пропущена, БД сработает благодаря триггеру BEFORE INSERT, который сравнивает дату с текущей.

Важно: Каждый уровень дублирует проверки предыдущих, создавая «защитные слои». Это снижает риски, даже если один из уровней оказался уязвим.

Фреймворк

Первый уровень валидации: защита на уровне фреймворка

Представьте, что ваше приложение — это крепость. Первая линия обороны — это ворота, которые не пропускают врагов и мусор. Валидация на уровне фреймворка — именно такие ворота. Она не даёт некорректным данным прорваться в бизнес-логику, сохраняя код чистым, а пользователей — защищёнными. Давайте разберём, как это работает в Symfony и Laravel, и почему нельзя останавливаться только на этом уровне.

Валидация в фреймворках строится на разных архитектурных подходах, но цель одна — изолировать сырые данные от бизнес-логики.

Symfony

Symfony: Mapping Request DTO

Symfony использует концепцию чистого DTO (Data Transfer Object). Вы описываете класс-контейнер для входных данных с аннотациями валидации, и фреймворк автоматически проверяет их перед передачей в контроллер. Это позволяет сохранить слой приложения «чистым», обеспечивает строгое разделение с использованием Data Transfer Objects (DTO) со встроенной валидацией.

Как это работает:

Определите класс DTO с правилами валидации (через аннотации, YAML или XML).
Фреймворк автоматически проверяет входящие данные до их попадания в контроллер.

Ключевые преимущества:

Поддерживает чистоту слоёв приложения (нет инфраструктурного кода в контроллерах).
Повторно используемые правила валидации (например, @Assert\Email, @Assert\Range(min: 1, max: 100)).

Возможности компонента Validator:

Поддерживает аннотации (например, @Assert\NotBlank), YAML и��и XML для определения правил.
Встроенные валидаторы для типов данных, форматов (email, URL) и числовых диапазонов.
Пользовательские ограничения через интерфейсы Constraint и ConstraintValidator.

Пример:

use Symfony\Component\Validator\Constraints as Assert;

final readonly class CreateUserRequest {
    #[Assert\NotBlank]
    #[Assert\Email]
    public string $email;

    #[Assert\NotBlank]
    #[Assert\Length(min: 6)]
    public string $password;
}

Laravel

Laravel: Form Requests & Гибкая Валидация

Laravel использует прагматичный подход с Form Requests и встроенной валидацией.

Как это работает:

Создайте отдельный класс запроса (например, php artisan make:request StoreUserRequest).
Определите правила в виде массива или строки с разделителями:
```
'email' => 'required|email|unique:users'
```

Ключевые преимущества:

Декларативный синтаксис (правила в виде массива или строки).
Автоматический редирект или JSON-ответ с ошибками.

Гибкая валидация:

Используйте фасады (Validator::make()) для быстрых проверок.
Пользовательские правила через Rule::class или замыкания (closure-based rules).

Пример:

public function rules() {
    return [
        'email' => 'required|email|unique:users',
        'password' => 'required|min:6',
    ];
}

Laravel и DTO: Ручное преобразование для чистой архитектуры

В отличие от Symfony, Laravel не имеет встроенной поддержки DTO, но разработчики используют обходные пути, чтобы избежать попадания сырых объектов Request в бизнес-логику. Вот как это обычно реализуется:

1.Ручное преобразование в DTO
Преобразование $request->all() в специальный объект (например, UserData или OrderData) перед передачей в сервисные классы.

final class UserStoreAction {
    public function __invoke(CreateUserRequest $request): void {
        $userData = new UserData(
            email: $request->validated('email'),
            password: $request->validated('password')
        );
        UserService::create($userData); // Clean domain service call
    }
}

2.Data Mapper. Используйте библиотеки, такие как Spatie's Data Transfer Object или Laravel Data, для автоматического сопоставления запросов с типизированными объектами.

use Spatie\DataTransferObject\DataTransferObject;

final readonly class UserData extends DataTransferObject {
    public string $email;
    public string $password;
}

// In action:
$userData = new UserData(...$request->validated());

3.Ручной кастинг. Используйте абстрактный запрос для кастования магических свойств.

/**
 * Abstract request class that provides property access with automatic type casting.
 *
 * Example usage:
 *
 * ```php
 * /**
 *  * @property-read int $userId
 *  * @property-read string $email
 *  *\/
 * final class MyRequest extends AbstractRequest
 * {
 *     private const string FIELD_USER_ID = 'userId';
 *     private const string FIELD_EMAIL   = 'email';
 *
 *     protected const array PROPERTY_TYPE_MAP = [
 *         self::FIELD_USER_ID => 'int',
 *         self::FIELD_EMAIL   => 'string',
 *     ];
 * }
 *
 * is_int($request->userId)   // true
 * is_string($request->email) // true
 *
 * ```
 */
abstract class AbstractRequest extends FormRequest
{
    protected const PROPERTY_TYPE_MAP = [];

    public function __get(mixed $key)
    {
        $value = $this->input($key);
        if (isset(static::PROPERTY_TYPE_MAP[$key])) {
            return $this->castValue($value, $key, static::PROPERTY_TYPE_MAP[$key]);
        }
        return $value;
    }

    protected function castValue(mixed $value, string $key, string $type): mixed
    {
        $isNullable = str_starts_with($type, '?');
        if ($isNullable) {
            if ($value === null) {
                return null;
            }
            $type = substr($type, 1);
        }
        if (class_exists($type) && is_a($type, BackedEnum::class, true)) {
            return $type::from($value);
        }
        return match ($type) {
            'int' => (int) $value,
            'float' => (float) $value,
            'bool' => (bool) $value,
            'string' => (string) $value,
            'array' => (array) $value,
            'datetime_immutable' => $this->castToDateTimeImmutable($value),
            default => $value,
        };
    }

    protected function castToDateTimeImmutable(mixed $value): ?DateTimeImmutable
    {
        try {
            return new DateTimeImmutable($value);
        } catch (Throwable) {
            return null;
        }
    }
}

Почему это важно

1. Защита от ошибок
Предотвращает случайную зависимость от структуры запроса (например, $request->input('x.y')), которая может измениться и сломать логику.

2. Типизация данных
Обеспечивает строгую проверку типов свойств (например, string $email), снижая риск ошибок из-за неверных данных.

3. Удобство тестирования
DTO гораздо проще мокать и создавать вручную, чем объекты Request, что ускоряет и упрощает тестирование.

Ключевые преимущества

Стандартизированные ошибки на раннем этапе
- Возвращает предсказуемые HTTP-статусы (например, 422 Unprocessable Entity вместо 500 Server Error).
- Структурированные сообщения об ошибках упрощают интеграцию с фронтендом.
Интеграция с инструментами
- Правила валидации автоматически попадают в документацию Swagger/OpenAPI, помогая фронтенд-разработчикам и QA-командам понимать требования API.
Устранение шаблонного кода
- Нет необходимости в ручных проверках, например if (!$request->has('email')) — фреймворк делает это автоматически.
Защита бизнес-логики
- Бизнес-логика остаётся чистой от низкоуровневых проверок (например, "Корректен ли формат email?").
- Позволяет сосредоточиться на предметной области (например, "Может ли этот пользователь забронировать VIP-место?").
Встроенная безопасность
- Валидаторы часто санируют данные (например, правило email в Laravel удаляет опасные символы).

Лучшие практики

Используйте собственные валидаторы для распространенных случаев:

uuid, date_format, mimes:jpg,png (Laravel).
@Assert\Uuid, @Assert\DateTime (Symfony).
Всегда очищайте: Удаляйте теги HTML (strip_tags()).

Пользовательские правила для сложных случаев

Избегайте дублирования:

Laravel: классы запросов форм.
Symfony: группы валидации или пользовательские классы ограничений.

Проверка фреймворка проверяет только синтаксис (формат, структуру). Она не может обеспечить соблюдение бизнес-правил, таких как:
«Есть ли у этого пользователя разрешение отменить этот заказ?»
«Действителен ли этот код скидки для выбранных продуктов?»

Бизнес валидация (DDD)

После базовой проверки на уровне фреймворка, следующей критически важной стадией становится доменная валидация — механизм, который гарантирует соблюдение всех бизнес-правил и инвариантов внутри вашей предметной области. Здесь речь идёт не только о том, что данные корректны с точки зрения формата или схемы, но и о том, что они соответствуют специфике вашего бизнеса. Она отвечает на вопросы вроде:

«Может ли пользователь совершить это действие?»
«Не нарушает ли операция бизнес-правила?»
«Соответствует ли данные логике предметной области?»

Доменная валидация обеспечивает, чтобы объекты всегда находились в корректном состоянии. Например, объект «Заказ» не может быть создан, если сумма заказа ниже минимально допустимой или если отсутствуют необходимые атрибуты, описывающие бизнес-сущность. Даже если данные проходят проверку на уровне фреймворка, специализированные проверки, зависящие от бизнес-логики, могут быть пропущены. Именно на уровне домена вы устраняете возможность появления «неправильных» объектов, которые могут негативно повлиять на всю систему.

Использование VO, агрегатов и инвариантов позволяет переносить валидацию бизнес-логики внутрь доменной модели, таким образом:

VO гарантируют корректность отдельных значений с помощью фабричных методов, сразу предотвращая создание «грязных» данных.
Агрегаты устанавливают контекст для проверки взаимосвязанных правил и гарантируют, что операции, изменяющие состояние, не нарушат общую консистентность.
Инварианты служат для проверки сложных условий, охватывающих несколько элементов доменной модели, и не допускают переход агрегата в неверное состояние.

Value Object (VO) как гарант валидности отдельных значений

Инкапсуляция правил: VO создаётся через конструктор или фабричный метод, внутри которого выполняется вся необходимая проверка. Например, при создании объекта «Email» проверяется формат адреса, а при создании «Money» — что сумма неотрицательна.
Всегда валидный объект: Если входные данные не удовлетворяют бизнес-требованиям, фабричный метод не создаёт объект (возвращает ошибку или выбрасывает исключение). Это означает, что в доменной модели никогда не могут оказаться “грязные” значения, потому что попытка их создания завершится неудачей. Таким образом, VO автоматически валидирует часть бизнес-правил на уровне одного поля.

Пример: При создании VO «Сумма заказа» фабричный метод проверит, что сумма положительна. Если попытаться создать «Сумму заказа» с отрицательным значением, объект не будет создан, что предотвращает дальнейшую обработку некорректных данных.

final class OrderAmount {
    private function __construct(private float $value) {}

    public static function create(float $value): Result {
        if ($value <= 0) {
            return Result::failure("Amount must be positive");
        }
        return Result::success(new self($value));
    }
}

Когда использовать VO

Атомарные значения: Email, Phone, Money, DateRange, Address.
Инварианты: Значения с строгими правилами (например, «Скидка должна быть от 0 до 100%»).
Доменные примитивы: Значения, специфичные для вашего бизнеса (например, ProductSKU).

Агрегат как контекст для проверки взаимосвязанных правил

Группировка взаимосвязанных объектов: Агрегат объединяет сущности и VO, между которыми существуют бизнес-зависимости. Например, заказ (Order) может состоять из множества позиций, и агрегатный корень отвечает за соблюдение правил, таких как корректность общей суммы заказа или минимальное количество позиций.
Валидация бизнес-операций: Все изменения в агрегате проходят через его корневую сущность. Метод, который добавляет позицию в заказ, сначала проверяет, что добавление новой позиции не нарушит инварианты агрегата (например, максимальное количество товаров или условия скидок). Если правило нарушается, операция не выполняется.

Основные обязанности агрегата

Группирует связанные объекты
Централизует валидацию
Защищает инварианты

Ключевые шаблоны реализации

Транзакционная согласованность — изменения либо полностью применяются, либо не применяются вовсе
Проверки с использованием событий домена
Внешний код не может напрямую изменять дочерние сущности

// ❌ BAD: Bypasses aggregate root
$order->lines[] = new OrderLine(...); 

// ✅ GOOD: Root manages changes
$order->addItem($product, 2);

Пример: Метод агрегатного корня «Добавить товар в заказ» проверяет, что суммарная стоимость заказа после добавления товара не превышает лимита, установленного бизнесом. Если лимит будет превышен, метод возвращает ошибку, не изменяя состояние заказа.

final class Order {
    private OrderId $id;
    private array $lines = [];
    private Money $total;

    public function addProduct(Product $product, int $quantity): void {
        $this->assertNotPaid(); // Rule: Can't modify paid orders
        $line = new OrderLine($product, $quantity);
        // Rule: Max 10 items per order
        if (count($this->lines) >= 10) {
            throw new DomainException("Order item limit reached");
        }
        $this->lines[] = $line;
        $this->total = $this->total->add($line->subtotal());
    }
}

Инвариант как неотъемлемая часть доменной модели

Определение правил консистентности: Инварианты – это условия, которые всегда должны быть истинными для агрегата после любой операции. Они могут охватывать сразу несколько объектов внутри агрегата, например, согласованность дат начала и окончания заказа, или условие, что все товары должны принадлежать одному поставщику.
Защита от некорректных состояний: При выполнении любой бизнес-операции агрегатный корень проверяет, что после внесённых изменений все инварианты выполняются. Это позволяет добиться того, что доменная модель никогда не переходит в некорректное состояние, даже если ошибочно поступают некорректные данные с верхних слоёв.

Ключевые характеристики инвариантов

Всегда истинны
Правила кросс-объектов
Применяются к общему корню

Пример: В агрегате «Заказ» инвариант может требовать, чтобы список позиций никогда не был пустым, если заказ уже подтверждён. При попытке добавить пустую позицию агрегат выбрасывает ошибку или возвращает результат с информацией о нарушении, предотвращая сохранение некорректного заказа.

final class Order {
    private array $items;
    private bool $isConfirmed = false;

    public function confirm(): void {
        // Invariant: Cannot confirm empty orders
        if (empty($this->items)) {
            throw new DomainException("Cannot confirm an empty order");
        }
        $this->isConfirmed = true;
    }
}

Инварианты определяют фундаментальные истины вашего домена. Встраивая их в агрегаты:

Неверные состояния становятся невозможными
Бизнес-правила остаются видимыми в коде
Системы автоматически защищаются от логических ошибок

Data Transfer Object как механиз передачи данных

Data Transfer Object предназначен для переноса данных между слоями (например, из интерфейса в приложение). Его главная задача – передать структуру данных без внедрения в неё сложной бизнес-логики

Базовая валидация: На уровне DTO удобно выполнять проверку наличия обязательных полей, форматов (например, email, телефон), ограничений по длине и т. п. Для этого часто используются фреймворки или аннотации (например, Bean Validation или Symfony Validator).
Где должна быть бизнес-валидация? Несмотря на то, что DTO может проверять корректность входящих данных, основная бизнес-валидация (т.е. проверка инвариантов домена, комплексных правил, зависящих от контекста) должна выполняться в доменной модели – то есть в агрегате, его сущностях или VO. Это позволяет гарантировать, что объекты, которые работают внутри домена, всегда находятся в корректном, «безошибочном» состоянии.

Анти-паттерн:

// ❌ Business logic in DTO
final readonly class OrderRequest {
    public function isValid(): bool {
        // Checks inventory, user permissions, etc.
    }
}

Ключевые выводы:

DTO — это простые контейнеры без поведения, только данные.
Глубокую валидацию делегируйте доменному слою (агрегатам/VO).
Используйте валидаторы фреймворков для синтаксических проверок в DTO.

Rich Domain Model против Anemic Domain Model с внешней валидацией

В подходе Rich Domain Model вся бизнес-логика, включая правила валидации и инварианты, встроена непосредственно в объекты доменной модели. Такие объекты самостоятельно отвечают за корректность своего состояния — создавая их только в допустимом состоянии, они гарантируют целостность данных.

Преимущества:

Инкапсуляция правил и поведения: Все проверки и бизнес-правила находятся внутри объекта. Например, при создании объекта «Заказ» через фабричный метод объект сам проверяет, что сумма заказа положительна и что список позиций не пуст. Это позволяет избежать дублирования логики в разных сервисах и гарантирует, что объект никогда не окажется в некорректном состоянии.
Единое место для бизнес-логики: Основная логика находится в доменной модели, что облегчает сопровождение кода и делает его понятным. Когда изменения бизнес-правил требуются, разработчику достаточно модифицировать методы внутри самих объектов, а не рефакторить внешние ValidationService.
Упрощенное тестирование: Поскольку правила проверки встроены в объекты, тесты могут непосредственно проверять корректность поведения доменной модели. Тестируется не только структура данных, но и все бизнес-инварианты, что делает систему более надёжной.
Соблюдение принципа «Make Illegal States Unrepresentable»: Отказ от возможности создания объектов с неверными данными позволяет минимизировать количество проверок на верхних слоях приложения.

Anemic Domain Model с внешней валидацией (ValidationService)

В данном подходе объекты доменной модели представляют собой лишь набор данных — они не содержат бизнес-логики. Валидация и обеспечение соблюдения инвариантов вынесены во внешние сервисы (ValidationService), которые принимают DTO или модели и проверяют их «правильность».

Недостатки:

Рассеянность бизнес-логики: Вся логика проверки сосредоточена в нескольких сервисах, а не распределена по объектам. Это ведёт к тому, что правила валидации и бизнес-логики находятся в разных местах, что затрудняет понимание и сопровождение кода.
Дополнительный код и риск рассинхронизации: При вызове внешнего ValidationService приходится дополнительно заботиться о том, чтобы каждый раз перед изменением состояния агрегата вызывать необходимые проверки. Любая оплошность может привести к тому, что объект перейдёт в некорректное состояние, так как сам объект не «знает» о необходимости проверок.
Увеличение связности: Код, зависящий от внешней валидации, вынужден постоянно обращаться к ValidationService. Это усложняет тестирование, особенно в ситуациях, когда требуется имитация сложных бизнес-процессов.

Anemic Domain Model, где логика отделена и вынесена во внешние сервисы, может привести к дублированию, усложнению взаимодействий и возникновению несогласованностей между проверками, вынесенными за пределы самих доменных объектов. Подход Rich Domain Model предпочтительнее по нескольким причинам:

Непосредственная проверка и защита инвариантов: Объекты домена создаются и изменяются только через методы, которые гарантируют, что все бизнес-правила выполнены.
Консолидация бизнес-логики: Все правила и проверки находятся внутри доменных объектов, что упрощает их изменение и поддержку.
Повышенная надёжность системы: Отказ от создания «грязных» объектов снижает риски некорректного состояния системы даже при изменениях в бизнес-требованиях.

Благодаря внедрению проверки и бизнес-правил непосредственно в объекты домена подход Rich Domain Model обеспечивает более надежную инкапсуляцию, лучшую обслуживаемость и меньшее количество проблем с целостностью во время выполнения по сравнению с Anemic Domain Model с внешней проверкой.

ORM валидация

Инструменты ORM (Object-Relational Mapping) используются для взаимодействия с базами данных, но они также могут выполнять промежуточную валидацию данных перед сохранением. Однако их роль в валидации часто вызывает споры. Давайте разберем, как Doctrine и ActiveRecord (например, в Laravel) подходят к этому вопросу.

Doctrine (Data Mapper): Валидация через Symfony

Doctrine сам по себе не содержит валидаторов, но тесно интегрируется с Symfony Validator, что позволяет использовать его как последний рубеж перед записью в БД.

Как это работает:

Аннотации/Атрибуты: Правила валидации добавляются прямо в сущности.
Синтаксические проверки: Форматы данных, типы, уникальность.
Интеграция с жизненным циклом: Проверки выполняются перед flush().

Пример с Symfony Validator:

use Doctrine\ORM\Mapping as ORM;  
use Symfony\Component\Validator\Constraints as Assert;  

#[ORM\Entity]  
class User {  
    #[ORM\Id]  
    #[ORM\GeneratedValue]  
    #[ORM\Column]  
    private int $id;  
    #[ORM\Column]  
    #[Assert\NotBlank]  
    #[Assert\Email]  
    private string $email;  
    #[ORM\Column]  
    #[Assert\Range(min: 1, max: 100)]  
    private int $age;  
}

ActiveRecord (Laravel Eloquent): Валидация в моделях

Модели ActiveRecord (например, Eloquent в Laravel) часто совмещают валидацию с бизнес-логикой, что противоречит принципам чистой архитектуры, но удобно на практике.

Пример валидации в Eloquent:

class User extends Model {  
    protected static function boot() {  
        parent::boot(); 

        static::saving(function ($user) {  
            $validator = Validator::make($user->toArray(), [  
                'email' => 'required|email',  
                'age' => 'integer|min:1|max:100',  
            ]);  
            if ($validator->fails()) {  
                throw new ValidationException($validator);  
            }  
        });  
    }  
}

Нарушение SRP: Модель отвечает как за данные, так и за проверку.

Гарантия согласованности данных

Автоматическая проверка типов: ORM использует схему базы данных для автоматической проверки типов и диапазонов значений, что снижает вероятность передачи некорректных данных в приложение.

Безопасность: Например, проверки на SQL-инъекции, обеспечиваемые средствами ORM и настройками базы данных, снижают риск атак за счет фильтрации некорректных входных значений.

Механизмы аудита

Отслеживание ошибок: Инструменты ORM позволяют логировать ошибки сохранения, что упрощает отладку и контроль за соблюдением бизнес-инвариантов на уровне персистентности.

База данных

Работа с базой данных служит последним щитом, защищающим приложение от ошибок и нарушений бизнес-правил, даже если предыдущие уровни проверки (DTO, доменная модель, сервисы) не смогли их обнаружить. Валидация на уровне фреймворка, реализуемая средствами ORM и инфраструктуры, обеспечивает надежное сохранение целостности данных и действует как дополнительный механизм защиты. Давайте разберем ключевые аспекты этого подхода.

Типы данных

Каждый столбец таблицы имеет четко определенный тип данных (например, INT, VARCHAR, DATE), что автоматически отфильтровывает некорректные значения. Попытка вставить текст в числовое поле приведет к ошибке еще до применения дополнительных ограничений.

Ограничения

СУБД предоставляет низкоуровневые ограничения, которые неизбежно сработают в момент выполнения любых операций с данными:

PRIMARY KEY — гарантирует уникальность и отсутствие значения NULL в ключевом поле.

CREATE TABLE users (
    id INT PRIMARY KEY,
    email VARCHAR(255) NOT NULL
);

FOREIGN KEY — обеспечивает связи между таблицами и фиксирует любые изменения в отправляемых записях.

CREATE TABLE orders (
    order_id INT PRIMARY KEY,
    user_id INT,
    FOREIGN KEY (user_id) REFERENCES users(id)
);

UNIQUE — гарантирует уникальность значения элемента (например, для электронной почты).

ALTER TABLE users ADD CONSTRAINT unique_email UNIQUE (email);

NOT NULL — блокирует значения NULL из столбца.

CHECK — проверяет значения, находящиеся за заданным разумом.

Триггеры

Триггеры позволяют реализовать сложную логику проверки, которую невозможно выразить стандартными ограничениями. Например, проверка формата телефонного номера или правильности временных интервалов.

CREATE TRIGGER validate_phone_format
BEFORE INSERT ON customers
FOR EACH ROW
BEGIN
    IF NEW.phone NOT REGEXP '^[0-9]{10}$' THEN
        SIGNAL SQLSTATE '45000' SET MESSAGE_TEXT = 'Невірний формат телефону';
    END IF;
END;

Важно: Не рекомендуется полностью переносить доменную валидацию, связанную с бизнес-логикой, на уровень базы данных, особенно через ограничения БД. Это может привести к дублированию правил в разных слоях системы и усложнить их модификацию. Например, изменение условий проверки (если они жестко закодированы в ограничении CHECK или триггерах) потребует изменения схемы базы данных, что часто становится узким местом в разработке. Кроме того, сообщения об ошибках из базы данных обычно носят технический характер и не предоставляют гибкости для эффективного информирования пользователей. Ограничения БД следует использовать только для базовых проверок (например, age >= 0), тогда как сложные бизнес-правила (такие как валидация email с помощью регулярных выражений) лучше реализовывать на уровне приложения, где их проще тестировать и адаптировать.

Безопасность

Среди множества угроз выделяются три ключевые уязвимости, актуальные даже для современных систем: SQL-инъекции, XSS и CSRF. Они эксплуатируют слабые места в валидации данных, обработке запросов и управлении сессиями, превращая обычные функции приложения в «лазейки» для злоумышленников. SQL-инъекции атакуют базы данных, подменяя логику запросов, XSS внедряет вредоносный код через клиентскую часть, а CSRF заставляет пользователей выполнять нежелательные действия без их ведома. Понимание механизмов этих атак и способов их нейтрализации — не просто теория, а обязательный навык для разработчиков. В следующих разделах мы разберем, как работают эти уязвимости, какие последствия они несут и как построить надежную защиту на уровне бэкенда.

SQL-инъекция

Что это такое: Злоумышленник внедряет вредоносный SQL-код через поля ввода (например, формы), чтобы получить несанкционированный доступ к базе данных или манипулировать ею.

Распространенные ошибки на бэкенде:

Использование необработанных SQL-запросов с конкатенацией строк.
Отсутствие экранирования или параметризации пользовательских данных.
Пропуск валидации типов данных (например, ожидается число, но получена строка).

Пример уязвимого кода (PHP)

$user_id = $_GET['id']; // User enters: 1; DROP TABLE users;  
$sql = "SELECT * FROM users WHERE id = $user_id"; // Vulnerable query!

Как предотвратить:

Используйте подготовленные выражения (параметризованные запросы)
ORM-библиотеки: Инструменты вроде Doctrine (PHP) автоматически экранируют входные данные.
Валидация и приведение типов ввода
Минимизация привилегий базы данных: Учетная запись приложения для базы данных не должна иметь прав на разрушительные операции, такие как DROP TABLE.

XSS (межсайтовый скриптинг)

Что это такое: Внедрение вредоносного JavaScript-кода через данные, отоб��ажаемые на веб-странице (например, комментарии, профили пользователей). Атака выполняется в браузере жертвы.

Распространенные ошибки на бэкенде:

Вывод данных, предоставленных пользователем, без экранирования.
Разрешение необработанного HTML/JS в пользовательском контенте (например, через WYSIWYG-редакторы) без санитизации.

Пример уязвимого кода (PHP)

echo "<div>" . $_POST['comment'] . "</div>";  
// If comment contains: <script>alert('XSS')</script> → Executes!

Как предотвратить:

Content Security Policy (CSP): Ограничьте выполнение встроенных скриптов через HTTP-заголовки.
Санитизация HTML-ввода: Используйте библиотеки, такие как HTMLPurifier (PHP) или DOMPurify (JS), для контента из WYSIWYG-редакторов.
Использование современных фреймворков: React/Vue/Angular автоматически экранируют данные по умолчанию (но будьте осторожны с dangerouslySetInnerHTML или v-html).

CSRF (межсайтовая подделка запросов)

Что это такое: Злоумышленник обманом заставляет пользователя выполнять нежелательные действия на сайте, где он аутентифицирован (например, перевод денег, смена пароля).

Распространенные ошибки на бэкенде:

Отсутствие CSRF-токенов.
Полагание исключительно на куки для аутентификации (браузеры отправляют их автоматически).
Использование GET-запросов для операций, изменяющих состояние (GET должен быть идемпотентным).

Пример уязвимого кода (PHP)

// Backend processes a money transfer without CSRF token validation
if ($_SERVER['REQUEST_METHOD'] === 'POST') {
    $amount = (float) $_POST['amount'];
    // ... execute transfer ...
}

Как предотвратить:

Генерируйте уникальный токен для каждой пользовательской сессии Встраивайте его в формы и проверяйте при отправке.
SameSite Cookies: Устанавливайте куки с настройкой SameSite=Strict или Lax, чтобы предотвратить запросы с других источников.
Требуйте повторную аутентификацию: Для чувствительных действий (например, платежей) запрашивайте пароль или 2FA.
Избегайте GET для операций, изменяющих состояние: Используйте POST/PUT/DELETE для действий, которые модифицируют данные.

Архитектурные подходы к валидации

Валидация данных — это не просто набор проверок, а сложный процесс, требующий продуманной архитектуры. Современные приложения должны проверять данные на нескольких уровнях, от синтаксиса до бизнес-контекста. Как организовать этот процесс, чтобы код оставался поддерживаемым, а правила — гибкими? Рассмотрим три ключевых подхода.

Middleware: Валидация входных данных

Middleware действует как «контрольная точка» для входящих запросов. Он перехватывает данные до того, как они попадут в бизнес-логику, и выполняет предварительную валидацию. Вы можете добавить слои middleware для проверки аутентификации, CSRF-токенов, формата JSON или структуры запроса.

Преимущества:

Централизация: Общие правила (например, проверка заголовков) автоматически применяются ко всем маршрутам.
Гибкость: Для определённых конечных точек или групп (например, API против админ-панели) можно применять индивидуальные правила (например, требования к токенам или доступ на основе ролей).
Производительность: Запросы с очевидными ошибками (например, некорректный Content-Type) отклоняются на раннем этапе, экономя ресурсы сервера.

Паттерн <<Сервисы валидации: Повторно используемая бизнес-логика

Когда проверки становятся сложными (например, проверка уникальности комбинации полей или интеграция со сторонними API), их выносят в отдельные сервисы. Это позволяет:

Изолировать код: Логика валидации не разбрасывается по контроллерам, а сосредотачивается в специализированных классах, таких как UserRegistrationValidator.
Упростить тестирование: Сервисы можно тестировать независимо от HTTP-слоя, подменяя зависимости (базы данных, внешние API).
Повторно использовать логику: Один и тот же валидатор может использоваться для API, CLI-команд и импорта данных из CSV.

Паттерн "Chain of Responsibility": Валидация по цепочке

Паттерн «Цепочка обязанностей» разбивает сложные проверки на последовательные этапы. Каждый обработчик в цепочке отвечает за свою часть:

Синтаксис: Первый обработчик проверяет базовые параметры, такие как типы данных и обязательные поля.
Бизнес-правила: Следующие этапы анализируют данные в контексте домена (например, достаточно ли средств на счете для перевода).
Внешние проверки: Финальные обработчики могут запрашивать сторонние сервисы (например, проверка CAPTCHA или антифрод-системы).

Преимущества:

Масштабируемость: Новые проверки добавляются без переписывания существующего кода — достаточно создать новый обработчик.
Понятность: Каждый класс выполняет одну задачу, что соответствует принципам SOLID.
Динамическая настройка: Для разных сценариев можно собирать разные цепочки (например, строгая валидация для платежей и упрощённая для отзывов).

Паттерн "Стратегия": Динамический выбор валидации

Паттерн «Стратегия» позволяет выбирать алгоритм валидации на лету в зависимости от контекста. Например, проверка данных может отличаться для разных типов пользователей, регионов или сценариев использования.

Преимущества:

Гибкость: Правила можно менять без изменения основного кода.
Устранение условных операторов: Вместо if-else используется полиморфизм.
Лёгкое тестирование: Каждую стратегию можно тестировать изолированно.

Как выбрать подход?

Middleware идеален для сквозных проверок (например, аутентификация, CORS).
Сервисы подходят для сложных валидаций с внешними вызовами.
Цепочка обязанностей — для последовательных проверок.
Стратегия — когда нужно динамически переключать алгоритмы валидации.

Важно: эти подходы не исключают, а дополняют друг друга. Например, Middleware может проверять заголовки, Chain of Responsibility может обрабатывать данные запросов, а Service может управлять проверкой бизнес-логики.

Валидация данных в микросервисной архитектуре

Микросервисная архитектура, несмотря на гибкость и масштабируемость, усложняет управление валидацией данных из-за распределённой природы сервисов. Каждый микросервис управляет своей доменной областью, что требует тщательного проектирования проверок данных на всех этапах взаимодействия. Рассмотрим ключевые аспекты валидации в такой архитектуре.

Локальная валидация в микросервисах

Каждый микросервис должен самостоятельно выполнять валидацию данных, относящихся к его домену. Это включает проверку формата, типов данных и бизнес-правил, специфичных для данного сервиса. Такой подход обеспечивает инкапсуляцию логики и уменьшает зависимость от других сервисов.

Валидация данных между микросервисами

В ситуациях, когда один микросервис зависит от данных другого (например, сервис заказов требует информацию о пользователе из сервиса пользователей), возникает необходимость в межсервисной валидации. Существует несколько подходов для решения этой задачи:

Синхронные запросы: При получении данных микросервис выполняет HTTP-запрос к другому сервису для проверки их валидности. Этот метод прост в реализации, но может привести к увеличению задержек и снижению отказоустойчивости из-за зависимости от доступности других сервисов.
Асинхронные сообщения и событийно-ориентированная архитектура: Использование брокеров сообщений (например, RabbitMQ) позволяет микросервисам обмениваться событиями и данными асинхронно. Это повышает масштабируемость и снижает связанность между сервисами, но усложняет обработку ошибок и требует тщательного проектирования.
Репликация ��анных: Некоторые данные из одного микросервиса могут быть скопированы и периодически обновляться в другом для локальной валидации. Это уменьшает межсервисные вызовы, но может привести к устареванию данных и дополнительным сложностям в их синхронизации.

Централизованные схемы и контракты

Для обеспечения согласованности данных между микросервисами рекомендуется использовать централизованные схемы и контракты API:

Соглашения о контрактах (API contracts): Определение четких контрактов между сервисами помогает гарантировать, что передаваемые данные соответствуют ожидаемым форматам и структурам. Инструменты вроде OpenAPI могут быть полезны для документирования и поддержания этих контрактов.
Схемы данных: Использование общих схем данных (например, JSON Schema) позволяет унифицировать валидацию и структуру данных, передаваемых между сервисами.

Эффективная валидация данных в микросервисной архитектуре требует балансировки между локальной ответственностью сервисов и необходимостью взаимодействия между ними, при этом учитывая производительность, безопасность и согласованность данных.