Pull to refresh

Comments 64

Мне кажется немного запутанно получилось со Swagger и OpenAPI. По всей видимости имелась ввиду сама спецификация Swagger Specification, которая сейчас действительно называется OpenAPI Specification.
Оригинал это именно OpenAPI Specification, Swagger.io вошел в консорциум Open API Initiative и обеспечил реализацию этой спецификации.
Судя по всему сам Swagger так не считает: «At the heart of the above tools is the OpenAPI Specification (formerly called the Swagger Specification).» swagger.io
OpenAPI initiative тоже имеет свою версию: A Short History of the Open API Initiative and the OpenAPI Specification
On Nov. 5, 2015, SmartBear in conjunction with 3Scale, Apigee, Capital One, Google, IBM, Intuit, Microsoft, PayPal, and Restlet announced the formation of the Open API Initiative, an open source project under the Linux Foundation. As part of the formation of the OAI, SmartBear donated the Swagger specification to the Linux Foundation, meaning that the OpenAPI Specification is semantically identical to the specification formerly known as the Swagger 2.0 specification.
Ну так, из текста также ясно следует, что «Swagger specification» была до создания «Open API Initiative». Очевидно «Swagger 2.0 specification» легла в основу для OAI.
Мне кажется немного запутанно получилось со Swagger и OpenAPI. По всей видимости имелась ввиду сама спецификация Swagger Specification, которая сейчас действительно называется OpenAPI Specification

Наверное, автор слишком уж "в теме" и не отдает себе отчет, что для новичков в этом вопросе не очевидно:


Изначально это был Swagger
но уже 2 года как переименован в OpenAPI.


Тем не менее осталось куча упоминаний о старом названии (например, в названии инструментов, например, существуют и сайт Swagger и сайт OpenAPIs)

Помните о том, что HTTP-протокол осуществляет транспортную функцию по доставке данных в запросах и ответах.

Скорее "чаще всего в вашем приложении HTTP-протокол осуществляет лишь транспортную функцию по доставке данных в запросах и ответах, игнорируя его семантику сверх практически обусловленного для доставки". И в этом случае как раз логично придерживаться пары GET/POST, забыть о существовании десятков кодов и т. п., а, главное, передавать в теле запроса не только представление ресурсов, но и их идентификаторы и действия над ними.

Абсолютно верно. Следует разделять слои транспорта и бизнес-логики. REST это про декомпозицию сущностей и операций над ними в набор ресурсов, а не про HTTP-глаголы и наборы http status кодов.

Ну, сам HTTP как прикладной протокол можно считать реализующим REST в домене гипертекстовых документов и медиа. А проблемы начинаются, когда семантику этого домена начинают натягивать на, например, финансы.

Делали ли вы генерацию кода по swagger спецификации, и делали ли автоматический рефакторинг при изменениях в спецификации?

Пробовали некоторые подходы, но в итоге у нас это не прижилось в большинстве проектов. Автоматический генератор кода создает лишь структуры данных, но не поведение. Реализация правильного поведения есть основная часть работы. Конечно, для бинарных протоколов наподобие gRPC или GraphQL, генератор кода из схемы абсолютно необходим.
graphql не бинарный протокол. И генератор кода ему вообще не нужен. Есть попытки сделать скафо
лдинг по переводу в SQL. Но это не генератор кода.
Многие статьи о REST ссылаются на работу Roy Thomas Fielding «Architectural Styles and the Design of Network-based Software Architectures» как первоисточник определения REST (смотрите пятую и шестую главы этой работы). Рекомендаций использовать http- глаголы GET-POST-PUT-DELETE как единственный способ определения операций вы там не найдете.


Очень верное замечание. Есть REST — без которого интернет сейчас бы не был интернетом. И есть RESTAPI в примитивной трактовке. RESTAPI (CRUD/G-P-P-D) первоначально поражает своей идеей. Потом начинаются вопросы. Если объект имеет связи (а это общий случай) — как понять, когда включать связанне объекты, а когда не включать. До какого уровня «разворачивать» связанные объекты. Какие поля включать в ответ. Или если сказать проще, у RESTAPI нет необходимого разнообразия

Моя мечта начать использовать graphql, который тоже REST, но не RESTAPI. С моей точки зрения graphql имеет уникальные перимущества которе не может дать на сегодняшний день ни одна другая система.
  • Программный код и документация связаны и никогда не могут рассогласоваться
  • Клиент сам решает какие поля вернет запрос и какой уровень вложенности объектов ему нужен
  • Клиент может в одном запросе запрашивать произвольное количество объектов (веб-разработчики уже свыклись с тем что запросов будет много, а вот для мобильных разраотчиков один запрос — один экран это было бы неплохо)


А так же полностью поддерживаю что ни в коем случае нельзя смешивать уровень бизнес-логики и протокола — это о «краноречивых» статусах. Особенно 404 — это нет зебры в зоопарке, или это нет url «зоопарк»?

Я согласен, что сейчас все вспомогательные библиотеки так или иначе ориентированы на статусы. Но мне кажется логичным использовать максимум три из них: 200 и 304 при нормальном ответе плюс какой-нибудь незарезервированный 400-й статус при ошибке.
С моей точки зрения graphql имеет уникальные перимущества которе не может дать на сегодняшний день ни одна другая система. Программный код и документация связаны и никогда не могут рассогласоваться


Поясните.
По мне так это уже давно норма.
И не вижу чтобы конкретна эта технология тут чем то особенным выделялась.
В graphql спецификация сервиса это одновременно и исполняемый код и документация. Если Вам известны другие подобные системы назовите пожалуйста их
Самодокументирующийся код — уже много лет как не новость.
Где его только нет.
В том же OpenAPI/Swagger, Python, Go — да где угодно.
В graphql и самодокументирующийся код это совершенно разный подход. Как правило самодокументирующийся код построен на аннотациях или же на генерации кода. У graphql в принципе все по набору фич очень похоже на OpenAPI. Но разница в том, что если программно был описан объект Х, для него уже готова документация, входные параметры типа Х будут валидироваться на полное соответсвие (что немаловажно для языков без строгой типизации). В этом смысле graphql больше похож даже на reflection.

Но не только это как я уже сказал есть еще преимущества кроме документации:
2) запрос клиента сам определяет какие поля нужно вернуть у объекта и до какого уровня вложенности показывать связанные объекты
3) можно формировать для одного запроса ответ для двух и более разнородных объектов нужных например для отображения на странице мобильного приложения. Дл чего это важно см. habrahabr.ru/post/331120

Хочу еще раз подчеркнуть: что на стороне бэкэнда работет одно и то же описание объекта. Разработчик фронтенда сам решает что ему нужно получить в ответе сервера, имеет большую степень свободы в том как формировать запрос и какие поля и объекты ему нужно получить. (аналогия полнейшая graphQL — sql).
У graphql в принципе все по набору фич очень похоже на OpenAPI. Но разница в том, что если программно был описан объект Х, для него уже готова документация, входные параметры типа Х будут валидироваться на полное соответсвие (что немаловажно для языков без строгой типизации).


Все равно не понял.

В OpenAPI вы можете (да так часто и делают для удобства разработчиков фронтенда) задействовать веб-сервер, который распарзит описание API и отдаст его в не очень красиво оформленной страничке.
И даст поиграться с API даже безо всякого curl, то есть прямо с этой страницы.

Вероятно имеется в виду, что в graphql этот веб-сервер будет парсить непосредственно код, а не описание, которое может не соответствовать коду.

И да и нет. В grqphql пользователь определяет описание объекта похожее на спецификацию OpenAPI/swagger. Здесь же определяются какие функции (resolvers) отвечают за формирование ответов. За время потраченное на комментирование честно можно было бы хотя бы для того чтобы вывести меня на чистую воду просмотреть вводный курс graphql это займет не более 10 минут. Ну не пересказывать же мне его или чего доброго не копипастить же его в комменты.

Например если вы сейчас разрабатываете на PHP то вот на Хабре есть статья с простым примером. habrahabr.ru/post/328122

Я про grqphql хорошо знаю, я не уверен про OpenAPI/swagger. По моим представлениям описание API и код его реализующий, там разделены. Пускай в аннотациях описание, но синхронизировать описание и код — обязанность разработчика. Могу ошибаться.

Разделено в хорошем смысле этого слова. В смысле разделения ответсвенности. Случая при котором мое описание разойдется с моей реализацией сложно представить. Поскольку в отличие от OpenAPI где специфкация — это просто документ yml/json или же программно описанная специфкация, или же код взятый из аннотаций к классам и методам, в graphql это все по-другому реализовано в единой системе. Это не избавляет от логических ошибок но во всяком случае гарантирует соответсвие описанию (и валидацию) по входящим параметрам и выходящим параметрам спецификации метода.
+ как я уже сказал фича с запросами которые гибко управляются клиентом. Что является отдельным и существенным преимуществом.

По-моему, мы об одном и том же говорим. В GraphQL страничка документации генерируется по тому же коду, по которому API будет парсить и валидировать, в OpenAPI, насколько я знаю, страничка генерируется на основании описания реализации, которое гвоздями к ней не прибито, в лучшем случае какие-то линтеры или тесты обнаружат разницу между описанием и реализизацией.

По моим представлениям описание API и код его реализующий, там разделены. Пускай в аннотациях описание, но синхронизировать описание и код — обязанность разработчика. Могу ошибаться.


Вы можете делать это автоматически.
При каждом make.

Разумеется, тогда как только поменяют описание — ваш код сломается.
Но вы это тут же увидите.
И добавите нужную новую функцию в свой код или т.п.

Что это? Какой-то чекер будет статически проверять есть ли реализация какого-то ендпоинта API, описанного в документации, и, хотя бы, принимает ли описанный в ней шейп на вход и отдаёт ли на выходе? Через отдельный типы для каждого шейпа?

Из описания генерируется заглушка на вашем языке программирования.

Функции которые были в преждней версии API у вас уже реализованы. Поэтому если API не менялся — ничего не сломается.

А новая функция API окажется не реализованной (абстрактно объявленной в заглушке). И вы об этом узнаете.

То есть просто проверка есть ли такой метод без всяких анализов шейпов? добавили/удалили поле в ожидаемый/возвращаемый шейп и никто не узнает?

Ну так то Swagger/OpenAPI — я типами данных.
И если язык с типами — то шанс не заметить ниже.

У меня встречный вопрос про GraphQL.
Тут вот пишут что он «самодокументируемый» и пр. достоинства.
Так ведь все равно если сервер что-то там поменяет, то клиент же ровно так же имеет шанс этого не заметить.

Если логику выполнения запроса/мутации поменяет, то не заметит, да. Но с типами/шейпами всё строго, по крайней мере в основных реализациях — до резолвера (функция/метод непосредственно исполняющие запрос/мутацию) дело не дойдёт, если что-то не соответствует описанию. Можно сказать, что человекочитаемые описания сигнатур генерируются по фактическому их описанию в коде. Фронтендер, например, не заглядывая в код сервера, получает техническое описание API?
гарантированно этому коду соответствующее. А если бэкендер что-то изменит в сигнатурах, то и описание изменится. Формальное описание API не лежит где-то рядом с его реализацией, не генерируются заглушки реализации из описания, а само описание и есть реализация. Одни и те же структуры данных отвечают и за роутинг/валидацию/исполнение запроса, и за генерацию человеко-/машиночитаемого описания. И это by design, а не прикручено сбоку в make.

Если логику выполнения запроса/мутации поменяет, то не заметит, да. Но с типами/шейпами всё строго, по крайней мере в основных реализациях — до резолвера


Тогда это ровно так же как и в gRPC и в Swagger/OpenAPI

С gRPC я с другим сталкивался: по описанию на специальном DSL генерируется и код клиента, и код сервера, и человекочитаемое описание. То же, как я понял, в Swagger/OpenAPI. В GraphQL это тоже возможно, но опционально.

GraphQL безусловно отличный продукт, но имеет свою, ограниченную область применения. Специфический протокол graphql пока поддерживается не всеми языками и платформами, а для публичного API крайне важно дать инструмент абсолютно совместимый со всеми платформами и языками. Интеграция с HTTP+JSON на сегодняшний день абсолютно универсальна.
graphql имеет библиотеки для всех популярных языков. кроме того это не бинарный протокол и запрос можно отправить методом get post в простой текстовой форме

GraphQL — это скорее язык, чем протокол. На практике "по умолчанию" использует те же HTTP+JSON как транспортный протокол и тип данных. Собственно различия начинаются где-то на уровне как интерпретировать поля в JSON. То есть, обычно, в RESTish HTTP API тело HTTP-запроса или одного из его полей верхнего уровня — это представление какой-то сущности, а в GraphQL — собственно GraphQL запрос и его параметры.

Моя мечта начать использовать graphql, который тоже REST, но не RESTAPI. С моей точки зрения graphql имеет уникальные перимущества которе не может дать на сегодняшний день ни одна другая система.


GraphQL хорош когда вы сами не знаете что хотите.
Вы просто получаете универсальный язык запросов.
Я правильно понимаю, что swagger-like документацию можно делать отдельно от самого апи и можно просто перенести существующий гуглдок-ад в нормальный вид? Понятно, что все плюшки автогенерации теряются, но все же.
Да, OpenAPI это язык описания спецификаций. Можно в редакторе создавать схему. Чтобы было понятнее вот пример editor.swagger.io как это происходит. Схема выглядит немного устрашающе но есть тулзы например веб-редактор mermade.github.io/openapi-gui Проект молодой но очень интересный.
не стал даже читать. что такое «REST-like»? давайте уже говорить на одном языке.

Полной реализацией REST HTTP API обычно никто не занимается чисто из практических соображений, поэтому используется REST-like или RESTish когда нарушают некоторые требования или традиции, сложившиеся вокруг REST.

Что такое Полная реализация REST HTTP API? Я уверен что ее не существует в природе. Есть стандарт HTTP и его реализация. Есть стандарт OpеnAPI и его реализация. О REST HTTP API можно сказать что есть стандарт? Все проблемы REST HTTP API как раз и заключается в том что стандарта REST HTTP API так и не получилось. И все попытки продвинуться дальше простых CRUD-запросов к ровно одной таблице (без JOIN-ов) приводят к химерным запросам, при этом у каждого разработчика — к своим запросам. Если к этому прибавить время на споры какой статус будет правильным если номер телефона не прошел валидацию и как передавать в посте связанные иденификаторы ({customerId: 16) or {customer: {id: 16}) то потери превысят все мвслимые лимиты. Не ну все так хорошо начинается обычно на REST HTTP API. ToDoApp и все такое.
Какие есть варианты решения этой проблемы?
По этому вопросу есть переводная статья на Хабре habrahabr.ru/post/265845
Ну и язык запросов graphql. Если пытаться сделать RESTAPI выразительнее (через разные параметры типа списка запрашиваемых полей, неободимости разворачивавть связанные объекты, фильтры, пагинацию) — то вся простота и изящества куда-то очень быстро уходит. См. апример www.ibm.com/support/knowledgecenter/SSPLFC_7.2.2/com.ibm.taddm.doc_7.2.2/SDKDevGuide/r_cmdbsdk_restapi_objectclass.html

Я не уверен, поэтому написал "почти". Избегаю кванторов всеобщности, если не уверен.


Под полной реализацией REST HTTP API я имею в виду API, полностью реализующий как стандарт HTTP, так и принципы REST. Я не уверен даже, что есть полные реализации HTTP и следует ли из полной реализации HTTP автоматическое соблюдение REST (скорее нет, чем да).

Ну так давайте сейчас прямо проверим. Принципы REST дотсупны всем www.ics.uci.edu/~fielding/pubs/dissertation/rest_arch_style.htm. Хотя я не уверен что их читали 50% тех кто пишет руководства по RESTFullAPI (тут я как раз квантора всеобщности не употребляю если что).
+ 5.1.2 Client-Server — да http протокол предполагает общение клиент-сервер.
+ 5.1.3 Stateless — да http ничего не знает о состоянии клиента. Веб-приложения «научились» нарушать это правило при помощи сессий. И тут же получили оплеуху в виде невозможности масштабироваться. (Поэтому сейчас все чаще можно встретить сессии в виде GWT когда сессия передается в каждом запросе и может быть таким образом расшернеа между серверами)
+ 5.1.4 Cache. Да в http протоколе определены запросы которые кэшируются и которые не кэшируются и как это реализовать.
± 5.1.5 Uniform Interface.
* identification of resources + да идентифицируются по URI
* manipulation of resources through representations — это как бы не входит в http протокол и может трактоваться как данные и представление это не одно и то же. То есть для простого текста данные==преставление. Для html документа, картинки, скрипта браузер сам знает как отобразить эти данные.
* self-descriptive messages — это тоже не уровень http протокола. Означает что все для обработки сообщение должно содержаться в самом сообщении.
* hypermedia as the engine of application state (HATEOAS) — в RESTAPI почему-то не получило широкого распространения.
+ 5.1.6 Layered System Обращаясь к серверу клиент не знает сколько уровней имеется в архитектуре сервера — ну да.
+ 5.1.7 Code-On-Demand — Все что нужно еще закгружается с сервера по требовнию (да, скрипты же загружаются)

Почему-то ни в одном(!) руководстве не упоминается еще два основополагающих принципа:
5.1.8 Style Derivation Summary — который гласит что эти принципы предназначены для выбора архитектуры приложения (а не способов формирование url).
и те упоминается принцип:
5.1.1 Starting with the Null Style — который гласит что нет других никаких ограничений.

Я к чему это все привел. Мое убеждение что есть REST и есть RESTAPI. И это две разные совершенно несвязанные вещи.
UFO just landed and posted this here
я согласен что передавая токен сессии соблюдается rest а иначе как бы это работало. Но вот по поводу сессий в redis я могу предполагать что будет примерно равный счёт с gwt пока инстансы сервисов запускаются на одном сервере но когда к redis придётся обращаться через сеть — не уверен что будет более масшабируемо. По hatoas какой вывод можно сделать по перейдя по ссылке. что разработки есть. каков их процент использования в resapi реальных сервисах остаётся вопросом.
UFO just landed and posted this here

Серверная сессия обычно нарушает Stateless, поскольку часто в сессии хранится дополнительная информация, например userId, необходимая для обработки запроса. Да, бывает, там хранится какая-то информация без которой запрос вполне может быть обработан, например кеш тех же прав пользователя (нет сессии — получим из базы или из сервиса авторизации) или информация для трекинга пользовательского поведения, но обычно всё же там хранится какое-то состояние сильно влияющее на результаты обработки запроса.

manipulation of resources through representations — это как бы не входит в http протокол и может трактоваться как данные и представление это не одно и то же. То есть для простого текста данные==преставление. Для html документа, картинки, скрипта браузер сам знает как отобразить эти данные.

Представление в терминах REST — это не отображение пользователю, а поток байт, отображающий состояние ресурса (5.2.1.2).


self-descriptive messages — это тоже не уровень http протокола. Означает что все для обработки сообщение должно содержаться в самом сообщении.

Отчасти вы правы, но только отчасти. Из 5.3.1 "REST enables intermediate processing by constraining messages to be self-descriptive:… standard methods and media types are used to indicate semantics and exchange information", HTTP довольно подробно описывает стандартные методы как синтаксически, так и семантически.


hypermedia as the engine of application state (HATEOAS) — в RESTAPI почему-то не получило широкого распространения.

Тем не менее имеется.


А вообще я как-то потерял нить обсуждения. Моё убеждение, что есть REST как архитектурные принципы построения масштабируемых распределенных приложений, есть более-менее соответствующие этим принципам приложения, подавляющая часть из которых использует HTTP для предоставления серверного API не только в качестве транспортного протокола, но и прикладного, пытаясь его синтаксис и семантику применять к своей предметной области, все эти DELETE /contracts/123. При этом частенько принципы REST и семантика HTTP нарушаются "по мелочам" типа отправки запросов PUT /contracts/123/approve c телом true. Такие API часто называют REST-like (субъективно характерно для русскоязычного информпространства) или RESTish (англоязычные обычно), имея в виду что они довольно близко подходят как к соблюдению принципов REST в архитектуре, так и соблюдение синтаксиса и семантики HTTP (опуская HTTP для удобства). Также можно встретить REST over HTTP, где HTTP используется лишь в качестве транспортного протокола, практически игнорируя его семантику, учитывая лишь технические возможности и особенности поведения распространенных или целевых компонентов сетевой инфраструктуры таких как браузеры, веб-сервера, прокси-сервера и т. п., при этом обычно меньше отходя от принципов REST. Ну и "over HTTP" часто опускают для краткости тоже, поскольку реализации REST не на базе HTTP встречаются крайне редко.


Получается спор наш чисто терминологический?

Нить разговора следующая. RESTAPI это не REST. Поэтому тот кто говорит REST это хорошо следовательно RESTAPI это хорошо допускает подмену понятий

RESTAPI в моих терминах, изложенных в предыдущем комментарии, это что?

мы говорим о RESTAPI не в Вашем комментарии а о трактовке этого термина в повседневной практике разработчиков фактически CRUD

В моих терминах это REST-like или RESTish

семантика HTTP нарушаются «по мелочам» типа отправки запросов PUT /contracts/123/approve c телом true


А где здесь нарушение семантики HTTP?

Предполагается очевидным, что ресурс имеет url /contracts/123, а approve является методом, модифицирующий этот ресурс, непредусмотренным HTTP способом. Особенно, если в результате GET /contracts/123 не получит значение свойства approve=true, а получит, например, свойство status=approved, а GET /contracts/123/approve всегда возвращает 404. Метод PUT, согласно rfc2616, должен сохранять (создавать или модифицировать) ресурс непосредственно, а не инициализировать какие-то процессы обработки данных, прерогатива которых метод POST.

Особенно, если в результате GET /contracts/123 не получит значение свойства approve=true, а получит, например, свойство status=approved, а GET /contracts/123/approve всегда возвращает 404


Если так, то да. Но если представить, что approve не метод, а свойство объекта /contracts/123 и GET /contracts/123/approve будет возвращать true, а GET /contracts/123 {..., «approve»: true, ...}, то все становится на свои места. Только approve стоит в approved переименовать, я не сразу заметил, что это глагол((

Ну вот вы сейчас занялись классическим втискиванием бизнес-процессов в сематнику HTTP, в частности изменением методов, операций, глаголов на свойства, атрибуты, причастия :)

Да. Но надо же их как-то описывать :)

Кому надо? Зачем вам описание бизнес-процессов в семантике HTTP?

К сожалению ни Swagger, ни RAML не могут сгенерить хорошую статичную документацию, которую не стыдно выложить в общий доступ. Особенно если речь идет об отправке данных как multipart/form-data или application/x-www-form-urlencoded в теле POST запроса в стиле EntityName[attribute]=value. OAPI 3 умеет такое в GET параметрах, заголовках, путях и куках, но не в POST :(
(структура EntityName определена в отдельном месте для переиспользования)

Уточните, пожалуйста, как вы именно ведете разработку.Верно ли я понял, что в каждом сервисе есть файлы контроллеров+дтошек и отдельный файл спецификации OAPI3 и когда нужно произвести изменение, оно проводится и там и там руками? Или вы все-таки используете автогенерацию документации или наоборот генерацию дтошек на основе OAPI описания?
У каждого сервиса свои нюансы. Контроллеры и DTO у нас есть. Кроме формата сообщений есть и поведение сервиса, эта часть автогенерацией кода пока не решается. Задача полностью автоматической валидации формата и поведения у нас пока не решена, но я думаю, при наличии положительны результатов, это будет материал для отдельной статьи.
Sign up to leave a comment.