VioletTape 22 апр 2015 в 12:50

Гугл предлагает усилить JSON с помощью Jsonnet

5 мин

28K

Блог компании GeekFamily.NET*Проектирование API*ASP*

+26

Комментарии 68

Ununtrium 22 апр 2015 в 13:12

Комментарии. Jsonnet принимает комментарии в стиле С ( /* … */ ) и С++ ( // )

Собственно, за отсутсвие комментариев в JSON можно сказать спасибо крокфорду с его шизофреническими идеями.

KvanTTT 22 апр 2015 в 14:31

Только этого мне не хватает в JSON. А все остальное из jsonnet на мой взгляд лишнее, т.к. это стандарт передачи данных, с которыми при необходимости может работать человек.

LastDragon 22 апр 2015 в 18:48

А как же запятая? :)

monah_tuk 26 сен 2024 в 01:55

О, висячая запятая... Это вы верно подметили. По сути: запятая и комментарии. Правда мне отчего-то больше по душе комментарии в стиле Shell, через хеш - #, но это вкусовщина, хотя именно как в конфигах пользуется много где. Но кому-то нравятся ini-стиль через ;... поэтому пофиг: лишь бы были :)

НЛО прилетело и опубликовало эту надпись здесь

ivlis 22 апр 2015 в 15:12

comment: «This is your comment»;

Чем не устраивает?

DsideSPb 22 апр 2015 в 15:17

1. Корректен только в объектах/мапах.
2. Является частью данных, при преобразовании будет полностью загружен в память (что нужно дополнительно обходить, если это проблема).

ivlis 22 апр 2015 в 15:20

Если ваши комментарии настолько забивают память, то я думаю, что проблема не в JSON…

paramtamtam 22 апр 2015 в 15:27

Суть в самом подходе, если вы ещё этого не поняли. В любом языке и синтаксисе (если он подразумевает работу с переменными) тогда можно таскать просто строковую переменную, к которой «присваивать комментарий». Можно в окна (вместо дверей) входить, а микроскопами гвозди забивать — да

ivlis 22 апр 2015 в 15:34

JSON это неструктурированные данные. Комментарий — часть данных. В чём проблема?

Yavanosta 22 апр 2015 в 18:26

Допустим вы делаете конфиг для программы. И у вас есть два варианта: либо конфиг будет без комментариев, либо программа должна будет загружать комментарии в рантайме в память. Это не нужно и это оверхед, т.к. программа держит в памяти то что ей не нужно.

ivlis 22 апр 2015 в 19:10

И сколько там она загрузит этих комментариев? Если вы пишите хардкорный embedded на asm, тогда, наверное, вам json в принципе не подходит, не то что комментарии в нём. А если вы пишите на каком-нибудь js, ruby или python то переживать из-за пары байт в комментарии явно не стоит.

shmaltorhbooks 22 апр 2015 в 19:57

суть в том, что заранее неизвестно какой объем текста будет в комментариях. вы не можете утверждать, что его всегда будет «пару байт».

ivlis 22 апр 2015 в 22:14

Размер JSON вы тоже никогда не угадаете принципиально, так как у него нет схемы. Если вы используете JSON для данных, где можно определить схему, то you are doing it wrong.

mayorovp 23 апр 2015 в 17:21

У любого JSON есть неявная схема — это те представления о возможной структуре данных, которые писали программу, его генерирующую либо использующую.

Иногда эта схема даже описывается в документации.

Vidog 23 апр 2015 в 17:29

Для справки:
www.google.ru/?q=json%20schema

НЛО прилетело и опубликовало эту надпись здесь

Yavanosta 23 апр 2015 в 05:49

По большому счету есть две проблемы с таким подходом:
1) Комментарии являющиеся частью JSON тратят ресурсы. Да, они бы тратили ресурсы в любом случае, но всетаки если бы они вырезались на уровне парсера тратили бы меньше чем если делать это на более высоком уровне. Да, это копейки, но мы сейчас говорим о концептуальной проблеме стандарта.
2) Нет единого синтаксиса или соглашения для комментариев. Можно договориться, например, добавлять комментарий в виде поля "_comment" в объекте, примерно так:

{
   _comment: "This is my program config file. Param 1 is for option1, param2 for option2",
  param1: "value1",
  param2: "value2"
}

Такой синтаксис, во первых не позволяет написать отдельные комментарии к param1 и param2, например так:

{
  // This is my program config file.
  param1: "value1", // Option 1.
  param2: "value2"  // Option 2.
}

Во вторых нет поддержки «вырезания» таких комментариев на разных платформах, и если вы допустим пишете приложение с сервером на c# и клиентами на js, Java и Swift то вам придется написать четыре пусть и простых но прослойки которые будут вырезать _comment ноды из распарсеного дерева, или делать это на уровне тесктого препроцессора.
В третьих это не является стандартом и возможно в будущем вы столкнетесь с какой-то библиотекой или сторонним API которое использует поле _comment для каких-то своих целей, тогда вам придется как-то изворачиваться чтобы один JSON пропускать через вот этот парсер, а другой через другой.

Я не говорю что все эти проблемы нерешаемы или очень сложны, что нельзя прикрутить два парсера или что написать препроцессор очень сложно, но всем было бы удобнее, если бы комменатрии поддерживались в стандарте.

НЛО прилетело и опубликовало эту надпись здесь

PsyHaSTe 23 апр 2015 в 14:16

Чем не устраивает?

Ну меня в вашем предложении больше всего не устраивает, что если нужно будет итерироваться по потомкам, то постоянно нужно будет проверять, не является ли у нас элемент комментарием. Причем насколько я знаю, с одним именем может быть только один элемент хеш-таблицы, коей является JSON, соответственно при желании добавить несколько комментариев в разных местах нужно будет проверять каждый элемент, не начинается ли он на comment, формировать культуру «комментарии начинайте со слова comment, например comment1, commentValue, ...», при малейшей опечатке превращается в camment, coment и т.п., в предметной области, ну например, объект — фильм на афише или блог, может быть поле comments, который придется отдельно обрабатывать, потому что его может порезать проверка на то, что слово начинается на это слово…

Можно продолжать сколько угодно. Причем это это не единственные недостатки вашего подхода, а только в добавление к вышесказанному.

trikadin 22 апр 2015 в 19:01

А можно ссылку на эту тему? Гугл не силён в запросах «Шизофренические идеи Крокфорда» и «Крокфорд против комментариев», а почитать интересно)

spmbt 22 апр 2015 в 20:10

habrahabr.ru/post/247473 в разделе «Сыр-бор и источник»

ivan386 22 апр 2015 в 13:14

Даёш Javascript в JSON

svistkovr 22 апр 2015 в 14:03

Че мелочиться? Давайте сразу компилятор прикрутим к парсеру-JSON.

Gorthauer87 22 апр 2015 в 14:47

Скорее тогда javaton.

НЛО прилетело и опубликовало эту надпись здесь

QtRoS 22 апр 2015 в 13:54

Господи, не надо трогать JSON, пусть останется хотя бы один простой и понятный текстовый формат, который железобетонно все поддерживают!

KvanTTT 22 апр 2015 в 14:26

Единственно, комментарии можно было бы добавить.

torbasow 23 апр 2015 в 08:07

Пусть добавят тип дата/время, и довольно. Можно ещё значение Infinity.

ef_end_y 23 апр 2015 в 10:26

не надо дату/время — нигде нет нормального стандарта. Используйте таймстамп лучше

splav_asv 23 апр 2015 в 10:31

www.iso.org/iso/catalogue_detail?csnumber=40874?

Mithgol 24 апр 2015 в 08:56

При всём наличии этих хороших стандартов всегда можно вспомнить о том, что Twitter (как явствует из примера, официально приведённого вон там) не стесняется возвращать время и дату в адском формате «Wed May 23 06:01:13 +0000 2007» (день недели, месяц, день, время, часовой пояс, год).

KvanTTT 22 апр 2015 в 14:33

Странно, что такое название выбрали, так как есть созвучная и популярная библиотека под .NET: Json.NET.

KReal 22 апр 2015 в 14:41

Странно, что это в хабах ASP и .Net.

KvanTTT 22 апр 2015 в 14:50

Да и гугл по запросу jsonnet первые несколько результатов выдает про Json.NET.

Frodo 22 апр 2015 в 14:33

tagir_valeev 23 апр 2015 в 13:04

Ух ты, в кои-то веки буханка в плюсах!

bodqhrohro 25 апр 2015 в 17:33

Хабр уже не торт. ~~Теперь он — хлеб.~~

TroL929 22 апр 2015 в 14:50

вопрос: а зачем?

spmbt 22 апр 2015 в 14:54

> заменяет стандартный JSON и добавляет новые возможности без нарушения обратной совместимости. Среди таких возможностей: комментарии ...

Для поддержки комментариев делал проект github.com/spmbt/jsonComm — формат с комментариями (одно- и многострочными) и возможность смены ключей и значений в парах «ключ-значение» без удаления комментариев. Хабр

Он сейчас работает и расширен (код скоро будет добавлен в репо после тестирования) до возможности работы с фрагментами jsonComm в JS-файлах. Фрагменты выделяются специальными комментированными скобками с достаточно вольным синтаксисом.

lexore 22 апр 2015 в 14:56

Ну, и кто (и когда) должен вычислять «1 + 1»?
Генерирующая сторона в момент отправки?
Читающая сторона в момент приема?
А если json сохраняется в файл, нужно вычислять во время записи, или во время чтения?

mayorovp 22 апр 2015 в 17:52

Это формат для конфигов. Разумеется, вычислять должна программа при чтении — просто потому что человек пишет.

zencd 23 апр 2015 в 10:38

JSON — это не формат для конфигов. Это формат обмена данными, и его применение конфигами не ограничивается.

mayorovp 23 апр 2015 в 17:15

Зато применение Jsonnet ими ограничивается.

Гугл открыла исходный код своего проекта Jsonnet, языка для конфигурации, который заменяет стандартный JSON и добавляет новые возможности без нарушения обратной совместимости.

Archon 23 апр 2015 в 11:45

JSON — настолько же формат для конфигов, насколько AVI — формат для гей-порно.

За все годы я только один раз использовал JSON для хранения конфигов, и этот JSON как писался машиной, так ей же и читался, человек (я) лишь один раз задал его формат в коде. Зато без использования JSON для передачи данных между какими-то сторонами не обходится нынче почти ни один проект, поскольку альтернатив, в общем-то, и нет (XML и основанные на нём стандарты в разы дороже по оверхеду).

НЛО прилетело и опубликовало эту надпись здесь

Archon 24 апр 2015 в 06:02

Могу в ответ лишь предложить им уволиться и сменить род деятельности, поскольку никакой разницы для разработчика, делать SOAP-сервис или JSON-сервис, в .NET нет, а использовать «все возможности фреймворка», скидывая на пользователей все неудобства, связанные с повышенным оверхедом, они могут в своё свободное время, делая личные проекты.

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 23 апр 2015 в 17:16

Я писал не про JSON как бы

DsideSPb 22 апр 2015 в 15:07

JSON — формат обмена данными, у которого есть множество реализаций для самых разных языков программирования. Он как раз примечателен тем, что он не исполняем, а потому относительно безвреден, а вычислительные ресурсы по его преобразованию обычно близки к О(strlen(message)).

Если нужно обрабатывать данные перед преобразованием в JSON — как раз существующие реализации покрывают эти нужды. Ведь если есть JSON, то где-то рядом работает и преобразователь между JSON и нативными типами (как правило). Добавлять ещё один язык в технологический стек нерационально или даже опасно.

Я вижу только один адекватный способ применения: преобразование структуры JSON-документов — когда у нас есть только исходный документ и приёмник, в который надо послать документ с этими же данными, но в другой структуре. Больше я не вижу ситуаций, когда не используется реализация JSON на другом языке и потому есть свобода выбора. Но лично я даже в этой ситуации выбрал бы Ruby, Python (основы которого изучал бы на ходу, поскольку его не знаю) или JS/производные.

НЛО прилетело и опубликовало эту надпись здесь

ZyXI 22 апр 2015 в 15:18

Тот, кто говорит, что в YAML 1+1 — это строка «1+1» явно ничего не понимает в YAML. Нужно преобразовывать 1+1 в 2 — напишите свой resolver или constructor (второе обязательно, первое нет). Гораздо проще взять готовый YAML парсер и приделать к нему constructor, чем писать новый формат.

Если что: resolver определяет, какой тёг соответствует данному синтаксическому дереву в случае, когда тёг не указан (здесь тёг — это тип). Обычно используется только для скаляров, именно благодаря resolver'ам в формате есть числа и true/false/null.

Constructor определяет, как из синтаксического дерева получить объект (строку/число/словарь/...). Определение тёга определяет constructor.

В стандарте описаны «стандартные» resolver'ы для трёх схем (безопасная, JSON-совместимая, основная (failsafe, json, core)), но нигде не написано, что они обязаны быть единственными.

НЛО прилетело и опубликовало эту надпись здесь

ivlis 22 апр 2015 в 16:03

JSON это декларативный формат по свой сути. Зачем туда пихать императивные директивы вообще не понятно.

kzn 22 апр 2015 в 18:04

XML-bomb сделать не проблема.
Теперь видимо можно будет и JSON-bomb сделать :-)

tagir_valeev 23 апр 2015 в 13:02

Вот да, сразу возникают вопросы с безопасностью. Принимать JSON из недоверенного источника в принципе можно. Дыры в JSON-парсерах случаются очень редко. А тут сам формат подразумевает, что результат может вычисляться долго и захавает всю память.

Sane 22 апр 2015 в 18:21

В json не хватает четырех вещей — схемы, дат, комментариев и NaN. А так — идеальный формат.

Archon 23 апр 2015 в 11:56

Из всего вышеперечисленного для эффективной передачи данных не пригодится ничего (кроме, возможно, NaN). Схему передавать по сети (особенно мобильной) очень дорого, тем более, что предполагается, что общающиеся стороны знают про протокол обмена, и не крашатся от допустимых изменений (отсутствующее поле, значение null в любом из полей, новое поле). Если разработчик накосячил с типом, в который он хочет приводить поле — это не проблема формата передачи данных.

Самый простой способ избежать проблемы с кривыми руками и неверными типами — использовать схожие языки для обеих сторон (например, Java-фронтенд и C#-бекенд), и после фиксации протокола тупо копировать все структуры данных из сериализующего проекта в десериализующий, по пути исправляя синтаксис.

Даты и сейчас прелестно передаются в формате таймштампа. В случае, когда надо передать ещё и таймзону, её всё равно нельзя передавать цифрой +ЧЧММ после даты, а надо заводить отдельное строковое поле.

Sane 23 апр 2015 в 12:10

Схему передавать и не надо — это просто стандратный способ проверить целостность данных, то есть вместо громоздкого текстового описания моего API и тучи реализаций на разных языках, я могу просто предоставить одну схему. Отсутствие схемы — это не минус самого формата, это минус его инфраструктуры, и хорошо, что json schema уже, как минимум, internet draft.

Для дат есть замечательный ISO 8601, самый распротраненный формат данных после строк и чисел. Иметь его в стандрате передачи данных было бы очень приятно.

Archon 23 апр 2015 в 12:53

<нудная мутотень>

ISO 8601 прекрасен для случаев, когда надо передать отсылку на конкретную точку во времени, т.е. по сути, тот же таймштамп. Это прекрасно работает для дат в прошлом. Если же вы оперируете датами из будущего, это может быть неприемлемо. Например, пользователь сказал приложению «напомни мне захватить мир 5 января 2020 года в 11:00», после чего вы сохранили это таймштампом (или в ISO 8601, разницы нет). Через два года прилетает новая tzdata, таймзона пользователя меняет часовой пояс или параметры DST, и представление «5 января 2020 года в 11:00» теперь указывает на другую точку во времени. Но вы об этом не узнаете, и напоминание откроете не в 11:00, а в другое время. Ошибочка вышла…

</нудная мутотень>

Как передавать и хранить дату, надо решать в каждом случае отдельно, в первую очередь отталкиваясь именно от того, что нам нужно зафиксировать — точку во времени (таймштамп), или пользовательское представление о будущей дате (ISO 8601 + название таймзоны). В любом случае, как вы договоритесь делать в протоколе передачи, так можно и передавать, все существующие форматы дат, включая ISO 8601, отлично вписываются в строки.

jonie 22 апр 2015 в 21:19

Да таких проектов уже тьма… есть например HOCON… Но новый язык это как-то слишком имхо для задачи «json на выходе».

k12th 23 апр 2015 в 04:00

Уу, в этом месяце еще никто не изобретал JSON с комментами!

Suvitruf 23 апр 2015 в 07:36

jerom 23 апр 2015 в 09:06

Они были недостаточно креативны с комментами. Вот перловый модуль JSON в relaxed-режиме не только допускает end-commas в списках, но и комменты, начинающиеся с #:

search.cpan.org/~makamaka/JSON-2.90/lib/JSON.pm#relaxed

oberon87 23 апр 2015 в 09:26

Любой синтаксис файлов конфигурации со временем превращается в полноценный язык программирования.

Borz 23 апр 2015 в 09:41

ini и properties пока ещё держатся

oberon87 23 апр 2015 в 09:47

ini сдает позиции потихоньку github.com/toml-lang/toml

zencd 23 апр 2015 в 10:43

del

Зарегистрируйтесь на Хабре, чтобы оставить комментарий