Comments 8
такое себе
yml может в ссылки, из за чего компактность увеличивается при одинаковых данных. так же как плюс поддержка комментариев
а еше yml можно по разному записывать - вообщем не увидел преимуществ нового в сравнении. с существующим старым
Комменты YAML - killer-фича
yml вообще очень продуман
начиная от ссылок (что очень удобно в больших файлах) причем с возможностью "изменить" или дополнить и заканчивая разными форматами записи из за чего можно хоть в одну строку описать все
Мой кейс - я смог втиснуть на один(!) FullHD-экран YAML на русском - все именованные сущности (названия команд, роли отрядов, ники/позывные, стоимость пуль и мин, доступность команд) и вообще все правила игры в страйкбол с Lora-электроникой, с комментариями для прямой правки не-технарями. Из этого YAML в CI/CD собираются *.json для .py, .js, .apk и .h-заголовочные файлы для прошивки С++/Arduino ESP32, причем с нужными типами. Единая точка правды для таких разных софтин оказалась реальна именно с YAML (но пару лет мучились с JSON).
Текстом та же информация занимает 5 страниц А4, таким образом семантическое сжатие - 5:1. Visual Studio Code прекрасно подсвечивает и линтит .yml, неусыпно бдит типы значений для переменных, а валидность YAML и JSON чекает precommit-хук.
Спасибо формату: отсутствие 99% скобок, кавычек, апострофов - делает конфиг ясно читаемым, как “Не влезай - убъет”. И при этом влезать в конфиг можно и нужно постоянно.
Ещё хорошо бы сделать тесты на разных llm, насколько успешно и безошибочно они прочитают каждый из форматов?
Предположу, что здесь победит json, за счёт некоторой информационной избыточности.
Странно в контексте LLM считать символы, вместо токенов. Тем более, что токенизаторы доступны
Было бы интересно видеть сравнение на разных семьях моделей. Разные модели по-разному "обрабатывают" разные форматы и имеют разное относительное качество на форматах
TOON против TRON против JSON, YAML и CSV для LLM-приложений