Comments 12
А можно полную спецификацию этого чудного формата MD? Какой синтаксис у исходных кодов, какой у таблиц?
Впервые этот язык разметки выпустили в 2004 силами двух людей, но в той версии было много проблем.
В 2014 контрибьюторы Markdown выпустили однозначную спецификацию и набор тестов CommonMark.
А сейчас есть множество разных "диалектов", например самый популярный сейчас GitHub Flavored Markdown (GFM), который добавляет дополнительные возможности. Ну и другие, реже используемые - Pandoc Markdown, MultiMarkdown, R Markdown
Думается мне, что если такой формат получил бы широкое распространение, то быстро бы появились расширения для браузеров, которые позволяли бы сёрфить по "чистому" интернету без рекламы и перегруженного дизайна. :)

Нашелся даже плагин для хрома чтобы детектить наличие llms.txt на сайтах, но почему-то только при ручном нажатии кнопки, а не авто. Еще в браузерах есть "режим чтения", который тоже все лишнее убирает.
А так да, ждем новых решений от энтузиастов :)
Без ответов на страницах и богатой семантики этот файл бесполезен. А ещё нужен сайт без технических проблем.
Нейросети не учитывают этот файл. Об этом говорили и представители Google и Open AI. Пока он стандартом не является
Да, это не официальный стандарт, но его уже используют крупные компании. Сейчас от него больше пользы самим разработчикам, которые могут скачать один файл с контекстом и юзать его по своему усмотрению. При этом очень вероятно, что по мере распространения стандарта Google и OpenAI всё же начнут учитывать этот файл как приоритетный, вместо парсинга сайта. Так что почему бы и не внедрить, если у вас ,например, есть документация для какой-то библиотеки.
Что такое LLMs.txt и LLMs-full.txt и как заставить AI знать документацию наизусть