All streams
Search
Write a publication
Pull to refresh
4
1.4
Send message

Маяковский любил выражать информацию такими средствами. Так что теперь, его стихи запрещать? )

Мы всё таки о документах, из которых имеет смысл извлекать информацию в автоматизированном режиме.

А жесткие и простые методы ограничений использования макропакетов в TeX имеются.

Это уже не просто TeX, а TeX с жёсткими ограничениями. Если ещё добавить машинно читаемое описание структуры элементов в шаблоне и автоматическую проверку соответствия документа структуре - по сути будет тот же XML с другим синтаксисом )

В JSON или YAML таких проблем уже не возникает.

Это уже детали маппинга формата на текстовое представление. Мой основной момент в преимуществе декларативного описания над императивным.

XML встречается только в легаси.

Не очень понял, о чём речь. Мы же о документах, а не о коде.

частота дискретизации была ограничена 23 кГц

Разве не 22050 Гц?

автор точно знает, что после типографии он увидит свой труд в ожидаемом им виде

С точки зрения качества картинки - хорошо, с точки зрения автоматизированной обработки - плохо, потому что автор может явно или неявно выражать информацию чисто типографскими средствами.

журналы и издательства запрещают подключать пакеты

Я говорю о TeX как о формате и системе в целом, а не о практике использования в конкрентных местах. С хорошими coding guidelines и C++ - вполне читаемый язык )

При просмотре XML в Pull Request

Значит, нужны средства, вычисляющие и показывающие разницу на уровне xml элементов, а не plain text, который их выражает. Ну и редактировать по хорошему надо в среде, которая понимает DTD и даёт возможность создавать только корректный документ.

А docbook наоборот, рендерит так, как удобно читателю

Для печати и просмотра людьми docbook обычно рендерится в PDF на стороне автора или издательства.

И много Вы видели TeX шаблонов в стандартной поставке или от приличных журналов/издательств, где этой семантики нет?

Проблемы не с этими шаблонами, а с зоопарком пакетов на CTAN.

открываю, например, стандартный шаблон letter и вижу: \address, \letter, \signature, \opening, \telephone, \location и т.п

Если используются только чётко документированные параметры шаблона - нет проблем. Но TeX это никак не энфорсит - для валидности достаточно, если все макросы нормально раскроются и в результате получится валидный код для собственно TeX'овского движка. В xml можно как минимум проверить, что документ соответствует DTD.

Я не спорю с тем, что TeX хороший инструмент для написания научных статей или книг - но это не лучший формат для автоматизированной обработки.

Каком стандартном, у нас на работе таких больших не выдают) Правда, в офисе всё таки можно подключить полноценные клавиатуру/монитор.

Правый цифровой-стрелочный блок

Часто просто отсутствует, по крайней мере на 14" и меньше.

Насколько помню, в меню игрушек выбирали Кемпстон, джойстик точно был самопальный с выструганной из деревяшки ручкой. Но может уже плохо помню, тем более что своего компьютера не было.

Ему даже до LibreOffice далеко

В него, скажем, FrameMaker умеет, вполне себе профессиональный инструмент.

иным путем обеспечить автоматическую верстку типографского качества вряд ли реально

Надо как то чётко разделять семантическую и типографскую разметку, в ТеXе оно переплетено. В xml-based форматах "типография" вынесена отдельно в stylesheet'ы.

чем в распознавании семантики этой фразы

Мы скорее о семантике структуры (вот этот текст - адрес, вот тот - цитата и т.д.), сам текст пускай LLM распознаёт )

микрокод ядра

Что это? По дальнейшему тексту речь о коде ядра, обновляющем микрокод процессора.

 Чего не скажешь о том же Word, LibreOffice или, тем более, html

Я скорее с docbook сравниванию.

Это неотъемлемая составная часть исходного кода

В том то и дело, что это скорее код, чем данные )

раз TeX понимает

TeX понимает, как нарисовать результат интепретации исходника на бумаге, семантика ему не нужна.

В Commodore 64 из коробки обычный построчный Бейсик. Наверное, был сторонний софт с "обычным" редактированием текста - всё-таки у него даже дисковод был - но он же появился после того, как железку задизайнили.

почему так долго не было единого стандарта

На большинстве 8битных компьютеров основной (забитой в ПЗУ) средой программирования был Бейсик с построчным вводом, такой роскоши как перемещение по коду стрелками просто не было - соответственно, и клавиши кусора воспринимались как что-то впомогательное, так что особо не заморачивались, делали как получится. Это уже потом выжило наиболее эргономичное решение.

И на клонах спектрума у друзей были самопальные джойстики (обычно совместимые с Кемпстон), без него особо не поиграешь.

LaTeX - это скорее язык программирования, который притворяется форматом с логической структурой. Если используется только базовый набор с разбивкой на главы/разделы и т.п., проблем с обработкой нет, но в общем случае с кастомным стилевиком и кучкой вспомогательных пакетов для красивых таблиц, диаграмм и прочего автоматически понять смысл отдельных конструкций нетривиально. Но, конечно, это лучше, чем сам по себе PDF или скан распечатки )

Ну так и речь о том, что для осмысленной обработки надо использовать эти исходники в семантически структурированном формате.

Всё это скорее обработка напильником для более качественной печати.

не позволяют отображать документ одинаково на любых системах

Зачем это "для систем структурирования информации, для семантических сетей, для искусственного интеллекта "?

разве что html с mathml 

Тогда уж docbook с mathml. html - тоже скорее для показа, а не структурной обработки.

Посмотрел, интересная зверушка - типа урезанный (и не особо совместимый) MSX, с возможностью расширить картриджами (в которых не только ROM, но и RAM) до рабочего состояния.

Чисто практически - зачем сейчас компилировать счётную фортрановскую программу для x87?

Information

Rating
1,467-th
Registered
Activity