Комментарии 51
Пришлось мне как-то этим заниматься. Вот эта книжица политая моим потом и кровью. В одиночку. Еще я сделал и админил "от и до" вебсайт для ревьюверов (их было 400+), которые отработали с 1300+ поданных на конференцию работ, но это уже другая история.
В общем, снимаю шляпу и не завидую. Но чтоб самому не сойти с ума нужно начинать работать раньше, а именно — выработать разумные четкие требования к оформлению принятых к публикации материалов и без сожаления заворачивать тех, кто не оформил.
Самое легкое — просить пдф указанного качества (поля, шрифты и т.п.). Заморочнее — предоставить шаблоны для того же TeX'a и/или Ворда.
Самый простой вариант — забирать информацию в раздельных файлах — отдельно текст, сверстанный по минимальному своду правил (дополнительный перенос для разделения абзацев, переносы предложений, никаких табуляций), изображения в виде png/eps отдельно. Как давать ссылки на литературу, вставлять картинки и формулы можно пояснить отдельным небольшим примером. Мотивации у авторов предостаточно — потрать час на форматирование своего текста — получишь
Переделав за всеми раз, наверняка придется повторить такой подвиг снова.
К слову, хочу сказать, что дела с тэхом в столицах, на мой взгляд не так плохи. На переферии же засилие ворда до сих пор переходит всякие границы и ситуация никак не желает сдвигаться. Моё личное мнение — заставлять писать тексты насыщенные математикой в ворде форменное издевательство над человеком. Правила эти придумывают те, кто не собирается их выполнять. Вот лично для меня проще сверстать всё в латэхе, а потом с помощью GrindEQ перегнать в ворд, с последующей корректировкой. Главная фишка тулзы — она перегоняет формулы из тэха в совершенно нормально редактируемый equation 3.0. Последнее время подумываю продать душу дьяволу и купить её (пока пользуюсь триалами), настолько она бывает необходима
тэх в массы […] дела с тэхом в столицах […] сверстать всё в латэхеИсключительно из любопытства — вы TeX принципиально как «тэх» произносите?
Единственное, что держит на вордоигле — наличие огромного массива старых документов в нем подготовленных, которые портятся часто при открытии в альтернативных пакетах. Но, момент отказаться от майкрософт офиса настал уже давно, и чем раньше это сделать, тем быстрее старые документы выйдут из оборота.
MS Office не нужен Вам. Задумайтесь, те, кто до сих пор не мыслит своей работы без него
Я согласен, что офис не нужен, но в сравнении латекса и ворда:
Ворд — setup.exe -> -> -> серийник -> -> word ->пишем
Латекс -> найти конкретную сборку -> setup.exe -> wtf -> wtf -> wtf -> мучения в выборе удобного редактора -> пытаемся понять -> пишем -> пытаемся понять -> рендерим -> материмся на шрифты -> правим -> рендерим
Вордоигла — потому что с ним просто начать, а дальше уже пофиг, плакать будет в основном не пользователь, а тот, кто работает с кучей разношерстных документов.
Кстати, в своё время хорошо решал вопрос обработки водовских документов через сохранение в формате HTML, там уже даже регулярками можно чистить, плюс все связанные картинки аккуратно рендерятся.
С латексом сложно начать, уже три раза пытался начать работать с латексом, как-то оно не особо получается. Авторы курсов/книг ударяются в малополезные детали, еще не встречал чего-то уровня методички на 20 страниц, где всё просто и легко, рекомендованы конкретные быстрые решения, чтобы просто взять и легко настроить базовый шаблон, а потом начать писать. Бывает еще замшелая книга, которой все восторгаются, но половина подходов уже настолько устарела, что даже найти упоминаемые дистрибутивы несколько проблемно.
А бывают книги, где сводится к куче не объясняемых телодвижений по сборке шаблонов, плагинов и прочего, в итоге собрал звездолёт, но не понимаешь — почему он вверх летит и как поворачивать.
Сил и времени, чтобы глубоко зарыться и полностью всё осознать не особо много.
Да, привет из Екатеринбурга — сайт библиотеки УрФУ позволяет скачивать сведения о книге в формате bibtex, так что регионы потихоньку подтягиваются.
привет из Екатеринбурга
Вас сложно назвать переферией, всё таки у вас двухмиллионный город с сильной наукой. В свое время имел честь общаться с вашими учеными по линии Всероссийских олимпиад по теоретической механике.
В нашем регионе мехмат ЮФУ тоже не брезгует тэхом, я из-за этого собственно его изучать и стал, так как они в свои сборники иначе статьи не принимают. Но в целом по вузам не имеющим статус федеральных ситуация плечевна
Англоязычный tex.stackexchange.com — самое доброжелательное интернет-сообщество, которое я когда-либо встречал.
Ужас какой-то. TexStudio не пробовали? От тех, кто вынужденно переходил в тех с нуля слышал о нем только приятное, что мол даже работать можно. Судя по описаниям — проще чем TexnicCenter (с которым работал лично) — хотя там все тоже работает из коробки и ОК.
Хотя лично мне для практических нужд Тех убог. В ворде я могу влепить в документ эксельный график со всей рассчетной таблицей, данными, формулами и зависимостями, при необходимости поднять эту таблицу проверить данные, поменять что-то. В Техе я такого как-то не помню, не про это он.
Что касается графиков — есть возможность встроить в TeX графики, построенные при помощи Gnuplot, что обеспечивает сходный с описанным функционал. Так же как и Word, TeX не совсем про графики.
Так же как и Word, TeX не совсем про графики.А «о чём же» тогда pgfplots, TikZ и иже с ними?
За студию спасибо, хотя бы сразу не ужаснула, буду пробовать.
там уже даже регулярками можно чистить, плюс все связанные картинки аккуратно рендерятся.
В ворде тоже есть регулярки, правда они не очевидно называются (галка «подстановочные знаки» в поиске и замене).
А встроенные картинки лучше извлекать из файла в формате docx — это zip-архив, в папке «media» лежат оригиналы встроенных картинок. А при сохранении в html картинки сохраняются в «адаптированном» формате.
Последний раз я пару лет назад пытался в ОО заполнить заявку на грант. Оформление на вид осталось тем же, но оказалось, что у них в фонде эти файлы обрабатываются какой-то своей прогой. В общем, пришлось переделывать именно в Ворде, так как эта прога не смогла обработать DOC, пересохранённый ОО
Это всё конечно прекрасно, но… Многие российские журналы требуют статьи именно в DOC
потому что ломать эту ситуацию никто не стремится
многие российские журналы требуют статьи именно в DOC и не берут латехНе только российские. Увы.
Может на заре развития текстовых редакторов идеология latex'а (пиши, а программа сверстает) была преимуществом, но текстовые редакторы не стоят на месте, и нужно внимательно изучить что предлагают в обоих лагерях.
Мне кажется, что если человек способен формализовать и осмыслить эти понятия в своей голове, то он скорее будет пользоваться техом, чем шаблонами ворда.
Уже не говорю про макросы, которые, например нашей службе экономят огромное количество времени. И вообще VBA макросы, ИМХО, главное конкурентное преимущество Office, посмотрите хотя-бы https://github.com/wyfinger/Raschet_DZSH
Как-то я проверял, Excel единственный худо-бедно работает на файлах ~100 Mb c 4-5 листами по ~200 тыс. записей на каждом. Ни LO, ни тем более OnlyOffice не справляются.
Latex хорош для подготовки публикаций, но это не единственный вектор использования офисных пакетов.
Про Latex, скажите хоть кто-нибудь как сделать в вложенный список? в ненумерованный список добавить нумерованный (русские символы: а), б) ...). Верстаю книжку (https://www.sharelatex.com/project/58ab878dbf3be6ae4fe684e4), даже не знаю где спрашивать.
По редактированию — использовать пакет enumitem и счетчики \asbuk
Еще интеграция с прочим. Например с САПР где в эксельных таблицах могут храниться размеры элементов из которых генерятся детали. Или инструменты менедмента данных типа Autodesk Vault — он помимо чертежей прекрасно интегрирауется с оффисом через адд-он и позволяет добавлять в проекты всякие текстовые документы, инструкции и ты ды.
Как раз проверил из интереса (давно хотел) — результат вполне достойный, хотя руками потом еще пилить и пилить. Из явных минусов:
1) сохранил векторные картинки в неудобоваримом формате .svm, его руками надо преобразовывать в eps/pdf (но это на мой взгляд лучше, чем сохранять их в растр скриншотами);
2) Подписи к таблицам/рисункам не связаны с самими объектами, а сделаны просто счетчиками. Но я всегда подозревал что в офисах они именно так жопно и реализованы. Хотя это не точно. Встроенный стиль подписи (Illustration) он преобразовал верно в отличии от моего самодельного;
3) что-то не так с вертикальным объединением ячеек в таблицах
4) ни слова не сказав напрочь потерял (даже комментариев не вставил) цветовое выделение фона текста. Я понимаю, что на бумагу так не печатают, но вот в электронном документе оно мне было очень полезно
5) Какая-то смешная проблема со стилями — внутри каждой новой секции первый параграф без красной строки
PS Простенькую 2-этажную формулу вполне корректно представил в теховской нотации. Но это из редактора OO. Как там в MS Equation — фиг знает.
5) Какая-то смешная проблема со стилями — внутри каждой новой секции первый параграф без красной строки
Ну это не проблема со стилями, а «так задумано». Таков нерусский стандарт, с которым я (вопреки российским правилам) согласен: функция абзацного отступа в том, чтобы два абзаца случайно не выглядели как один. В начале секции это не нужно.
Но можно это решить через
\usepackage{indentfirst}
или\usepackage{polyglossia}
\setmainlanguage{russian}
\PolyglossiaSetup{russian}{indentfirst=false}
В остальном статья очень полезная. По моему опыту LaTeX используют очень мало даже в университетской среде.
Я преобразовывал страничку DOC-файла в PDF при помощи CutePDF, а затем вырезал из нее. Если делать скриншот, получается на мой взгляд неприемлемо низкое разрешение.
Это не более чем еще один язык описания задачи, ЯП, со своими библиотеками (стилями), ресурсами (шрифтами), коммюнити и т.п. Да, имеет свои заморочки. Но по причине своих непревзойденных другими приложениями полезных качеств, похоже, останется с нами на века.
Просто будет сидеть где-нибудь «под капотом» в более попсовых системах, типа всех MarkDown и таким образом прийдет к миллионам и миллиардам пользователей.
Это монстр из той же «линейки», куда входят C, FORTRAN, LISP, SAS.
Заставлять офисный крысок верстать в ТеХе не нужно, и по-видимому, не будет нужно никогда.
Например в R коммюнити было много попыток подружить R с TeXом посредством соответствубщих библиотек. С появлением Rmd (R MarkDown) — одна из фич Rstudio — я стал этим пользоваться практически ежедневно.
Показать его будущим математикам Дать мнимальные основы будущим инженерам — это «the must».
Любой нормальный редактор вам это отметит красной ручкой сразу, не задумываясь.
Далее, там где формула с корнем в строке, межстрочник слишком мал, и горизонталь корня почти наехала на свисающую ниже базовой линии часть буквы «у».
Я тут маленько вам пообводил, что ни один нормальный редактор не пропустил бы. Ещё у вас сильно большие расстояния между омегой с подстрочным индексом и соседними словами (как впрочем и далее с векторной H). Висящая в конце строки «в» (в это корректор должен был ткнуть)… в общем тут только на этой картинке куча ляпов, на которые вам любой профи укажет (лень мне всё обводить).

В общем Гиленсон с его «Требования...»-ми наше верстацкое всё.
И ещё совет: посмотреть на научные книги изданные в СССР в 60—70 гг., там тоже можно много увидеть полезного по методикам оформления формул.
PS: Если нужны будут примеры, спрашивайте, я покажу, как верстаются книги любого размера из любых «вордовских исходников».
Вообще, видели бы Вы исходники… Я ставил перед собой задачу свести все в более или менее адекватный общий документ, а корректура и профессиональная верстка, к сожалению, не входила в бюджет конференции, да и сроки поджимали. Несмотря на обозначенные ляпы, я все же уверен, что со своей задачей справился.
Вообще, видели бы Вы исходники
Ну я выпускаю довольно много газет и журналов, поэтому каждый день сталкиваюсь с таким вопросом, как «полный неадекват верстает в текстовом редакторе».
Вы просто не представляете, насколько этого не хватало! Да, невероятно хотелось бы услышать бы и про системы верстки (и требования к ним), и про бюджетные решения таких задач, и какие где правила можно найти (и насколько они критичны).
Дело ведь в том, что ни айтишники, ни научное сообщество с версткой вообще не пересекаются. Поэтому, скажем, в академических кругах процветают дичайшие мемы про "все издательства, даже художественные работают в техе", "переносы можно самому расставить", "что еще за висячие строки?" и иже с ним. Иногда это даже лечится демонстрацией ценника на InDesign, хотя обычно неизлечимо.
Вот что получилось: все тезисы в едином формате.
lomonosov-msu.ru/archive/Lomonosov_2011/index_2.htm
Это не тиражные книги, поэтому на висячие строки и прочие нюансы Гиленсона всем вполне обоснованно плевать.
Спасибо за прекрасный пример того, как переложить проблему с одной больной головы на сто здоровых. Уверен, что биологи и лингвисты оценили этот маразм по достоинству.
Но при чем тут верстка?
Страницы 10—11:

Это для вас норма? Это только первое, за что глаз зацепился, без выискивания «косяков».
У нас основной техпроцесс завязан на InDesign. Я понимаю, что в теме про Латех это не тру,… но он намного проще и достаточно быстр при подготовки изданий к печати. Впрочем, на текущий момент мы можем перейти на любое программное обеспечение, сейчас это уже стало не так важно, как было раньше.
Я набросаю основные этапы, а вы, если заинтересуетесь, уточните:
1. Уже достаточно давно я заставил всю свою контору перейти к единой системе наименования стилей. Правда внедрение этого дела идёт со скрипом и визгами «мастодонтов», но идёт. Это очень важный этап в получении качественного результата.
2. Перед вёрсткой все материалы нужно зачистить от лишних стилей (от всех, кроме заданного нами списка). Для этого все выделения по тексту конвертируются в стили символов или стили абзацев (по нашему условному списку наименований стилей. У себя на работе, поскольку присылают материалы в основном в word, я написал соответствующие макросы для наборщиков.)
При этом не важно, как на этапе набора будет выглядеть текст, важны только назначенные стили (например автора текста надо отметить стилем — «Автор текста» и т.д.). Главное, чтобы в наборах не создавалось излишнее форматирование (чем грешат все, кто не знает как работают современные системы вёрстки), например не делать ФИО автора прописными символами; т.е. в наборе должно быть: «Иванов Иван Иванович, место работы, г. Красноярск» и назначенный стиль этому абзацу «Автор текста», а не «ИВАНОВ Иван Иванович, место работы, г. Красноярск» и стиль абзаца «какой на душу ляжет»). Привести формулы к одному стилю (например в полном MathType есть макросы для массовой конвертации/форматирования формул). Выгрузить их из набора в формат подходящий для печати (обычно eps в CMYK с превьюшкой) заменив на теги (например на стандартные для MT «<< имя файла.eps>>»). Правда у MT есть проблема при создании файлов eps с кириллицей в формулах, нужно патчить бинарник. Впрочем, под InDesign есть плагины для «нативной» работы с формулами (movemen или mathmagic).
3. Если конечное изделие «нишевое», как рассмотренное в статье, то обычно литредактор его не читает (хотя я бы не советовал так поступать, это конечно позволяет экономить средства, но все каламбуры, что умудряются наваять автора, у вас пойдёт в ваше издание). И снова таки — литредакторов можно брать фрилансеров, в большей части они все будут читать в Word (так уж нас, на пост-СССР, сложилось. Обычно стоит у них пиратизированный Word 2003 и выше с какого-то Zver CD).
4. Обязательно нужно понимать насколько сложная будет вёрстка. Для этого надо на этапе обзора рукописи просмотреть текст (желательно человеку с «редакторским взглядом») и разрисовать макет издания (пусть в голове, пусть на бумаге или в файликах, важно его составить до вёрстки). От этого будет зависеть сколько времени у вас будет верстаться ваше издание (например если у вас есть в материалах «опросник» — то его надо расположить на отдельной странице). Редактор должен построить макет из условия, что вашем изданием будут пользоваться, а не просто поставят на полочку и забудут.
5. Все нужные иллюстрации готовятся заранее и вставляются в текст с помощью тегов (аналогичных MT или тем, которые у вас приняты). Далее, на вёрстке всё втягивается скриптами (у нас были написаны сначала для формул,… потом правда их пришлось написать заново, поскольку утеряли при переезде на обновлённые образы верстацких систем. «Делайте бекапы всего регулярно»).
6. И вот только тогда, когда у нас всё уже подготовлено начинаем верстать. Собственно говоря этот процесс выглядит просто:
1) сначала создаётся шаблонный макет, на котором смотрим различные варианты оформления текста;
2) шаблон передаётся верстальщику. Тот уже создаёт, на основе шаблона, файл для статьи (если нам нужно очень быстро, то для распараллеливания работы делается постатейная вёрстка) или один файл для всех статей (вёрстка одним верстальщиком);
Пункты 1 и 2 можно параллельно выполнять (тогда верстка будет в промежуточном варианте «набора» со всеми иллюстрациями/формулами)
3) заливаются тексты;
4) запускается скрипт заменяющий выделения на стили (аналог наборного, на «всяк пожарный», вордовский скрипт не всегда отрабатывает корректно);
5) скрипт сбрасывающий лишнее форматирование (точно такой же делался в наборе, тоже таки на «всяк пожарный»);
6) скрипт втягивания иллюстраций и формул;
7) если все названия стилей совпали с названиями стилей из набора — то прохождение по тексту и подчистка висяков, коридоров, и прочего визуально «рвущего» вёрстку (а если дизайнер/верстальщик умный, то использует Grep + стили символов в свойствах стиля абзаца).
7. Свёрстанный файл/файлы передаются корректорам — переносы, пропущенные иллюстрации и прочая корректорская работа.
8. Далее редакор уже смотрит окончательный вариант на предмет задумки макета издания.
9. Выпускающий редактор + ОТК.
10. Передача в типографию.
Поэтому, скажем, в академических кругах процветают дичайшие мемы про «все издательства, даже художественные работают в техе», «переносы можно самому расставить», «что еще за висячие строки?» и иже с ним. Иногда это даже лечится демонстрацией ценника на InDesign, хотя обычно неизлечимо.
Я не знаю что у них в головах, но зачастую они приносят файлы «свёрстанные» в Ворде. Впрочем пару раз был Лексикон (в году 2014—2015, кажись...)
Переносы — это больная тема любого издательского процесса (наш язык достаточно сложен, например у нас словарь переносов 3 МБ, при последнем hunspel в 1,9). Для этого и нужны корректора.
Если хотите рассмотрения цен и составляющей в них работы литредактора (да и вообще всех участников техпроцесса издательства, включая типографию), я расскажу. Но обычно она не превышает 2—20% от стоимости издания в тираже (зависит от величины тиража).
Основная цена любого печатного издания сейчас — это бумага. Чем она качественнее, тем дороже получается тираж и тем меньше удельная стоимость подготовки издания к печати.
А если уважаемый BigElectricCat расскажет о своём быстроходном велосипеде для вёрстки и кучи вордовых трешфайлов прекрасного кирпича, сообщество, наверное, будет только благодарно.
о своём быстроходном велосипеде для вёрстки
Скрипты + правильный выбор инструмента.
В данном случае тащить всё Латех — выбор не верный.
Если авторы присылают в Ворде — то набор в Ворде, вёрстка в том, что лучше знаешь.
К сожалению есть ручная работа редактора: расставить стили подзаголовков, поскольку для этого текст надо прочитать. Далее:
1) из текста удаляем все стили, которые не определены нашим стандартом;
2) все выделения по тексту конвертируем в стили символов, естественно пропускаем «шапочные» стили абзацев (в них не нужно сохранять выделения, если их вдруг наставили);
3) сбрасываем всё локальное форматирование.
Так в вёрстку не потянется мусор из наборов. Скрипты под верстальные системы №2 и №3 тоже нужен. Снова таки, в каждой программе написание скриптов своё (для Word — vba, ID/IC — лучше использовать js, как универсальное решение для всех платформ).
Что касается скрипта втягивания формул, там тоже алгоритм достаточно прост (это алгоритм работает как в IC, так и в ID, поэтому было решение: скрипт втягивание формул/картинок отделить от скрипта сдвига базовой линии формул):
1) проходимся по тексту грепом, ищем символы тегов с именем файла (для помещения формул MT можно искать «<<*.eps>>», хотя у нас ищется иная последовательность символов. Построено более строгое правило поиска, завязанное на нашу систему именования файлов).
2) заменяем найденное на связь с файлом по пути «размещение файла вёрстки/имя найденного файла» (путь к файлу с вёрсткой + то, что найдено внутри тега).
Для ID написан отдельный скрипт установки базовой линии изображения формулы и создания параметров обтекания текстом (сделано через стиль фрейма):
1) запоминаются настройки единиц измерения (обычно у большинства верстальщиков в нашей стране включены «мм»)
2) назначается единицами измерения пункты
3) в цикле перебора всех графических элементов (естественно с «нормальным» состоянием) в фале графического элемента находится «%%Baseline: » в котором MT автоматически, при экспорте, сохраняет параметры базовой линии. Найденное значение назначается фрейму с этой формулой. Так же ему назначается 100% размера по высоте и ширине и задаётся размер фрейма по содержимому;
4) восстанавливаем настройки единиц измерения.
Скрипт тяжёлый и если формул много, то работает долго, но другого способа как гарантированно найти все формулы я пока не знаю (в файле с вёрсткой могут быть и другие файлы «eps», которые тоже могут содержать параметры сдвига базовой линии, а могут и не содержать).
Впрочем, мы планируем перейти на MathML, но это пока в только в планах, поскольку надо или приобретать соответствующие плагины (а они достаточно дорогие), или писать своё решение. Ко второму варианту я более склонен, поскольку написанное людьми использующими только латиницу в жизни, обычно, крайне плохо работает с кириллицей. А реалии у нас таковы, что очень много формул имеют в себе кириллические символы. Тот же MT не выводит правильно кириллицу в eps файле без соответствующих исправлений кода.
Верстка сборника тезисов конференции в LaTeX