Работа над любым исследовательским проектом включает в себя поиск и изучение множества источников информации. Организация этого процесса — непростая задача. Сегодня мы расскажем об инструментах, которые призваны оптимизировать различные ее составляющие.
Фото João Silas — Unsplash
Вендоры академического ПО часто работают по принципу сотрудничества с образовательными учреждениями. Если ваша организация не приобрела интересующий вас продукт — организовать доступ к нему может быть тяжело. Если и существуют индивидуальные планы, платить за них из собственного кармана готовы не все. С другой стороны, открытые или бесплатные продукты, созданные академиками, нередко страдают от неудобного дизайна и отсутствия поддержки.
Можно попробовать много разных инструментов, прежде чем остановиться на рабочем варианте. Мы решили рассказать о наиболее заметных на Hacker News и в подборках на GitHub.
DOAJ — курируемый каталог открытых научных журналов. В его базе — более 4 миллионов статей из 13 тысяч изданий, представляющих 130 стран. В ближайшем будущем площадка планирует значительно увеличить количество гуманитарных, узкоспециализированных и неанглоязычных журналов. Что интересно, DOAJ предоставляют открытый API для автоматизации поиска по различным параметрам.
Peerus — помогает отслеживать свежие тематические публикации. Каждый день архив пополняется в среднем на 7 тысяч новых материалов. Peerus предоставляет интеграцию с университетскими прокси для загрузки материалов в один клик.
Crossref — открытый архив для публикации и поиска научных работ. Цель проекта — объединить ученых со всего мира на одной площадке, чтобы они могли совместно решать исследовательские задачи. На сайте уже собрали сто миллионов записей. Найти нужный контент можно по метаданным и ключевым словам.
SciRate — веб-приложение для поиска исследований на arXiv.org. Есть фильтры по научным областям и дате публикации. Дополнительно реализована система пользовательских оценок, на базе которой каждой статье присваивается рейтинг.
ArXiv Sanity Preserver — ускоряет поиск по arXiv.org с помощью алгоритмов машинного обучения. На стартовой странице отображаются самые новые материалы вместе с аннотацией. Искать публикации можно по ключевым словам — в поисковой строке, а также по похожим признакам — с помощью ссылки show similar, которая расположена в правом верхнем углу возле каждого документа.
OSF — открытый хаб для поиска и создания научных проектов. Тут можно структурировать исследовательскую работу — наладить контроль за версиями и добавить тэги, чтобы публикацию нашли другие люди. Платформа предполагает работу в облаке, что облегчает доступ к своим проектам. Наработками можно заниматься самостоятельно и делиться с членами сообщества.
doi2bib — поисковой движок для работы со списками источников. В строку поиска вводится цифровой идентификатор объекта (DOI), и система отображает метаданные по найденному материалу для организации списка библиографии в формате BibTeX.
JabRef — приложение, которое оптимизирует работу с библиографическими списками в формате BibTeX. Сгенерированный список экспортируется в HTML, Docbook, BibTeXML, MODS, RTF, Refer/Endnote, OpenOffice и LibreOffice. Запустить утилиту можно на Java VM (версия 8), под Win, Linux и OS X.
Mendeley — менеджер библиографических списков и облачная платформа, которая позволяет получить доступ к файлам по проекту с любого устройства. Mendeley также предлагает рекомендательные возможности и инструменты для общения.
Docear — открытый инструмент для организации источников и построения научной работы на их основе. Пользователю нужно указать папку, которая будет играть роль «библиотеки» материалов по определенному проекту. Программа будет автоматически сканировать ее и добавлять найденные файлы в свою базу данных. Базу данных можно структурировать в виде «дерева», объединяя в одну ветку работы одной направленности. Комментарии и выделения в pdf-файлах автоматически импортируются и также отображаются в интерфейсе. Когда работа с источниками закончится, Docear поможет сформировать итоговый «mind map» и предоставит необходимые цитирования.
Duecredit — цитировать можно не только текст, но и код. Если ваша программа заимствует алгоритмы или методы из научных работ, эта библиотека поможет вам корректно на них сослаться. На данный момент библиотека доступна на Python.
Sphinx — инструмент для «компиляции» документов в reStructuredText'е в HTML, ePub, Texinfo, man-страницы и plain-text. Поддерживает 50 расширений, автоматическую индексацию программных компонентов, создание ссылок для функций, классов, цитат, терминов и проч. Для новичков разработчики подготовили туториал и гайд для быстрого старта. Дополнительно предлагаем посмотреть следующие темы для работы в Sphinx: rtd — поддерживает как Sphinx, так и Read the Docs; Bootstrap — тема, где CSS-шаблоны и JavaScript-расширения фреймворка Bootstrap интегрировали с функционалом Sphinx: навигацией, иерархическим меню и проч.
Фото freddie marriage — Unsplash
Git-scribe — открытый инструмент, заточенный под создание электронных книг. Предоставляет функционал для структурирования текста, редактуры, вычитки, коррекции, совместной работы, а также публикации и экспорта в PDF, mobi и epub.
Jupyter Notebook — текстовой редактор со встроенной средой для интерактивного программирования на Python. Ранее был известен под именем iPython Notebook. Можно установить как локально, так и на VPS, существуют облачные версии продукта.
Texture — интерфейс этого редактора дает доступ к широкому ряду специализированных функций — таких, как создание графиков, формул и разных способов цитирования. Программа использует специальный файловый формат, который при желании можно «распаковать» и разобрать на составляющие. По словам создателей Texture, это позволяет издателям упростить процесс редактирования и рецензирования.
Что внутри Университета ИТМО:
- Toolbox для исследователей #2: подборка из 15 тематических банков данных
- Toolbox для исследователей #1: самоорганизация и визуализация данных
Фото João Silas — Unsplash
Вендоры академического ПО часто работают по принципу сотрудничества с образовательными учреждениями. Если ваша организация не приобрела интересующий вас продукт — организовать доступ к нему может быть тяжело. Если и существуют индивидуальные планы, платить за них из собственного кармана готовы не все. С другой стороны, открытые или бесплатные продукты, созданные академиками, нередко страдают от неудобного дизайна и отсутствия поддержки.
Можно попробовать много разных инструментов, прежде чем остановиться на рабочем варианте. Мы решили рассказать о наиболее заметных на Hacker News и в подборках на GitHub.
Поиск источников
DOAJ — курируемый каталог открытых научных журналов. В его базе — более 4 миллионов статей из 13 тысяч изданий, представляющих 130 стран. В ближайшем будущем площадка планирует значительно увеличить количество гуманитарных, узкоспециализированных и неанглоязычных журналов. Что интересно, DOAJ предоставляют открытый API для автоматизации поиска по различным параметрам.
Peerus — помогает отслеживать свежие тематические публикации. Каждый день архив пополняется в среднем на 7 тысяч новых материалов. Peerus предоставляет интеграцию с университетскими прокси для загрузки материалов в один клик.
Crossref — открытый архив для публикации и поиска научных работ. Цель проекта — объединить ученых со всего мира на одной площадке, чтобы они могли совместно решать исследовательские задачи. На сайте уже собрали сто миллионов записей. Найти нужный контент можно по метаданным и ключевым словам.
SciRate — веб-приложение для поиска исследований на arXiv.org. Есть фильтры по научным областям и дате публикации. Дополнительно реализована система пользовательских оценок, на базе которой каждой статье присваивается рейтинг.
ArXiv Sanity Preserver — ускоряет поиск по arXiv.org с помощью алгоритмов машинного обучения. На стартовой странице отображаются самые новые материалы вместе с аннотацией. Искать публикации можно по ключевым словам — в поисковой строке, а также по похожим признакам — с помощью ссылки show similar, которая расположена в правом верхнем углу возле каждого документа.
OSF — открытый хаб для поиска и создания научных проектов. Тут можно структурировать исследовательскую работу — наладить контроль за версиями и добавить тэги, чтобы публикацию нашли другие люди. Платформа предполагает работу в облаке, что облегчает доступ к своим проектам. Наработками можно заниматься самостоятельно и делиться с членами сообщества.
Организация и цитирование
doi2bib — поисковой движок для работы со списками источников. В строку поиска вводится цифровой идентификатор объекта (DOI), и система отображает метаданные по найденному материалу для организации списка библиографии в формате BibTeX.
JabRef — приложение, которое оптимизирует работу с библиографическими списками в формате BibTeX. Сгенерированный список экспортируется в HTML, Docbook, BibTeXML, MODS, RTF, Refer/Endnote, OpenOffice и LibreOffice. Запустить утилиту можно на Java VM (версия 8), под Win, Linux и OS X.
Mendeley — менеджер библиографических списков и облачная платформа, которая позволяет получить доступ к файлам по проекту с любого устройства. Mendeley также предлагает рекомендательные возможности и инструменты для общения.
Docear — открытый инструмент для организации источников и построения научной работы на их основе. Пользователю нужно указать папку, которая будет играть роль «библиотеки» материалов по определенному проекту. Программа будет автоматически сканировать ее и добавлять найденные файлы в свою базу данных. Базу данных можно структурировать в виде «дерева», объединяя в одну ветку работы одной направленности. Комментарии и выделения в pdf-файлах автоматически импортируются и также отображаются в интерфейсе. Когда работа с источниками закончится, Docear поможет сформировать итоговый «mind map» и предоставит необходимые цитирования.
Duecredit — цитировать можно не только текст, но и код. Если ваша программа заимствует алгоритмы или методы из научных работ, эта библиотека поможет вам корректно на них сослаться. На данный момент библиотека доступна на Python.
Работа с документами
Sphinx — инструмент для «компиляции» документов в reStructuredText'е в HTML, ePub, Texinfo, man-страницы и plain-text. Поддерживает 50 расширений, автоматическую индексацию программных компонентов, создание ссылок для функций, классов, цитат, терминов и проч. Для новичков разработчики подготовили туториал и гайд для быстрого старта. Дополнительно предлагаем посмотреть следующие темы для работы в Sphinx: rtd — поддерживает как Sphinx, так и Read the Docs; Bootstrap — тема, где CSS-шаблоны и JavaScript-расширения фреймворка Bootstrap интегрировали с функционалом Sphinx: навигацией, иерархическим меню и проч.
Фото freddie marriage — Unsplash
Git-scribe — открытый инструмент, заточенный под создание электронных книг. Предоставляет функционал для структурирования текста, редактуры, вычитки, коррекции, совместной работы, а также публикации и экспорта в PDF, mobi и epub.
Jupyter Notebook — текстовой редактор со встроенной средой для интерактивного программирования на Python. Ранее был известен под именем iPython Notebook. Можно установить как локально, так и на VPS, существуют облачные версии продукта.
Texture — интерфейс этого редактора дает доступ к широкому ряду специализированных функций — таких, как создание графиков, формул и разных способов цитирования. Программа использует специальный файловый формат, который при желании можно «распаковать» и разобрать на составляющие. По словам создателей Texture, это позволяет издателям упростить процесс редактирования и рецензирования.
Что внутри Университета ИТМО:
- Показываем лабораторию «Перспективные наноматериалы и оптоэлектронные устройства»
- Что делают в лаборатории квантовых материалов Университета ИТМО
- Механизированные руки и манипуляторы — чем занимается лаборатория робототехники
- Экскурсия по нашей лаборатории киберфизических систем
- Фаблаб Университета ИТМО: DIY-коворкинг для творческих людей — показываем, что внутри