Как стать автором
Обновить

Предметно-тематические тренды: назначение и интерпретация

Время на прочтение6 мин
Количество просмотров1.7K

Кононова О.В., Прокудин Д.Е.

Вопросы применения трендов достаточно широко представлены в отечественных и зарубежных научных работах, практических коммерческих предложениях и приложениях. Тренды представляют собою эффективный аналитический инструмент и могут быть использованы для исследовательской и аналитической работы. Для аналитика важно знать ответы на следующие вопросы:

  • Что такое тренд и какие виды трендов существуют? 

  • Как, с помощью каких программных средств, построить тренд?

  • Как интерпретировать результаты построения тренда?


Существует несколько общепринятых подходов к интерпретации понятия «тренд».

Тренд – это представление в графическом виде изменения некоторой величины или группы величин, отражающих рассматриваемые явления или процессы в динамике на временном интервале, часто с элементами прогноза на последующие временные интервалы. Такое представление тренда всегда основано на количественных измерениях. 

Тренд – это представление информации о ситуации или явлениях в схематическом, табличном или текстовом (описательном) виде, отражающем «срез», «картинку», положение вещей за определённый интервал времени или на определенную дату. Такое представление тренда отражает качественные характеристики, содержание (семантику) исследуемых явлений. Часто качественные характеристики являются следствием обработки, анализа и интерпретации числовых данных, например, частот встречаемости терминов в тексте.

Особый класс трендов, используемых в научной работе – предметно-тематические тренды. Применительно к развивающимся междисциплинарным научным исследованиям предметно-тематические тренды позволяют отразить динамику и спрогнозировать тенденции развития тех или иных научных направлений, выделить темы в рамках рассматриваемой тематики, выявить соответствующий тематике терминологический ряд и ключевые слова для построения поисковых запросов. Предметно-тематические тренды могут отражать результаты сравнительного анализа научных материалов, информации из СМИ или социальных сетей по отдельным аспектам, например, данные по предметным областям, журналам, научным школам, ключевым словам, семантическим группам и другим аспектам.

В динамичном потоке общественно-политической и научно-технической информации исследование трендов поможет выявить перспективные направления, технологии и технологические разработки, которые востребованы обществом и в ближайшее время смогут получить реальное воплощение. Для исследователей и аналитиков построение и анализ трендов позволят избавиться от иллюзий, неоправданных ожиданий, технологического «хайпа», и тем самым сфокусировать внимание и усилия на реалистичных задачах и проектах, и оставаясь на острие научной мысли не заниматься «мартышкиным трудом».

При проведении самостоятельных научных изысканий можно использовать несколько типов трендов: предметный, концептуальный, тематический тренды. Для этого первоначально исследователем формируется терминологическое ядро направления, тематики исследования. Поисковые запросы с использованием базовых терминов позволяют подготовить подборку текстов для дальнейшего анализа с использованием специализированного аналитического инструментария, например, Voyant-tools (https://voyant-tools.org), Tropes, (http://www.semantic-knowledge.com/tropes.htm), Sketch Engine (https://www.sketchengine.eu), T-Libra(http://www.softconst.ru/tlibra/) или аналитического аппарата, непосредственно встроенного в библиотечную систему или базу данных, например, Научная электронная библиотека (http://elibrary.ru), реферативная база научной информации Scopus (https://www.scopus.com).

Предметный тренд

Тренд отражает в процентах или абсолютном выражении распределение документов из подборки (корпуса) текстов по предметным областям. Результат может быть представлен численным или графическим образом: как числовой ряд или в виде диаграммы, например, круговой за выбранный временной интервал; в виде матрицы чисел или линейной диаграммы, отражающих динамику изменения «значимости» предметной области для выбранной тематики, если в рассмотрение взято несколько независимых временных интервалов.

Примеры представления предметных трендов.

Распределение научных публикаций по предметным областям. Запрос: "e-Health" or "Digital Healthcare" (Scopus, 2008-2019)
Распределение научных публикаций по предметным областям. Запрос: "e-Health" or "Digital Healthcare" (Scopus, 2008-2019)
Распределение научных публикаций по предметным областям. Запрос: "e-Health" or "Digital Healthcare" (НЭБ eLibrary, 2008)
Распределение научных публикаций по предметным областям. Запрос: "e-Health" or "Digital Healthcare" (НЭБ eLibrary, 2008)

Концептуальный тренд

Концептуальный тренд отражает информацию о количестве документов, соответствующих поисковому запросу за определенное количество лет (по годам, например, 2018, 2019, 2020) или временных интервалов (2010-2015, 2016-2020) для того или иного информационного источника. Концептуальный тренд может быть представлен в виде числового ряда или графически. Как правило, такого рода информация, по полученной в результате запроса первоначальной подборке материалов, предоставляется библиотечными системами автоматически. Результаты обработки и «чистка» первоначальной подборки с использованием уточняющих вторичных запросов или отбора анализируемого материала на основе экспертной оценки предполагает последующее использование дополнительного инструментария для построения трендов, например таблиц Excel.

Тренды, построенные на информации из различных источников. Запрос «Цифровая экономика», 2015-2019
Тренды, построенные на информации из различных источников. Запрос «Цифровая экономика», 2015-2019

Графические редакторы и аналитические программы позволяют математически рассчитывать прогнозные значения на последующие временные отрезки и таким образом достраивать такие тематические тренды.

Тренды, отражающие динамику развития тематики исследования «Электронное здравоохранение», 2008-2019
Тренды, отражающие динамику развития тематики исследования «Электронное здравоохранение», 2008-2019

Термины на представленном графике часто используются в текстах как синонимичные понятия или в схожих контекстах, что отражает, с одной стороны, динамику развития научного направления в целом (через частоту встречаемости терминов в публикациях), с другой – терминологические предпочтения исследователей. 

Тематический тренд 

Тематический тренд отражает развитие тематик, составляющих направление научных исследований, на основе представления развития терминологической базы. Тренд может быть представлен числовым рядом или построен графически на временном интервале, что позволяет проследить динамику использования базовых для направления терминов и ключевых слов. Состав и динамика встречаемости самого терминологического ряда и использования их контекстов отражает интерес к той или иной теме в рамках рассматриваемого научного направления, что служит обоснованием её актуальности и практической значимости. Числовые величины – это частоты встречаемости термина в текстах в абсолютных (абсолютные частотные запросы) или относительных единицах (относительные частотные запросы). Термины в трендах распределяются в порядке убывания частоты встречаемости (что определяет развитие терминологического ландшафта исследуемого междисциплинарного направления). Относительные частотно-ориентированные запросы и их результаты выявляют семантические группы (частотные запросы) и контексты использования терминов (тематические запросы), что позволяет установить темы в рамках рассматриваемой тематики и проранжировать их в соответствие с актуальностью или степенью исследованности. 

Распределение научных публикаций по ключевым словам. Запрос: "e-Health" or "Digital Healthcare", 2008 (НЭБ eLibrary)
Распределение научных публикаций по ключевым словам. Запрос: "e-Health" or "Digital Healthcare", 2008 (НЭБ eLibrary)

На основе результатов выявления динамики развития терминологического ландшафта направления исследований можно, например, прогнозировать выход из употребления одних терминов и вхождение в научный и общественно-политический дискурс новых терминов, а также выявлять устойчивость использования синонимичных терминов как в рамках тематических направлений (семантических групп), так и между самими тематическими группами. Выявление синонимии является основанием для обогащения терминологического ландшафта и онтологии предметной области, которые могли бы использовать представители различных тематических направлений.

Пример тренда. Терминограмма как результат абсолютного частотного запроса, 2011-2018 (ЭБ T-Libra)
Пример тренда. Терминограмма как результат абсолютного частотного запроса, 2011-2018 (ЭБ T-Libra)

Тематический тренд, представленный в виде семантических групп, отражает тематические направления, а термины распределяются по ним в порядке убывания частоты их встречаемости (что определяет развитие терминологического ландшафта исследуемого междисциплинарного направления).

Цифровая экономика. Распределение терминов по семантическим группам, 2008-2018 (ЭБ T-Libra)
Цифровая экономика. Распределение терминов по семантическим группам, 2008-2018 (ЭБ T-Libra)

Семантические группы – результат экспертной оценки результатов абсолютно-частотного запроса (терминограммы) для 3 корзин и 4 семантических групп (выделены на рисунке цветом). Семантические группы содержат термин-концепты со сходными значениями (функциональные синонимы) или термины-понятия с дополнительными значениями (образующие связанные пары). 

Цифровой туризм: тематический тренд (Trends, Buhalis and Law, 2008)
Цифровой туризм: тематический тренд (Trends, Buhalis and Law, 2008)

Полученная с помощью трендов информация носит прогностический характер и, следовательно, может использоваться для выбора тематики и темы исследования, а также для формирования поисковых запросов и списка ключевых слов при подготовке аналитических обзоров и научных публикаций, отчетов. Тренды могут применяться в ответ на вопрос выбора или инвестирования в ИТ, что позволяет исследовательским группам установить приоритеты в отношении плана исследований, оптимизации ресурсов и актуальности темы, отделить «шумиху» (информационный шум, фейки) от реальных тенденций, сравнить ценность научной тематики и ее коммерческих обещаний и перспектив.

Статья подготовлена при поддержке благотворительного фонда Владимира Потанина.

Теги:
Хабы:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Публикации

Истории

Ближайшие события

15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань