Pull to refresh

Металлургам от учёных «Северстали»: отраслевой высокотехнологичный поисково-аналитический сервис по патентам и статьям

Level of difficultyEasy
Reading time7 min
Views1.1K

Привет, Хабр! Меня зовут Маевский Антон, я руководитель одного из внутренних стартапов «Северстали» — Научный след. Это поисково-аналитическая платформа по патентам, статьям и новостному потоку. Разработка интересна своей беспрецедентностью, потому что в отечественной металлургии такой научной информационной системы ещё не было. О ней я и расскажу.  

Как мы решили разрабатывать внутренний сервис и во что оценили концепцию

Я пришёл в «Северсталь» из фундаментальной науки. Для меня стал полным откровением уровень наукоёмкости и технологичности металлургического производства. Я понимал, что любые научно-исследовательские и опытно-конструкторские работы (НИОКР), любые решения по наукоёмкому или высокотехнологичному проекту требуют предварительного литературного обзора и патентной аналитики. Работая в НИИ, для этих целей я привык пользоваться продуктами от западной компании Elsevier, в частности SCOPUS — известной библиографической и реферативной базой данных рецензируемой научной литературы.

В «Северстали» тоже были доступы к таким ресурсам. Но если в НИИ доступ был у любого желающего и бесплатно (учёным они предоставляются в рамках национальной подписки), то в «Северстали» было порядка 10 доступов на 300+ человек, занятых в инновациях и RnD. Причина простая — это дорого. 

Это было два года назад. Тогда и родилась мысль о том, что было бы хорошо сделать подобный сервис для внутренних потребностей компании — этакий металлургический SCOPUS — и предоставить доступ любому желающему.

При попытке оценить стоимость сервиса у внешних разработчиков, мы получили широкий диапазон цен — от нескольких десятков до сотен миллионов рублей. А также сложно обосновываемую для руководства историю окупаемости. Но это нас не остановило.

Мы — это подразделение Экосистемы Северстали. Мы помогаем привнести новые идеи в работу предприятия и привлечь к решению задач партнеров и экспертов со всего мира. В команде у нас Виктор Веденеев, Ведущий эксперт развития цифровых сервисов, готовый днями и ночами инициативно кодить и создавать что-то полезное. Виктор, в рамках данного проекта, занял роль технического руководителя проекта. И, как водится, у таких ребят есть такие же инициативные друзья. При этом у них уже были наработки десктопных подсистем, которые хорошо встраивались в нашу общую концепцию.

Мы показали эту концепцию директору по техническому развитию и качеству — ему понравилось. Забегая вперёд, скажу, что немаловажным фактором успеха была наша готовность сделать MVP сервиса и подтвердить на него спрос у сотрудников компании. А ресурсы и помощь появились именно тогда, когда мы показали востребованность продукта.

Что ж, представители Elsevier рассказывают, что ежегодно тратят миллионы долларов на развитие своих сервисов. Нам же удалось реализовать поисково-аналитическую систему по патентам и статьям по металлургической тематике, находясь в дефиците ресурсов.

Что умеет наша поисково-аналитическая платформа для металлургии

Система анализирует текстовые данные с использованием NLP (Natural Language Processing) и машинного обучения и состоит из 5 функциональных модулей: 

  1. Семантический поиск — осуществляется по предметным областям с помощью механизма классификации. 

  2. Аналитика — позволяет провести анализ информации по различным параметрам и просматривать её в разных форматах. Здесь можно посмотреть каждый документ из списков, формирующих аналитические графики. 

  3. Ландшафты — формирует графическую выборку карты развития технологий, используя различные форматы представления информации - ландшафты, топографии стран и т.п.

  4. Поиск экспертов — система на основе классификатора присваивает автору научно-технической информации набор компетенций, анализируя внутреннее содержимое документов автора. 

  5. Поиск по химическому составу — уникальный алгоритм позволяет выявить в описании документа химические элементы и получить список изобретений с описанием химического состава. 

А теперь немного интересных подробностей про разработку и функции системы. 

Сервис способен осуществлять поиск по статьям и патентам с классификацией по индексу Международного патентного классификатора (МПК). Да, каждому патенту автоматически присваивается такая классификация, но мы научились систематизировать по МПК научные статьи.

Реализовали мы эту функцию в лучших ML-практиках: обучили нейросеть на выборке патентов, и теперь она автоматически производит классификацию статьи, которую мы ей «скармливаем», на контекстном уровне. Классификация трёхуровневая: классы, подклассы, группы. 

Вы, конечно, можете сказать, что несложно нагуглить патенты и статьи. Но дело в том, что поисковик выдаст на запрос около 100 текстов, каждый из которых надо будет изучить хотя бы «по диагонали». Наш сервис позволяет в три клика сделать выборку более фокусной и сократить её до 10–20 статей или патентов. То есть выборка релевантных статей сокращается в соотношении 2:10. 

Интерфейс системы
Интерфейс системы

Платформа выдаёт аналитику по одному клику и показывает путь развития исследуемой технологической тематики:  

Интерфейс раздела аналитики
Интерфейс раздела аналитики

Сервис помогает за пару минут найти эксперта, исходя из требуемых компетенций на основании публикативной и патентной активности: 

Пример выдачи экспертов по заданной теме
Пример выдачи экспертов по заданной теме

Платформа позволяет осуществлять подбор патентов и публикаций в области материаловедения по химическому составу с учётом минимального и максимального содержания элемента. В поиске можно вводить до 10 элементов:

Система позволяет сохранить сформированный запрос и подписаться на уведомления о выходе новых публикаций.

Чтобы оценить по достоинству эти возможности, приведём в пример два кейса из опыта использования системы в контуре ПАО «Северсталь».

Сервис помог быстро найти редкого эксперта 

«Северсталь», как любое металлургическое производство, периодически сталкивается с техническими проблемами, которые надо решать максимально оперативно. Уровень специалистов, работающих в компании, иногда поражает любое воображение, но регулярно возникают задачи, в решении которых требуется помощь. Понятно, что нанять «экспертов по всем вопросам» невозможно, а уже работающие в компании специалисты не могут обладать всеми знаниями мира. 

Поэтому у нас есть подразделение, которое занимается привлечением высококвалифицированных экспертов из НИИ и университетов. По сухой статистике за 5 лет существования этого отдела на поиск и привлечение эксперта уходит 5–7 рабочих дней. Раньше этот поиск происходил исключительно через нетворкинг. 

Какая была проблема

После развёртки очередного модуля по поиску экспертов коллеги из этого подразделения пришли к нам с острой проблемой. Уже 3 недели они искали человека с опытом разработки конкретной марки стали — не популярной, но востребованной. Несмотря на развитую сеть контактов, найти такого эксперта не удавалось. 

Как помогла платформа «Научный след»:

  1. После ввода марки стали в раздел компетенций система поиска экспертов выдала четырёх человек с патентами или публикациями по ней (затраченное время — 3–5 минут).

  2. В патентах и публикациях мы нашли контакты авторов (20–30 минут).

  3. Написали шаблон письма и разослали всем найденным экспертам (20 минут).

  4. Через 3 часа получили ответ одного из них  о готовности участвовать в решении нашей проблемы.

Что получили в итоге 

Вместо трёх недель, потраченных коллегами на поиск эксперта, мы смогли найти его за 1 час. А уже через 4 часа мы получили от эксперта обратную связь о готовности сотрудничать. 

Платформа позволила заметно увеличить объём патентуемых изобретений

«Северсталь» ежегодно патентует порядка 65 изобретений. Большая часть патентов относится к новым маркам сталей или других материалов. При написании патента надо указать ближайшие аналоги. Обычно на подбор аналогов уходит 1–2 рабочих дня.

Какая была проблема

В классических патентных системах нет функции поиска по химическому составу с учётом диапазонов содержания элементов. Это обусловлено сложностью задачи по автоматическому выделению этой информации из патента или статьи, так как нет общепринятого шаблонного подхода к описанию химического состава. Разные авторы могут указывать его в форматах, похожих с точки зрения человека, но разных с точки зрения автоматического распознавания.

Как помогла платформа «Научный след»

Нам удалось разработать и внедрить в платформу алгоритмы распознавания химического состава с диапазонами упоминания. Теперь для написания реферата патента, где требуется упоминание аналогов патентуемого материала, можно подобрать аналоги всего за 1–2 часа. 

Что получили в итоге 

С помощью сервиса удалось освободить до 50 рабочих дней патентного отдела в год. С учётом того, что количество годовых обращений превышает количество оформляемых заявок, использование системы позволяет повысить количество защищаемых изобретений.

А потом произошли известные события, в результате которых западные аналитические системы ушли с российского рынка. Тогда мы поняли, что перед нами незанятая рыночная ниша, и этим надо воспользоваться. 

Из внутреннего продукта — в рыночное решение

Ситуация выглядела вдохновляющей, хотя и не без сложностей. С одной стороны, мы понимали, что эта рыночная ниша небольшая, по объёму рынка меньше большинства ниш для IT-продуктов. К тому же специфическая, её мало кто понимает. Но с другой стороны, эта ниша резко стала практически пустой, её понимаем мы и нам уже есть что предложить рынку. 

Так начался наш крестовый поход в открытый рынок. Теперь поисково-аналитическая платформа Научный след — это коммерческий продукт. За два года существования он получил соизмеримые объёмы с западными системами. На сегодня база данных составляет 20 миллионов патентов и 60 миллионов метаданных научных публикаций, собранных по разным тематикам из открытых источников. Эта база постоянно обновляется и развивается.

Инструменты и интерфейс платформы можно изучить в видео по ссылке

В этом видеоролике хорошо видны функции, инструменты и интерфейс металлургической платформы “Научный след”
В этом видеоролике хорошо видны функции, инструменты и интерфейс металлургической платформы “Научный след”

Результаты внедрения поисково-аналитической платформы для металлургов в рабочие процессы «Северстали»  

Ниже представлены некоторые метрики и статистические показатели продукта.

  1. Сервис функционирует в периметре ПАО «Северсталь» уже 2 года.

  2. Сейчас им пользуются 90+ пользователей в месяц, что в 9 раз больше ежемесячных доступов к продуктам Elsevier. За счёт развития и внутриотраслевого пиара происходит стабильный прирост пользователей. 

  3. Всё начиналось со 100 запросов в начале 2022 года, в этом году мы перевалили за 3000 запросов в систему ежемесячно. 

  4. Время, затраченное на первичную проработку технической задачи, сокращено на 35%.

  5. Время, затраченное на подбор и привлечение внешнего эксперта на основании публикативной и патентной активности, сокращено на 40%.

Сейчас система объединяет 40 млн статей и патентов по металлургической тематике. В 2024 году команда проекта планирует расширить базы знаний на другие направления и увеличить объем до 40 млн патентов и 80 млн научных публикаций.

И с вашего позволения, минутка рекламы. Если вы понимаете, что использование такого поискового продукта поможет ускорить рабочие процессы в вашей компании, то мы будем рады обсудить сотрудничество и внедрение платформы «Научный след».

Tags:
Hubs:
Total votes 3: ↑2 and ↓1+1
Comments0

Articles

Information

Website
www.severstal.com
Registered
Founded
Employees
over 10,000 employees
Location
Россия