Нейросеть на патентах: интервью с разработчиками Awtor / Хабр

Awtor — нейросетевой генератор технических решений, базой для обучения которого послужил архив советских патентов. По сути, это утилитарный инструмент для поиска настоящих и будущих способов преодоления технологических барьеров. Говоря совсем простым языком — генератор изобретений.

Наткнулась я на него, разбирая заявки на акселератор AI-проектов «Архипелаг 20.35». И возникло чувство, что либо мимо нас прошло незамеченным что-то крутое, пусть пока еще и в начальной форме развития, либо это что-то непонятное, которое само потом «отвалится».

В любом случае должность позволяет мне вытащить из заявки контакты, пообщаться и написать тут, что получилось в итоге. Вкратце, это не распознавание этикеток нейросеткой и не Малевич гжелью. Тут все сложнее. И продавать такие продукты, конечно, тоже сложно.

Собеседник — Галина Пастухова, математик, замдиректора по науке и инновациям в Академической школе ИТ при ПГУ и руководитель департамента программирования в Корпорации ПСС, одновременно руководит разработкой системы и участвует в создании ее архитектуры.

— Вы заявляете, что с помощью вашей разработки Awtor можно найти все потенциально возможные изобретения. Что это значит?

— Любой предмет и любое изобретение — это совокупность физических величин. И некоторые из них находятся в противостоянии друг с другом. Например, вес и мощность батареи. Скажем, чем беспилотник дольше летает и больше поднимает — тем тяжелее у него должна быть батарея. Последнее время человечество идет по пути обнаружения и снятия этих противоречий. Большинство изобретений лежат на стыке преодоления противоречий.

Мы взяли советскую базу патентов 1963–1989 годов, обработали ее и отдали нейронной сети. Целью было выявить, как со временем меняются ключевые физические свойства изобретаемых вещей. Если свойства определены и их последовательность задана, то дальнейшее развитие предмета будет идти в определенном порядке и по определенным физическим величинам.

И неважно, какой конкретно это предмет — ложка, велосипед или трубопровод.

Идеология работы Awtor

Эта эволюционная спиралька была нами поймана. Мы можем предсказать, как в дальнейшем будет меняться предмет, состоящий из определенных элементов, которые характеризуются определенными физическими величинами. При этом необязательно, чтобы каждому шагу соответствовало реальное изобретение, появление новой версии предмета. Человечество запросто может через какие-то ступени перепрыгивать, некоторые решения могут оказаться экономически нецелесообразными.

— Что про это думают вокруг?

— Да, проблема недоверия… она космическая. Поэтому мы решили не выступать сразу с громкими заявлениями в разных СМИ, а сначала пойти по нашим пермским предприятиям. У нас в регионе много крупных наукоемких производств. И все варианты, которые они с помощью нашей системы решили, мы начали собирать у себя на сайте.

Например, был кейс с Челябинским механическим заводом. У них проблема с движением внутри некоего механизма: мешает вязкость.

Приехали и говорят: «Мы слышали про вашу систему, но нам кажется, что вы врете, это невозможно».

Садимся вместе за компьютер, вбиваем исходные данные. Компьютер выдает 17 шагов развития предмета в определенной последовательности. Оказалось, предприятие находится на четвертом, а предыдущие три они как раз в таком же порядке проходили.

Но есть еще и такой момент. Система говорит на выходе: измени плотность, измени дипольный момент. Это не слишком информативно — хочется видеть комплексный ответ, включающий конкретные диапазоны величин, примеры реализации. Наше решение первоначально настраивалось на физику, но у предприятий много проблем и химического уровня. Поэтому сейчас мы наращиваем базу знаний в этой области.

— То есть по сути машина находит, какие противоречия лежат в основе существующего технологического барьера, и показывает пути обхода?

— Анализ противоречий — это важная часть. Мы даже создали свою классификацию. Противоречия бывают чисто физические, которые идут из формулы. Самый простой пример: время равно пути, поделенному на скорость. О, значит, время и скорость в обратной пропорциональности: чем одно больше, тем другое меньше. Это противоречие первого типа.

Источником данных для обучения нейросети служит патентная база Федерального института промышленной собственности (ФИПС)

Следующий тип противоречий — это более сложные системы, где одна формула опосредована во второй, третьей, четвертой. И когда их разложишь, посмотришь на левый и правый край, находишь противоречия второго типа. Как пример приведу массовую концентрацию $\gamma = \frac{г}{м^3}$ , которую можно разложить на произведение линейной плотности ( $\frac{г}{м^2}$ ) и единицы на метр: $\frac{г}{м^2}\times \frac{1}{м}$ . В итоге мы видим, что обратно пропорциональна длине.

Наконец доходим до третьего противоречия, где добавляются социально-экономические факторы. Например, как получается, что спортивный КамАЗ одновременно и надежнейшая машина, побеждающая из года в год на соревнованиях, и очень неудобная — на ней только русские мужики приноровились ездить.

Или почему все охотники любят ездить на «буханке»? Что-то никто на Lexus не пересел, все на «буханках» катаются — с учетом бездорожья Пермского края. Почему? Тут и надежность, и ремонтопригодность, и если что отвалится, не жалко — поменяем, отрежем, привинтим, приварим и так далее. Это же интереснейшая вещь, она сложно формализуемая, но и ее надо учитывать.

— Что вы использовали в качестве тестовых задач для своей системы? Как все настраивали?

— Нашим экспериментальным образцом стал шприц, именно его мы первым начали функционально разбирать. Поставили цель — увеличить скорость ввода препарата. И по ответам системы следили, в правильном ли направлении идут наши разработки. На определенном этапе машина выдала интересное предложение по игле: сделать в ней не одно выходное отверстие, а десять. Я как человек понимаю, что это нерентабельно, исходя из сегодняшних представлений о шприце. Но зато решение само по себе уникально. И машина его выдала.

Еще среди ответов было предложение изменить химический состав иглы. Но это решение уже есть: ледяные микроиглы существуют. Лед, ясное дело, не из воды, а из подходящего вещества с медицинским препаратом, которое можно заморозить. Его сверхбезопасно воткнул — и оставил. Препарат растаял, и рассосалось все.

— Вся эта история с десятью отверстиями чем-то напоминает систему гидрополива.

— Это хороший пример функционального изоморфизма. С функциональной точки зрения по набору ключевых физических характеристик шприц и систему гидрополива можно считать одной сущностью. Но при этом большое количество отверстий в системе гидрополива — норма, а в шприце пока кажется чем-то необычным. Задача нашей программы — сказать, что это возможно. И, как потом выяснилось, такие решения в принципе есть, хотя их используют в несколько иных целях.

Мультиинжекторный шприц на пять игл для мезотерапии

— Какие еще задачи способен решить Awtor? Можете привести пример, когда результат, выданный системой, использовали на практике?

— Один из запросов пришел из отраслевого союза «НейроНет» НТИ. Там возникла проблема с неинвазивными датчиками для головы: плохая передача сигнала, дикие помехи. Внесли исходные данные, смотрим результаты.

И среди прочих примитивных ответов (вроде отверстия в черепе) машина предложила изменить температуру. Просто нагреть датчики, чтобы их температура приблизилась к температуре кожи головы.

Когда этот вариант начали реализовывать, выяснилось, что при нагревании датчиков голова начинает потеть. И пот стал отличной средой для передачи сигнала, он дополнительно повысил эффект от нагрева.

Кстати, 21.03.2019, когда мы закончили работу над модулем патентования, наша система отправила заявку на патент в ФИПС. Ее приняли. И мы такие первые в мире.

Понятно, что нас там развернули, ведь на патент может подавать только человек, поскольку процесс изобретения — это человеческая деятельность. Но прецедент мы создали.

А дальше мы начали рассуждать, кто вообще тут автор? Создали целую классификацию: как бы есть кентавры первого уровня, второго и третьего.

Кентавры первого уровня — это те, кто вводит данные в нейронную сеть. Потом те, кто интерпретирует это. В общем, скоро мы доделаем про это ролик и выложим на свой канал в YouTube.

— Расскажите о начинке Awtor: каковы архитектура и математический аппарат, на каком языке написана?

— Awtor разрабатывает моя команда, я научный руководитель и технический директор проекта. В основе лежат нейросети Кохонена и наше ноу-хау — алгоритм по их настройке и обучению. Программа написана на Python и представляет собой типичный монолит. Ставится на конкретное рабочее место, защищается HASP-ключом. Работает под Windows как обычное нетяжелое приложение (дистрибутив текущей версии — 40 МБ), без специальных требований к железу. Облачную архитектуру пока не рассматриваем, в первую очередь из-за рисков информационной безопасности.

— И как выглядит процесс работы с системой?

— Интерфейс очень простой. В поле «Предмет» вводите предмет, который требует улучшения. Например, нам нужно улучшить насос, чтобы поднимать из месторождений загустевшую при низких температурах нефть. Значит, вбиваем «Насос».

На следующем этапе система просит нас отметить галочками несколько физических величин, которые в этом предмете принципиальны. Отмечаем плотность, молярную массу, что-нибудь еще.

Затем в поле «Что не устраивает» вводим «Вязкость». Начинаем набирать, система подсказывает нам варианты, говорит, что есть четыре типа вязкости: динамическая, кинематическая и так далее. Выбираем «Динамическая вязкость» и нажимаем кнопку «Выполнить».

Система переходит к уточнению ключевых параметров. Нужно указать, что это: явление, процесс или величина. Классификатор работает по степени энтропии — насколько хорошо пользователь знает эту характеристику предмета. Если ничего не известно, выбираем «Явление». Если что-то известно — «Процесс», а если есть точные данные — «Величина».

Программа делает расчет и выдает в соответствующем поле последовательность физических параметров объекта, с помощью которых можно разрешить заданное пользователем техническое противоречие.

«Редуктор» — совокупность физических величин, а в поле «Результат» — варианты ответов, разложенные по закладкам с разделами физики

Допустим, машина выдала цепочку из 18 ответов. Разумно эту волну ответов снова машине вернуть. Если до этого мы отметили пять физических величин, то теперь отметим десять, добавив те, что есть в ответе машины. Вдруг она нам на следующей итерации даст более подходящий ответ. Потому что ответов действительно много, и по ним видно, как они усложняются с точки зрения используемых технологий. Последние ответы вообще из области ультразвука или фотоники, к которым человечество просто физически не готово.

Ответ от машины — это одна или несколько физических величин. Например, температура. То есть методически понятно, как дальше действовать. Нужна невязкая нефть — подогрей. Но хочется получить не только величину, но и интерпретацию: как именно изменить температуру, чтобы достичь результата.

— И система это делает?

— Интерпретация машине, к сожалению, не по зубам. Для этого уже не глубокие нейронные сети нужны, а какой-то иной механизм, потому что выбор в конечном итоге будет всегда упираться не в технологию и технику, а в экономику. Что выгоднее, то и будут менять инженеры на своих предприятиях. Но пока экономические параметры — это большая далекая мечта.

Пока интерпретация ответов — это прерогатива человека. Только специалист поймет, глядя на них, что экономически целесообразно, что можно себе позволить изменить в существующих технологиях. Сейчас это такой специализированный инструмент для инженеров.

— Существуют ли похожие на Awtor системы?

— Прямых конкурентов нет, но похожие есть. Например, разработки основоположника ИИ в Беларуси Валерия Цурикова: True Machina и Invention Machina. У них матаппарат совсем другой. В True Machina научные работы подвергаются семантическому анализу, из них выделяется суть открытия. А потом комбинаторными методами открытие прогоняют по иерархии технических функций — для чего его можно использовать. Формируется база концепций улучшения по каждой из функций. И когда пользователь формулирует запрос, система просто выдает под него тысячи подходящих концепций.

Другой тип похожих систем — это семейство инструментов на основе ТРИЗ. Но в них велика роль человека, и решения сильно зависят от знаний и хода мыслей конкретного пользователя. Слишком субъективно.

— Увидела на сайте, что в перспективе Awtor сможет решать социально-экономические задачи. Что под этим подразумевается?

— Да, это разумный следующий этап. Физику сделали, химию сделали, дальше очередь других наук, в первую очередь экономики. Очень важно научить систему оперировать такими понятиями, как эргономичность, удобство. Правда, придется создать стандарты для этих терминов. Что такое красота? У каждого своя. Что такое эргономичность? Для каждого своя. Поэтому нужно либо определить универсальные эталоны, не зависящие от конкретного человека, либо сформировать профиль конкретного пользователя и выдать результат в соответствии с его представлениями о том, что такое хорошо и что такое плохо.

Это космически огромная задача. Пока думаем, как к ней подступиться. Но в то же время без этого последнего модуля весь проект теряет смысл и остается нишевой утилитой для инженеров.

— Есть ли планы создать мобильную версию системы? Открыть API? Связать ее с голосовыми помощниками, с той же «Алисой»?

— Мобильная версия Awtor — это разумный шаг развития системы, как и интеграция голосового ввода. Тогда система могла бы, например, задавать уточняющие вопросы человеку. Но тут важен переход на другой целевой сегмент, с инженеров — на пользовательский рынок. Мы уже об этом думали. Но это огромные мощности в контексте, на первый план выходит анализ конкретного человека.

Хочется, чтобы Awtor был доступен и полезен всем вплоть до ребенка. Мы, скорее всего, зайдем именно со стороны детей.

У нас в двух пермских школах установлена система, и дети с удовольствием задают ей вопросы.

У нас есть гипотеза, что взаимодействие с системой можно значительно улучшить — убрать ряд итераций, если понять, как ребенок самообучается работе с программой. У нас даже есть конкурс «Юный изобретатель»: спроси у машины, она ответит, а ты сделай интерпретацию.

— Наверное, продать такую сложную систему, объяснить, зачем и почему она нужна, тоже космическая задача?

— Это новый продукт, и к нему надо приучать. Рыночную нишу и целевую группу приходится формировать с нуля, потребители еще не осознали свои потребности. Поэтому проходит только один логический фокус. Приезжаешь на завод, спрашиваешь: «Какая у вас проблема?» — «У меня проблема с затуханием волны в кристалле». — «Замечательно. А есть главный по тарелочкам, инженер, с которым мы быстро сейчас сядем и посмотрим?»

И когда руководитель видит ответы, а главный инженер подтверждает, что последовательность ответов именно такая, по какой они шли последние 15 лет, и что сейчас они здесь, а впереди еще 12 вариантов… Все, этот клиент наш.

— А с какой целью вы участвуете в образовательном интенсиве «Архипелаг 20.35»?

— Надеемся пройти отбор, поскольку нам нужна помощь. С точки зрения науки у нас все хорошо: еще в 2018 году на конференции в МГУ мы обратились к физикам, попросили сломать нашу машину, поймать ее на ошибочных ответах либо на пропусках важных вариантов. Никому не удалось это сделать.

Но вот со стороны продаж — провал. Пермяки все о нас знают, но выйти за границы региона не получается. Показывали свое решение инвестиционным фондам, но понимания не нашли. Возможно, мы как-то не так о себе рассказываем. Хочется научиться, как правильно вписать свою идею в рыночные реалии.

— Вот интересно, почему вы занялись такой специфичной темой, как эволюция изобретений? Есть же вещи более популярные и наглядные, какое-нибудь компьютерное зрение?

— Я как человек, который 20 лет изучает и разрабатывает искусственные нейронные сети, скажу так. Хватит детского сада, XXI век на дворе. Ну что это за достижение: нейронная сеть нарисовала картинку или портрет? Каждый пиксель элементарно описуем. Это не искусственный интеллект, а просто перебиратор какой-то. Что туда вбили, тому нейросеть и научилась. Опять субъективщина, опять человеческое решение.

Сходите в другую задачку. Хотя бы в задачу классификации. Возьмите предметную область, в которой описано только 10%. Ладно, хорошо, 50%. Не получается? Так, может быть, силу и упорство будем тратить на выявление нужных градаций, характеристик, создание классификаторов?

Классификация противоречий — вот достойная тема, за которую никто не берется. Все про них говорят, про технологические барьеры НТИ. Но реально описать, разработать матаппарат их преодоления — тут прогресс отсутствует.

Нейросеть на патентах: интервью с разработчиками Awtor

Публикации

Информация