company_banner

SpaceFusion: структурирование неструктурированного скрытого пространства для диалогового ИИ

Автор оригинала: Microsoft
  • Перевод
Палитра позволяет художникам упорядочивать и смешивать краски разных цветов, создавая картины на холстах перед ними. Существование аналогичного инструмента, который мог бы позволить ИИ совместно учиться из различных источников данных, таких как разговоры, рассказы, изображения и знания, могло бы открыть двери для исследователей и ученых для разработки более всеобъемлющих систем ИИ.


Палитра позволяет художнику размазывать и смешивать краски разных цветов. SpaceFusion стремится помочь AI-ученым делать похожие вещи для разных моделей, обученных на разных наборах данных.

Для современных моделей глубокого обучения наборы данных обычно представлены векторами в разных скрытых пространствах с использованием разных нейронных сетей. В статье "Совместная оптимизация разнообразия и релевантности в генерации нейронных реакций," мои соавторы и я представляем SpaceFusion, парадигму обучения, способную «смешивать» различные скрытые пространства — как краски на палитре, — чтобы ИИ мог использовать шаблоны и знания, заложенные в каждом из них. Реализация этой работы доступна на GitHub.

Захват цвета человеческого разговора


В качестве первой попытки мы применили эту технику к нейронному диалоговому ИИ. В нашей установке ожидается, что нейронная модель будет генерировать релевантные и интересные ответы с учетом истории разговоров или контекста. Несмотря на то, что были достигнуты многообещающие успехи в моделях нейронного общения, эти модели, как правило, стараются не рисковать, воспроизводя общие и скучные ответы. Были разработаны подходы для диверсификации этих ответов и лучшего отражения цвета человеческого разговора, но все равно часто возникает компромисс с уменьшением релевантности..


Рисунок 1: Подобно палитре, которая позволяет легко комбинировать краски, SpaceFusion выравнивает или смешивает скрытые пространства, полученные из модели seq2seq (S2S, красные точки) и autoencoder (AE, синие точки), чтобы совместно использовать две модели более эффективно.

SpaceFusion решает эту проблему путем связывания скрытых пространств, извлеченных из двух моделей (рисунок 1):

  • модель sequence-to-sequence (S2S), которая направлена ​​на получение релевантных ответов, но может иметь мало различий; а также
  • модель autoencoder (AE), которая способна представлять разные ответы, но не отражает их связь с беседой.

Совместно обученная модель может использовать сильные стороны обеих моделей и упорядочивать точки данных более структурированным образом.


Рисунок 2: Выше показан один контекст и его многочисленные ответы в скрытом пространстве, вызванные SpaceFusion. Расстояние и направление от прогнозируемого вектора ответа с учетом контекста примерно соответствуют значимости и разнообразию соответственно.

Например, как показано на рисунке 2, с учетом контекста — в данном случае «Кто-нибудь хочет начать эту игру?» — положительные ответы «Я хотел бы сыграть в нее» и «Да, я играю» расположены вдоль одного направления. Негативные — «Я не интересуюсь игрой» и «Нет, я не интересуюсь» — нанесены на карту в другом направлении. Разнообразие в ответах достигается за счет изучения скрытого пространства в разных направлениях. Кроме того, расстояние в скрытом пространстве соответствует актуальности. Ответы, находящиеся дальше от контекста — «Да, я играю» и «Нет, я не играю» — обычно носят общий характер, в то время как те, кто ближе, больше соответствуют конкретному контексту: «Мне не интересна игра» и « Когда вы собираетесь играть?"

SpaceFusion разделяет критерии релевантности и разнообразия и представляет их в двух независимых измерениях — направлении и расстоянии — облегчая совместную оптимизацию обоих. Наши эмпирические эксперименты и оценки на людях показали, что SpaceFusion работает лучше по этим двум критериям по сравнению с конкурентными бейзлайнами.

Обучение общего скрытого пространства


Итак, как именно SpaceFusion сопоставляет разные скрытые пространства?

Идея довольно интуитивна: для каждой пары точек из двух разных скрытых пространств мы сначала минимизируем их расстояние в общем скрытом пространстве, а затем поддерживаем плавный переход между ними. Это делается путем добавления двух новых regularization term — расстояния (distance term) и ровности (smoothness term) — к целевой функции.

Взяв в качестве примера разговор, distance term измеряет Евклидово расстояние между точкой из скрытого пространства S2S, которая отображается исходя из контекста и представляет прогнозируемый ответ, и точками из скрытого пространства AE, которые соответствуют его целевым ответам. Минимизация такого расстояния побуждает модель S2S отображать контекст в качестве точки, близкой и окруженной ее ответами в общем скрытом пространстве, как показано на рисунке 2.

Smoothness term измеряет вероятность генерации целевого ответа из случайной интерполяции между точкой, отображенной из контекста, и точкой, отображенной из ответа. Максимизируя эту вероятность, мы поощряем плавный переход значения сгенерированных ответов по мере удаления от контекста. Это позволяет нам исследовать окрестность точки прогнозирования, сделанной S2S, и, таким образом, генерировать разнообразные ответы, которые имеют отношение к контексту.

С этими двумя новыми регуляризациями, добавленными в целевую функцию, мы накладываем ограничения расстояния и ровности на обучение скрытого пространства, поэтому обучение будет не только фокусироваться на производительности в каждом скрытом пространстве, но также будет пытаться выровнять их вместе, добавляя эти желаемые структуры. Наша работа была сосредоточена на диалоговых моделях, но мы ожидаем, что SpaceFusion может выровнять скрытые пространства, обученные другими моделями на разных наборах данных. Это позволит соединить различные способности и области знаний, усвоенные каждой конкретной системой ИИ, и является первым шагом к более всеобъемлющему ИИ.


Читайте также: 7 бесплатных курсов для разработчиков
Microsoft
393,36
Microsoft — мировой лидер в области ПО и ИТ-услуг
Поделиться публикацией

Комментарии 0

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое