В моих постах о вычислительных военных рассуждениях (тактический искусственный интеллект) мы рассмотрели алгоритмы для обнаружения закрепленных и не закрепленных флангов, внутренних линий и ограниченных путей атаки и отступления. В этом посте я представляю свое докторское исследование, которое использует эти и другие алгоритмы при создании неконтролируемой программы машинного обучения, способной классифицировать текущую тактическую ситуацию (поле боя) в контексте ранее наблюдавшихся сражений. Другими словами, он учится и запоминает.
Машинное обучение
Машинное обучение - это термин в области компьютерных наук для обучения программному обеспечению (в информатике машина часто означает "программное обеспечение" или "программа" со времен машины Тюринга это была не физическая машина, а абстрактный мысленный эксперимент).
Существует две формы машинного обучения: контролируемое и неконтролируемое. Контролируемое машинное обучение требует, чтобы человек "обучал" программное обеспечение. Примером контролируемого машинного обучения является система рекомендаций Netflix. Каждый раз, когда вы смотрите шоу на Netflix, вы учите их программное обеспечение тому, что вам нравится. Ну, теоретически. Рекомендации Netflix часто до смешного ужасны.
Неконтролируемое машинное обучение - это совершенно другое зверь. Без вмешательства человека неконтролируемая программа машинного обучения пытается разобраться в серии "объектов", которые ей представлены. Для программы TIGER / MATE этими объектами являются сражения, и программа классифицирует их в похожие кластеры. Другими словами, каждый раз, когда TIGER / MATE "видит" новую тактическую ситуацию, он спрашивает себя, похоже ли это (и насколько похоже) на то, что он видел раньше, или это что-то совершенно новое?
Hidden text
Я использую удобные термины, такие как "компьютер пытается понять" или "компьютер видит" или "компьютер думает", но я не утверждаю, что компьютеры разумны или что они видят или думают. Это всего лишь риторические костыли, которые я использую для более простого восприятия текста.
Итак, снимок битвы (местность, высота и позиции подразделений в определенное время) является "объектом", и этот объект описывается рядом "атрибутов". В случае TIGER / MATE атрибутами, описывающими боевой объект, являются:
Значение закрепленного / не закрепленного фланга
REDFOR (Красные силы) Стратегические точки
BLUEFOR (Синие силы) Стратегические точки
Взвешенное соотношение сил
Наклон атаки
Алгоритмы вычисления показателей для первых четырех атрибутов обсуждались в трех предыдущих сообщениях в блоге, упомянутых выше. Алгоритмы вычисления взвешенного соотношения сил и показателей наклона атаки просты: взвешенное соотношение сил - это соотношение силы красного и силы синего, взвешенное по типу подразделения, а наклон атаки - это просто склон (в гору или под гору), по которому силы атакуют.
TIGER / MATE создает иерархическое дерево снимков поля боя. Это дерево представляет взаимосвязь и сходство различных снимков поля боя. Например, две очень похожие ситуации на поле боя появятся в одном узле, в то время как две очень разные ситуации на поле боя появятся в разных узлах. Это будет легче проследить с помощью нескольких снимков экрана. К сожалению, сначала мы должны ввести функцию полезности категории.
Итак, сначала позвольте мне извиниться за всю математику. Вам не обязательно понимать, как работает неконтролируемый процесс машинного обучения TIGER / MATE, но если я этого не покажу, то будет не очень хорошо:
Функция полезности категории (или CU, для краткости) - это уравнение, которое определяет, насколько похожи или непохожи объекты (поля сражений). Это функция CU:
"Острота" - это понятие минимального значения, которое разделяет два "случая" (в нашем случае, сражения). Оно должно иметь значение 1.0, иначе произойдут очень плохие вещи.
Итак, давайте резюмируем, что у нас есть:
Серия алгоритмов, которые анализируют поле боя и возвращают значения, представляющие различные условия, которые, по мнению SME, являются значительными (фланги, маршруты атаки и отступления, силы подразделений и т. д. и т. п.).
Функция полезности категории (CU), которая использует результаты этих алгоритмов для определения того, насколько похожи проанализированные поля сражений.
Теперь нам просто нужно собрать все это вместе. Поле боя (тактическая ситуация) анализируется TIGER / MATE. Это "подается" в неконтролируемую функцию машинного обучения, и при использовании функции полезности категории происходит одно из четырех событий:
Все дочерние элементы родительского узла оцениваются с использованием функции CU, и объект (тактическая ситуация) добавляется к существующему узлу с лучшим результатом.
Объект помещается в новый узел сам по себе.
Два узла с наивысшей оценкой объединяются в один узел, и к нему добавляется новый объект.
Узел разбивается на несколько узлов, к одному из которых присоединяется новый объект.
Эти варианты строят иерархическую древовидную структуру, например, когда TIGER скормили 20 исторических тактических ситуаций:
Кассеринский переход, 14 февраля 1943 г.
Кассерин переход 19 февраля 1943 г.
Озеро Тразимена, 217 г. до н.э.
Шайло День 2
Шайло День 1, 09:00
Шайло День 1, 12:00
Антиетам 06:00 часов
Антиетам 1630 часов
Фредериксбург, 10 декабря.
Фредериксбург, 13 декабря.
Чанселлорсвилл 1 мая
Чанселлорсвилл 2 мая
Геттисберг, день 1
Геттисберг, День 2
Геттисберг, День 3
Синай, 5 июня
Ватерлоо, 10:00 часов
Ватерлоо, 16:00 часов
Ватерлоо, 19:30 часов
В дополнение к этим 20 историческим тактическим ситуациям были созданы пять гипотетических ситуаций, обозначенных как A-E. Это результирующее дерево, созданное TIGER:
Если мы посмотрим на дерево, построенное TIGER, мы увидим, что оно поместило день Шайло 1 09:00 и день Шайло 1 12:00 вместе в кластере C35. Действительно, когда мы осматриваем дерево, мы видим, что TIGER проделал замечательную работу по анализу тактических ситуаций и расстановке одинаковых, но мне легко говорить, я написал эту программу, поэтому мое мнение не в счет. Итак, мы опросили 23 SME, в том числе:
7 Профессиональных дизайнеров военных игр
14 офицеров армии США на действительной службе и в отставке, в том числе:
Полковник (в отставке) пехоты Морской пехоты США 5 боевых туров, 3 консультативных тура
Майор США. (SE Core) Руководитель проекта, TCM-Виртуальное обучение
Офицер TRADOC (Командование по обучению и доктрине армии США)
Вест-Пойнт; Центр моделирования боевых действий
Инструктор, факультет тактики командования и колледжа Генерального штаба
Аспирант RMIT
Инструктор по тактике в Кингстоне (Канада)
И в слепом опросе их спросили не о том, что сделал TIGER, а о том, что они будут делать.
Итак, 91,3% SME согласились с тем, что гипотетическая тактическая ситуация больше похожа на перевал Кассерин, чем на 1-ый день Геттисберга. Без ведома SME TIGER уже классифицировал эти три тактические ситуации следующим образом:
В заключение: за последние четыре поста в блоге о вычислительных военных рассуждениях мы продемонстрировали:
Алгоритмы анализа поля боя (тактической ситуации).
Алгоритмы для реализации наступательных маневров.
Неконтролируемую систему машинного обучения для классификации тактических ситуаций и объединения подобных ситуаций по категориям. Кроме того, эта система масштабируема, и по мере того, как она сталкивается с новыми тактическими ситуациями, она будет продолжать этот процесс, который позволяет ИИ планировать маневры на основе ранее наблюденных и аннотированных ситуаций.
Это ИИ, который будет использоваться в Генеральном штабе. Это уникально и революционно. Ни в одном компьютерном военном симуляторе – ни в коммерчески доступном, ни в любом военном симуляторе, используемом любой из армий мира, – не используется ИИ такой глубины.
Как всегда, пожалуйста, не стесняйтесь обращаться ко мне напрямую с вопросами или комментариями. Вы можете использовать нашу онлайн-форму электронной почты здесь или написать мне напрямую на Ezra@RiverviewAI.com .
От т.н. переводчика
Если есть желание предметнее обсудить тему статьи или обложить меня последними словами (по какой бы то ни было причине), то буду рад видеть вас тут: каналья