加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 产品 > 正文

AlphaWar兵棋推演:虚拟硝烟中的AI指挥艺术与决胜智慧

发布时间:2020-03-30 17:49:27 所属栏目:产品 来源:安防知识网|0
导读:一、深度学习和知识图谱的缺陷 人工智能经历了几番沉浮,迎来了第三次发展浪潮,当前取得的进展突出体现在:以知识图谱为代表的知识工程和以深度学习为代表的机器学习等相关领域的发展。 1、深度学习 深度学习作为一种结合了统计机器学习与人工神经网络的

  兵马未动,兵棋先行。利用战争模拟系统来推演战争,就是兵棋推演。从军事游戏到沙盘模拟,再到错综复杂的计算机程序,兵棋推演在模拟真实战争、辅助指挥决策方面的作用日益突出,已经发展成为现代战争的关键环节。

  据悉,美军在伊拉克战争中的作战经过与战前的兵棋推演结果高度相似;击毙本·拉登的过程也已在五角大楼的兵棋推演系统上演习过无数遍;以日本为蓝军进行了数百次兵棋推演,也为美军扭转珍珠港事件后的不利局面奠定了基础。

  随着现代战争的规模逐渐扩大,陆、海、空、天、电磁等不同战场相互混合交织,各军兵种协同配合日益复杂,兵棋推演的重要性也越来越受到重视。美国陆军指挥总参学院、Lemay中心、美国国防大学、美国研究生院、美国海军军事学院的章程中都或多或少明确了兵棋推演的这一用途。

  另一方面,计算机技术的兴起,将传统沙盘上的兵棋推演进一步转化为严谨的二进制计算并在屏幕上直观呈现。结合科学技术的大型兵棋推演系统将在信息化战争模拟对抗中发挥着更加重要的作用。

  四、 AlphaWar :一个同时具备常识、指挥艺术和实时智能的兵棋推演/作战指挥平台)

  作战指挥是一个集装备体系、作战环境、指挥艺术和智能研判等多学科多任务的综合策略型活动,兵棋推演则是对战争全过程进行仿真、模拟与推演,是一次微型版的作战指挥过程。

  许多大型即时策略游戏也具备类似的特性。以暴雪的《星际争霸II》为例,其复杂度介于兵棋推演、实际战场作战指挥中间,具体比较如下:

  虽然复杂度有所差异,但兵棋推演、实际战场、星际争霸II三者的核心本质都是即时策略推演类型,都是先验知识和即时智能的综合应用。 渊亭科技多年来一直致力于知识图谱和自学习体系平台的研究和应用,特别是近几年在国防、金融、安全等领域的多个大型实战项目中抽象出多个通用认知智能引擎和组件。

  战略推演平台是渊亭科技关于常识、行业先验图谱、态势感知、即时研判等综合智能应用自动化的探索思考,应用场景包括国防作战指挥、反恐怖、经济犯罪侦查、投资交易等。

  我们以复杂度中等的《星际争霸II》作为研究目标,利用知识图谱和强化学习等技术,设计一个可以设计击败对手策略AI的自动化平台——AlphaWar。

  今天,我们一起来揭开这个渊亭科技神秘在研产品的面纱。

  AlphaWar以行业先验图谱为基础、策略编辑器作为主体、多智能体策略网络为核心思想,包含以下核心组件:

  1、决策控制:—包含一些跨领域通用的决策控制组件,例如最优路径搜索、目标识别等。

  2、战术体系:—可以是人类经验验证过的战术(类似指挥艺术),也可以是AI训练得到的模式(例如世界顶尖星际玩家的对战训练结果)。战术体系是一个完整的操作序列,涉及游戏中所有的单位及其行为,战术体系对外只暴露战术核心参数。

  3、智能体:在本系统中,智能体的定义是:某个单位(可以是作战单位、建筑等)在某个场景(也可以是所有场景)下面向特定目标的最优解。例如,星灵机械哨兵的力场时机和位置。这个是可以大量应用强化学习训练的地方。

  4、先验图谱:先验图谱是站在巨人肩膀上的关键,由于目前深度学习相关技术的局限性,完全零先验比较天方夜谭。对于《星际争霸II》或军事实战指挥来说,先验图谱包括战场环境(基本信息)、敌我双方装备体系(不完备信息)、战术体系等。

  当然,除了这些核心组件还有各种态势感知、作战控制(单兵、群体协作等)等组件,所有的组件都可以以知识表示、专家系统、AI模型的方式生成。 组件都是手脚,需要一个大脑来指挥控制。

  在AlphaWar中,指标控制中心有两种实现,第一种是策略编辑器,例如我方(虫族)探测到对方(星灵)裸开双矿,对于态势感知来说可以得出一个可快速压制的策略,这个时候只需要一个态势分类器和一个快速压制的智能体就足以完成整个指挥控制过程;第二种则比较复杂,也是实际战争中的常规情况,态势瞬息万变,这个时候需要一个基于LSTM的深度指控网络。(这个是个很大的话题,后续有机会单独展开)

1.png

  以上是AlphaWar的基本组成,接下来我们用例子来说明它是怎么工作,一个一行代码都不用写实现一个击败《星际争霸II》全种族最难级别的战术机器人!

  五、 案例演示:光影沐浴者

  光影沐浴者,俗称速隐刀战术。利用星际争霸II的反隐单位或建筑通常需要前置的科技建筑才能生产,星灵在早期以最快速度(并欺骗对手)出黑暗圣堂武士,经常可以起到一举定输赢的效果。

  以下是光影沐浴者在系统中的搭建:

2.jpg

  如图所示,大多组件都是策略性的实现,可以理解为指挥控制中的常规开局操作。跟知识图谱、深度学习比较相关,需要训练模型或知识推理的四个组件:

  1、 偷水晶+机械台:—偷水晶和机械台的主要目的是加快进攻的时间,进攻越晚对手出反隐装置的可能性越高。水晶和机械台的需要用replay来训练最佳隐蔽位置,躲过对方农民探路路线以及虫族房子可能路线等。

  2、 优先解除反隐:—这是一个典型的知识图谱+AI的智能体。首先,要从知识图谱中查询出对方种族反隐的实现装置,并采用对应的反制战术。这个过程中有大量的可能性,需要用AI得到一个最优解。例如,对方是人族,在这个时候一般已经有侦测扫描了,如果所有黑暗圣堂武士一起空投有可能被一波吃掉。需要分批(一批1个)消耗对方的扫描次数,等对方扫描次数(知识图谱获取)用完了再大规模折跃黑暗圣堂武士,这个训练只需几十个样本就可以完美实现。

  3、 折跃部队:—这是一个态势感知网络和兵种相克图谱相融合的策略。例如对方(虫族)开始变眼虫反隐,这个时候就要折跃追猎者来清除障碍。

  4、 暗堂操作:—微操是胜败的关键要素,著名的AlphaStar中有大量作战单位微操智能体,同等条件下可以以最小损失歼灭对方主力部队。 (关于如何训练战术和智能体,后续有机会再单独深入讲解)

3.jpg

  结果直接上图:在对方(蓝方)经济和部队都有优势的情况下击垮它!

  未来的战争胜利将取决于认知速度,即让机器正确理解作战态势并做出决策。而认知速度的快慢,极大程度上取决于智能技术的运用。因此,智能体辅助是兵棋系统升级换代的关键。


(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!