欢迎来到 - 七方八面来风网,您是本站的第   273842    位访客。         注册|登陆
枣阳新闻 荆楚新闻 国内新闻
返回首页
当前位置: 首页 > 社会新闻 > 七方新闻 >

玩躲猫猫游戏 AI学会攻防术

时间:2020-04-16 23:11来源:网络整理 作者:七方八面来风网 点击:
东方网-东方新闻-社会新闻-玩躲猫猫游戏 AI学会攻防术-

    尽管机器学习在诸如围棋和Dota 2等复杂游戏中取得了显著进步,但在这些范畴掌管的本事并不一定能推广到的确场景中实际应用。越来越多的商讨人员正在探求建立一种机器智能,使其动作、学习和进化更像人类。

    总部位于旧金山的OpenAI公司近日发表的一篇新论文提出,在儿童的“躲猫猫”游戏中熬炼模型,并在数以千万计的竞赛中使它们相互对抗,可导致模型自动发展出雷同人类的动作,从而提高智力并改善后续行动的性能。

    为什么选取躲猫猫?

    该论文的第一作者、OpenAI商讨员博文·贝克认为,躲猫猫被选为一个有趣的起点,主假若因为其端正很纯正。所有游戏中的代理(Agent,也称智能体,指能自主活动的软件或硬件实体)都被模拟为球形方向,可施行3种模范的操作:导航、抓住并移动物体、锁定方向,且只能由该代理的队友解锁。

    商讨人员在模拟的、物理接地的环境中安设了1—3个“躲藏者”和1—3个“寻觅者”,房间的边界是静态墙。环境中还包括不同尺寸的可移动箱子和可移动坡道。

    商讨人员使用强化学习来熬炼游戏代理,并苦守纯正的躲猫猫端正:阴事者成功躲过寻觅者的追逐,或是寻觅者成功找到躲藏者。

    AI如何玩躲猫猫?

    在始末数亿次的游戏后,AI代理经由了几个阶段的策略发展过程。

    在初始阶段,躲藏者(蓝色)和寻觅者(红色)通过在空间中移动而不把握任何物体,制定了优秀粗糙的遁藏和追逐策略。

    在经由2500万个回合后,游戏变得更加复杂。躲藏者学会了移动和锁定在环境中的箱子和路障,以在自己规模建立堡垒,这样寻觅者就悠久看不到它们了。不仅如此,他们还制定了转圜战略,例如相互传递物体,以加快制造堡垒的历程。

    然而,在游戏进行了7500万回合之后,寻觅者发现了一个反策略。他们学会了在躲藏者的要塞旁边移动一个坡道,并用它来爬过墙壁。

    手脚回应,躲藏者学会了将坡道移入他们的房间,因此寻觅者无法用它来超出墙壁。

    随着环境变得越来越复杂,躲藏者学会了使用细长箱子制造更远大的“堡垒”。虽然OpenAI认为这将是最终的策略,但在游戏进行到3.8亿回合时,寻觅者再次成功报复,找出一种技巧来跳到一个盒子上并诈欺动力在它上面“冲浪”,超出墙壁进入堡垒。

    在最后阶段,躲藏者学会在制造堡垒之前锁定所有箱子,以防止“箱子冲浪”。

    商讨人员将这些不同策略的演变称为“来自多智能体自动课程的弁急本事进展”。“自动课程”这一术语是今年由DeepMind建筑的,适用于多个代理逐渐建筑新做事以在特定环境中相互寻事。OpenAI的商讨人员认为,这个过程在自然选取方面具有近似之处。

    这项商讨为啥很严重?

    鉴于躲猫猫相对纯正的目标,通过竞争性自我游戏熬炼的多个代理学会了使用工具,并采取人类相关本事来获胜。OpenAI认为,这为未来的智能代理开辟和铺排提供了一个有前景的商讨对象。OpenAI正在开源其代码和环境,以荧惑在该范畴进一步商讨。

    OpenAI的最终目标是构建能够在一个通用编制中施行多项做事的人工通用智能(AGI)。虽然或许会有不同的目标,但OpenAI正在大举投资由大周围筹划才气完成的强化学习商讨。OpenAI最近与微软签署了一份价值10亿美元的为期10年的筹划合同。

    躲猫猫游戏商讨也激发了OpenAI,因为随着环境复杂性的增添,游戏中的代理贯串地通过新策略自我好看新的寻事。贝克表露:“如果扩展像这样的流程,并将其放入更复杂的环境中,那么你或许会得到充满复杂的代理,以便为我们处置实际做事。”

    寻事在哪里?

    游戏代理有时会阐发出令人吃惊的动作。例如,躲藏者试图绝对逃离游戏区域,直到商讨人员对此施加惩罚。

    其他寻事或许归因于模拟环境设计中的物理空位。例如,躲藏者体认到,如果他们在拐角处向墙壁推动斜坡,斜坡将由于某种开头穿过墙壁然后消失。这种“作弊”阐明了算法的安定性如何在机器学习中发挥关键作用。商讨人员说:“在它发生之前,你悠久不会知道。这类编制总是存在空位。我们所做的根蒂上是寓目,以便我们可以看到这种奥秘的事情发生,然后试着修复物理空位。”

    (科技日报纽约9月17日电 冯卫东)

    [ 责编:张梦凡 ]

(责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
推荐内容
二维码