发布询价单
您的位置:首页 > 资讯 > 企业动态 > 正文

麻省理工学院开发一种有远见的机器学习方法

2022-12-02 09:42 性质:原创 作者:南山 来源:AGV网
免责声明:中国叉车安全网(www.forkliftsafety.com.cn)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
该方法可以教一组合作或竞争的人工智能代理找到最佳的长期解决方案。概括:一项新技术使人工智能代理在考虑它们的行为如何影响其他人工智能代理的行为时,能够考虑到更远的未来,以完成一项任务。...

该方法可以教一组合作或竞争的人工智能代理找到最佳的长期解决方案。

概括:

一项新技术使人工智能代理在考虑它们的行为如何影响其他人工智能代理的行为时,能够考虑到更远的未来,以完成一项任务。这种方法提高了合作或竞争性人工智能代理的长期性能。

想象一下两支球队在足球场上的对决。球员们可以通过合作来实现一个目标,并与其他有利益冲突的球员竞争。这就是游戏的运作方式。创建能够像人类一样有效学习竞争和合作的人工智能代理仍然是一个棘手的问题。一个关键的挑战是使人工智能代理能够在其他代理同时学习时预测其未来行为。

由于这个问题的复杂性,目前的方法往往是近视的;代理人只能猜测他们的队友或竞争对手的未来几步棋,这导致了长期的不良表现。

来自美国麻省理工学院、麻省理工学院-IBM沃森人工智能实验室和其他地方的研究人员开发了一种新方法,使人工智能代理具有远见卓识。他们的机器学习框架使合作或竞争的人工智能代理能够考虑其他代理在时间接近无穷大时将会做什么,而不仅仅是在接下来的几个步骤中。然后,代理人相应地调整他们的行为,以影响其他代理人的未来行为,并达成一个最佳的、长期的解决方案。

这个框架可以被一群自主的无人机用来在茂密的森林中寻找迷路的徒步者,或者被自驾车使用,通过预测在繁忙的高速公路上行驶的其他车辆的未来行动来努力保证乘客的安全。

“当人工智能代理进行合作或竞争时,最重要的是他们的行为在未来的某个时间点上会聚。一路上有很多短暂的行为,从长远来看并不十分重要。”麻省理工学院信息与决策系统实验室(LIDS)的研究生、一篇描述该框架的论文的主要作者Dong-Ki Kim说:“达到这种收敛的行为是我们真正关心的,我们现在有一种数学方法来实现这一点。”

高级作者是Richard C. Maclaurin航空学和航天学教授Jonathan P. How,他是麻省理工学院-IBM Watson人工智能实验室的成员。共同作者包括麻省理工学院-IBM沃森人工智能实验室、IBM研究院、米拉-魁北克人工智能研究所和牛津大学的其他人。该研究将在神经信息处理系统会议上发表。

更多的代理,更多的问题

研究人员专注于一个被称为多代理强化学习的问题。强化学习是机器学习的一种形式,其中人工智能代理通过试验和错误进行学习。研究人员对帮助其实现目标的 "良好 "行为给予代理奖励。代理人调整其行为以最大化该奖励,直到它最终成为一项任务的专家。

但当许多合作或竞争的代理同时学习时,事情变得越来越复杂。随着代理人考虑到他们同伴的更多未来步骤,以及他们自己的行为如何影响其他人,这个问题很快就需要太多的计算能力来有效解决。这就是为什么其他方法只关注短期的原因。

“人工智能真的想考虑游戏的结束,但他们不知道游戏何时结束。他们需要思考如何不断地将自己的行为调整到无限大,以便在未来某个遥远的时间里获胜。我们的论文本质上提出了一个新的目标,使人工智能能够考虑到无限大的问题。”Kim说。

但是,由于不可能把无限塞进算法中,研究人员设计了他们的系统,使代理人专注于他们的行为将与其他代理人的行为趋同的未来点,即所谓的平衡点。平衡点决定了代理人的长期表现,而且在多代理人的情况下可能存在多个平衡点。因此,一个有效的代理人积极影响其他代理人的未来行为,使他们从代理人的角度达到一个理想的均衡点。如果所有的代理人都相互影响,他们就会收敛到一个一般的概念,研究人员称之为 "主动均衡"。

他们开发的机器学习框架被称为FURTHER(代表FUlly Reinforcing acTive influence with averagE Reward),使代理人能够学习如何在与其他代理人互动时调整自己的行为,以实现这种主动平衡。

FURTHER使用两个机器学习模块来实现这一目标。第一个模块是推理模块,它使代理人能够仅根据其他代理人的先前行动来猜测他们的未来行为和他们使用的学习算法。

这些信息被送入强化学习模块,代理人利用这些信息来调整自己的行为,并以最大化回报的方式来影响其他代理人。

“挑战是对无限的思考。我们不得不使用许多不同的数学工具来实现这一点,并做出一些假设,使其在实践中发挥作用。”Kim说。

长远的赢家

他们在几个不同的场景中对他们的方法与其他多代理强化学习框架进行了测试,包括一对机器人的相扑式战斗和两个25个代理团队的对战。在这两种情况下,使用FURTHER的人工智能代理更经常地赢得比赛。

Kim解释说,由于他们的方法是分散的,这意味着代理人独立学习赢得游戏,它也比其他需要中央计算机控制代理人的方法更具可扩展性。

研究人员用游戏来测试他们的方法,但FURTHER可以用来解决任何类型的多代理问题。例如,在许多相互作用的权利人的行为和利益随时间变化的情况下,经济学家可以应用它来制定合理的政策。

经济学是Kim对研究的一个应用特别感兴趣。他还想更深入地研究主动平衡的概念,并继续加强FURTHER框架。

这项研究得到了美国麻省理工学院-IBM沃森人工智能实验室的部分资助。

网友评论
文明上网,理性发言,拒绝广告

相关资讯

  • 瑞典Troax聚焦叉车安全--构筑工业物流“智慧防护墙”
    近年来,随着物流自动化与仓储密集度不断上升,叉车与行人交叉作业场景愈发复杂,事故风险同步增高。在这一背景下,瑞典Troax Group AB推出了一系列针对此类问题的主动安全(Active Safety)系...

    2025-06-10 10:10

  • ELOKON推出ELOshieldAI双重安全系统提升叉车与行人防护水平
    2025年6月3日,德国ELOKON公司在亚特兰大正式发布其最新研发的ELOshieldAI安全系统。该系统结合了超宽带(UWB)近距离检测技术与人工智能(AI)驱动的无标签视觉识别技术,旨在为工业环境中的叉车...

    2025-06-04 10:15

  • Sonair 推出全球首款用于自主机器人的安全 3D 超声波传感器-ADAR
    “ADAR”是一款屡获殊荣的 3D 超声波传感器,有望挑战 LiDAR 在机器人感知领域的主导地位,该传感器将于 5 月 12 日至 15 日在密歇根州底特律举行的 ...

    2025-05-12 14:33

  • Litum推出叉车安全系统-PathAware
    2025年5月5日,美国实时定位系统(RTLS)技术企业Litum公司宣布推出其最新研发的叉车安全解决方案——PathAware系统。该系统采用先进的人工智能增强传感器和超宽...

    2025-05-12 14:32

  • ZAPI集团在bauma 2025展示非公路车辆电动化创新成果
    全球领先的车辆电动化公司ZAPI GROUP(萨牌集团)宣布,将于2025年4月7日至13日在德国慕尼黑举办的bauma 2025展会上,展示其最新的非公路车辆电动化产品和技术组合。作为全球最大的工程机械展会...

    2025-04-07 10:00

  • 丰田领投1500万美元以色列工业无线充电初创公司 CaPow
    在无线充电技术领域,一项突破性进展正在加速走向商业化。3月5日,以色列初创公司CaPow宣布完成了一轮总额达1500万美元的融资,本轮融资由日本丰田汽车公司(Toyota Motor Corporation)领投,以...

    2025-03-07 09:42

  • Zebra收购 Photoneo,扩大其 3D 机器视觉解决方案组合
    2024 年 12 月 30 日 –Zebra Technologies(NASDAQ: ZBRA) 是美国一家领先的数字解决方案提供商,可帮助企业智能地连接数据、资产和人员,该公司今天宣布打算收购领先的 3D 机器视觉解...

    2025-02-26 09:25

  • 机器人安保初创公司Undaunted获得初始种子轮融资
    近日,美国的Undaunted公司宣布在获得由Atlanta Ventures领投的初始种子轮融资后正式成立。该公司致力于通过整合最先进的机器人技术和自动化手段,提供主动、实时的安保解决方案。Undaunted的创始...

    2025-01-23 09:07

  • 博世利用软件和人工智能打造智能产品
    CES 2025:博世解决方案存在于日常生活的方方面面。软件和人工智能 (AI) 已经在塑造我们的现状。但它们也将对我们的未来起到决定性作用。博世很快就认识到智能软件和服务提供的机会,并在早期阶...

    2025-01-15 09:24

  • 丰田叉车SAS系统问世25周年
    作为全球领先的汽车制造商之一,日本丰田(Toyota)在叉车和物流设备领域同样具有重要地位。近年来,丰田不断推动叉车技术的创新,特别是其独具特色的SAS(Stability Assist System)稳定性辅助...

    2024-11-29 10:59

热点资讯

关注官方微信

手机扫码看新闻