您的位置:主页 > 公益 > 在行动 >

了解为了解:为了将好奇心强硬地引入机器人而开发的算法

2019-09-30     来源:逸名网站         内容标签:了解,为,为了,将,好奇心,强硬,地,引入,机器人,

导读:为了更好地充实人工智能(AI),计算机科学家已经将一种算法放在一起,使机器只是为了学习而好奇地探索和学习。从长远来看,这些项目甚至可以从工厂中取出机豪享彩票注册器人,并将

为了更好地充实人工智能(AI),计算机科学家已经将一种算法放在一起,使机器只是为了学习而好奇地探索和学习。从长远来看,这些项目甚至可以从工厂中取出机器人,并将它们与研究人员并排放置。

Sage的建议。图像归功于GerdAltmann。

概念对于我们来说,智慧和好奇心是如此深深地缠绕在一起,以至于几乎不可能想象一个人在没有另一个人的情况下走得很远。然而,即使是我们迄今为止构建的最强大的机器大脑也必须在没有任何好奇心的情况下完成-计算并在指示时返回答案,在没有输入的情况下进入屏幕保护程序。

这不像我们现在只是搞清楚这一点。一段时间以来,科学家们一直致力于各种方式让我们的硅胶朋友充满好奇心,但他们的努力总是远远低于我们与生俱来的好奇心所设定的基准。例如,一个重要的限制是,大多数好奇心算法无法确定某些事物是否有趣-因为与我们不同,它们无法评估机器存储的数据总和以查看潜在的知识差距。相比之下,你可以非常自信地判断一本书是否有趣而不先阅读它。

通过封面评判书籍

豪享彩票注册但ToddHester,一位目前在伦敦与GoogleDeepMind合作的计算机科学家,认为机器人实际上应该能够反对这种民间智慧。为此,他与德克萨斯大学奥斯汀分校的计算机科学家PeterStone合作,创建了具有方差-新颖-内在-奖励/TEXPLORE-VENIR算法的目标探索。

“我一直在寻找方法让计算机更智能地学习,并像人类一样进行探索,“他说。“不要探索一切,不要随意探索,而是尝试做一些更聪明的事情。”

他们这样做的方式是将TEXPLORE-VENIR建立在一种称为强化学习的技术上。它也是人类学习的主要方式之一,并且通过小幅增加来实现最终目标。基本上,有问题的机器或人类会尝试某些东西,如果结果更接近某个目标(例如清除扫雷中的所有棋盘),它会获得奖励(对我们来说是多巴胺)以促进该行动或行为。未来。

强化学习对我们有用-通过制作像吃的东西感觉良好所以我们不会忘记吃-它也适用于机器-这是强化学习,使DeepMind能够掌握ATARI游戏和举个例子吧。但这是通过随机实验实现的,而且,该程序被指示学习游戏。另一方面,TEXPLORE-VENIR的行为类似于我们大脑中的奖励回路,通过给予程序内部奖励来理解新事物,即使知识不能更接近最终目标。

<图片来自TroyStraszheim/维基媒体。

当机器了解周围的世界时,TEXPLORE-VENIR会奖励它以发现与以前不同的新信息-探索一片新的森林,或者找到执行某项任务的新方法。但它也奖励机器减少不确定性,即更深入地了解它已经“知道”的东西。总体而言,该算法比以前的程序更接近于我们所理解的好奇心。

文章链接地址:http://www.mit47.com/gongyi/zaixingdong/201909/3224.html

上一篇:科学家们拍卖蛇名以保存它们
下一篇:没有了