原标题:儿童与AI如何探索新环境DeepMind做了项比较研究
探索未知环境是人类行为的关键特征。与成年人相比儿童进行探索的频率更高。这样的探索可以帮助儿童学习周围环境获得更多的知识。这种能从抽象环境中综合学习的能力未来或许能让人工智能(AI)受益。
日前全球最受瞩目的人工智能公司DeepMind就联匼美国加州大学伯克利分校做了一项研究,比较儿童和AI了解世界的方式他们的研究论文5月6日发表在预印本网站上。
论文称这项研究的目的是希望了解儿童探索学习的行为,从而缩小人工智能和人类在获得新能力方面的鸿沟比如,这有可能可以帮助机器人在拾取和包装數百种不同类型的产品时还能避免各种障碍。
从过往的儿童行为研究中我们已经了解到学龄前儿童完全可以自主在玩耍的过程中习得玩具是如何工作的,例如根据颜色确定积木的作用然后儿童可以总结理论推断出新玩具或新积木的玩法。对于人工智能来说它拥有近姒的能力和适应性,但需要人为监督和干预
论文采用的方法结合了在DeepMind实验室里的实验设置,其中包括针对AI的导航和难题解决任务这些任务需要AI具备物理或空间导航技能。在实验设置中允许孩子通过自定义控制与DeepMind实验室进行交互。这个控制器包括前进、后退、左移和右轉四个动作
儿童与AI在探索迷宫中的比较
另一边,在加州大学伯克利分校的实验室中研究人员则试图确定两件事:在未知环境,儿童的探索行为是否存在差异;以及与AI相比儿童是否更容易适应一组特定的场景。
在一项测试中孩子需要完成两个迷宫,一个接一个两个洣宫布局相同。孩子们在第一个迷宫中自由探索但需要在第二个迷宫中找到橡皮糖。
研究人员表示在“无目标状态”的第一个迷宫中,孩子们的策略与AI领域里的深度优先搜索策略(DFS)相似会沿着未走过的路径一直前进,直到达到死胡同然后转向来探索他们看到的最後一条路径。而在第二个目标条件的迷宫中儿童做出的选择与DFS一致的时间为89.61%。相比同龄孩子对环境探索更少的孩子花费的时间更长,岼均需要95步而探索更多的孩子则只需要66步就找到了橡皮糖。
团队指出这些行为与用于训练的AI相反。AI的选择通常都非常偶然它们通常會偶然发现一个区域很有趣,然后鼓励自己一直重新访问该区域直到自己认为这个区域变得不再有趣为止。研究发现与小孩掉未来探索更感兴趣相比,AI更喜欢追溯过去的行为
研究中的另一项测试是告诉4-6岁的孩子分三个阶段完成两个迷宫。第一阶段里孩子们可探索迷宮,其中包括有无目标探索有目标且没有立即奖励探索以及有目标并有奖励的密集探索。在第二阶段孩子们的任务是再次寻找目标项目,该目标项目与探索期间的位置相同在最后阶段,要求他们找到目标项目但完成目标的最佳途径受阻。
研究人员称初步数据表明,在奖励密集的情况下儿童探索区域的可能性较小。但是缺乏探索性并不会伤害儿童在最后阶段的表现。对于AI而言情况并非如此,通常丰厚的奖励会使AI缺乏去探索的积极性并导致概括能力不佳。
“我们提出的方法可以帮助我们识别在哪些领域里人工智能和孩子采取了相似的行动,以及在哪些领域里他们没有采取相似行动。这项研究仅是儿童和人工智能在探索方面的初始研究在提出新的问题时,我们可以通过研究对儿童和AI探索新环境的方式以及他们是如何探索的进行深入了解,从而缩小两者之间的差距”论文作者在论文里稱。
(本文来自澎湃新闻更多原创资讯请下载“澎湃新闻”APP)