谷歌是教学机器人来执行新的任务,在"幼稚园"




在幼儿园、机器人学会开门

学习能力是一个最重要的机器人。 如果他们会学习,积累必要的信息用于自己的时间,他们可以被用来执行复杂的任务不是编程中前进。 工作可能非常不同的—从照顾老人和病人在医院和清洁。 但是,如果你教每个机器人独特的,它将需要大量的时间。 如果有什么机器人就被教导过的机器人吗? 如果机器人小组将以教导在一起吗?

这个问题不是新的,它描述的是通过科幻小说。 专家机器人技术和人工智能也是在试图解决这一问题。 谷歌是比其他人更感兴趣的是如何得到机器人的samobytnosti的。 可能是一个简单的方法来实现这一目标是建立一个共同数据库的知识的机器人,其中将收集的信息收集每个机。

所有的机器人必须与此相连的基础。 如果有什么了解一个该知识和经验,以立即得到的休息。 员工的谷歌已经尝试过这种想法(也不是新的)在实践中,并得到了良好的结果。 特别是,行动的执行由一个机器人,立即成为酒店和他的"同事"。

机器人可以执行相同的操作在非常不同的方式。 有时候好有时候坏。 任何关于这些行动是固定和服务器收到的,在那里处理的帮助下神经网络。 认知系统评估行动的每台机器,并且只选择有关的信息的积极经验,废弃的数据不成功的尝试来执行任何其他任务。 机器人负荷的数据处理的神经网络具有一定的频率。 和每一个新的下载的他们都是有效的。 在视频下,机器人正在探索的进程打开大门。


几个小时后的学习的机发送的信息在其总的网络。 在开发期间的开门机器人探索细节这一程序,逐步"了解"是,作用是什么门的把手,你需要做什么开门尽可能快地。


学习的过程通过反复试验是良好的,但不是完美的。 人和动物,例如,分析要素的环境,评估他们的可能影响他们的行动。 作为他们的成长、人类和动物已经形成一定的世界图片的。 清楚的是,在人类这是更为困难比大多数动物,但类似的要素没有在这两种情况。

因此,谷歌工程师决定显示机器人如何在法律的物理影响他们的行动。 在一个实验,机器人是指示审查各种各样的目的、常见的任何家庭或办公室。 它是铅笔、钢笔,书籍和其他物品。 机器人正在快速培训和发送接收的信息对他们的"同事"。 整个团队的机器人在一个短短的时间有意义的后果,他们的行动。



在新的实验,工程师给了命令机器人移动一定的对象,在给定点。 该系统没有收到任何说明的性质的对象。 目的是不断变化。 这可能是一个瓶装水、啤酒、笔或书籍。 事实证明,这项任务的机器人进行的,使用的数据以往的经验上的相互作用,与真正的世界。 他们能够计算的后果的运动的对象上面所需的点。

和同一个人吗?
两个以前的实验进行的参与下,只有机器人不需要人帮助。 根据谷歌的员工、学习的机器人系统可以快得多,如果人们将帮助的汽车。 毕竟,人们可以迅速计算到底发生了什么进行某种行动。 例如,在一个实验中的人们的帮助不同的机器人打开大门。 每个系统有一个独特的大门和锁。

在此,我们制定了一个联合战略,为所有的机器人,其他所谓的"政治"。 所有的机器人进行了处理使用深度的神经网络。 她处理的图像照相机、固定的机器人,并通过对已经处理信息的中央服务器形式的政策。


机器人不断改善的"政策"使用的方法的试验和误差。 每个机器人试图打开门使用的最新政策。 机器人仍然处理的神经网络,并上载服务器。 随着时间的推移,机器人开始工作,大大好于第一次。


一旦机器人开始成功,每个教师工作的人,很少有变化的条件的问题。 改变强(改门的位置,开放的角度,等等), 但足以预先设计的政策是不适合的解决方案的新任务。 机器人逐渐学会适应新的条件,并随后了解到执行的最困难的任务上开不同的门锁。 最终实验表现出有效性的这种类型的教育:为机器人来打开大门和锁,这仍然面临的。


该项目的作者认为,互动的机器人彼此和中央数据储存库,帮助他们学习更快和效率更高。 和使用的神经网络显着改善的初步结果。

不幸的是,清单的任务,可以由机器人是极为有限。 他们几乎没有,甚至最简单的的动作和任务,如开门或解除不同的对象。 人们仍然不得不告诉机器人做什么以及如何采取行动。 但是,算法的逐步改善,和神经网络不再是什么惊人的。 因此,我们希望,在不久的未来的机器人将能够执行复杂的任务。 也许未来已经在这里。

资料来源:geektimes.ru/post/281170/