Как научить робота готовить?

Исследователи Университета Мэриленда и Австралийского исследовательского хаба ИКТ анонсировали метод, который позволит роботам самостоятельно обучаться приготовлению пищи. При этом роботы будут использовать довольно распространенный сегодня способ – будут смотреть видео на Youtube.





Исследователи использовали недавно разработанные методы глубокого обучения и нейронные сети – программы, которые симулируют работу человеческого мозга с помощью искусственно созданных нейронов. Ученые «скормили» системе обучающие ролики, опубликованные на Youtube, а система в свою очередь идентифицировала используемые поварами объекты, и пыталась понять, какие действия нужны для готовки.

Так ученые разработали систему, которая в будущем позволит роботу выполнять на кухне самые основные задачи, а также распознавать их прямо во время просмотра роликов.

Хотя, казалось бы, некоторые роботы уже умеют готовить. Например, Cooki от стартапа Serenity выполняет действия в заданной последовательности, кипятит воду, добавляет в нее пасту, поджаривает мясо – в общем, делает все, чтобы заменить вас на кухне.







Издание Motherboard взяло интервью у члена команды-разработчиков, работающих над обучением робота готовке по видеороликам, Корнелии Фермюллер.

Как вы заставляете робота учиться готовить?

Есть много исследований на тему обучения робота движениям, это хорошо изученная область. Но работа направлена на копирование движений – робот видит действие и повторяет его. В реальной жизни все гораздо сложнее, ведь нужно адаптироваться к различным ситуациям. Банка или лопатка могут быть разных размеров, могут находиться в разных местах на кухонном столе, сам стол может быть чем-то завален – все это усложняет работу.

Робот должен уметь воспринимать мир. Например, «повару» нужно открыть банку арахисового масла, которая всегда стоит в одном месте. А человек её переставил. Нужно подготовить машину к таким ситуациям.

Является ли техника глубокого обучения и использование роликов на Youtube достаточными, чтобы преодолеть эти проблемы?

Робот смотрит обычные видео, а не сцены, снятые в лаборатории. Есть много способов съемки, ролики отличаются друг от друга углом, сценами, освещением и по многим другим характеристикам. Обзор может заслонить рука, продукт может загородить другие объекты. Здесь мы используем технику глубокого обучения. Это программное обеспечение, позволяющее распознавать объекты, в том числе когда они находятся в руке человека.

Наши роботы пока не готовят. Но мы уже кое-на-что способны: мы можем налить воды и помешать что-то, но роботов, способных автономно работать и готовить еду, обучаясь этому самостоятельно, пока еще не сделали.



С какими техническими препятствиями вы сталкиваетесь?

Прежде всего нужно решить все вышеупомянутые проблемы. Мы должны научить робота выполнять действия в разных условиях, местах и ситуациях. С другой стороны – во время готовки может произойти что угодно. Всё должно быть учтено.

Робот должен иметь интеллект, способность рассуждать, распознавать непредвиденные события и отвечать на них. То есть быть автономным. Мы продолжаем исследования, работаем над искусственным интеллектом, но еще не создали его. Прогресс идет, но на это требуется больше времени.

Возвращаясь к обучению – как вы додумались до того, чтобы использовать видеоролики для обучения робота?

Люди производят манипуляции различными способами. Недостаточно посмотреть видео и заставить робота выполнить то же действие. Я и вы можем открывать банку арахисового масла абсолютно по-разному.

Мы решили эту проблему таким образом: нужно думать не о движении, а о результате. Робот разбивает действие на маленькие кусочки.

Чтобы открыть банку арахисового масла, нужно совершить следующие действия: передвинуть руку в сторону банки, взяться за крышку, повернуть крышку, убрать руку с крышкой. Понимание этих действий, этой «грамматики», как понимание языка – точно также вы можете разложить на части предложение.

Когда роботы начнут смотреть видео и готовить, как мы?

Сложно сказать. Это случится, особенно если обстановка будет спокойной, вокруг не будут бегать дети. Но нужно больше времени. Нужно иметь дело со всеми видами восприятия вещей. Например, когда робот идет к холодильнику, он должен понимать, что салата может не быть дома – придется идти в магазин.

Источник: geektimes.ru/post/244169/