Домашний робот: от идеи к продукту

С древних времен человек хотел разговаривать с окружающим миром. Говорящие вещи окружали его в сказках и легендах. Злая королева общается с говорящим зеркалом, Горлум жалуется на тяготы и невзгоды бытия Кольцу Всевластья, Тамерлан разговаривал с камнями и давал им имена.

Все это потому, что голос — самый естественный способ общения для человека, вербальные коммуникации заложены в наших генах. И вот сегодня мы вплотную приблизились к воплощению древнейшей мечты человечества при помощи высоких технологий.

В Cubic Robotics мы верим, что скорейший путь к “говорящему миру” лежит через создание универсальной голосовой операционной системы, которую с одной стороны можно было бы установить на любое устройство. С другой стороны такую систему могли бы развивать независимые разработчики по всему миру. Именно такой является разработанная и запатентованная нами голосовая операционная система V.O.I.S. (Voice Operation Intellectual System).





V.O.I.S. — универсальная голосовая операционная система, при помощи которой можно сделать говорящим почти любой предмет. Разговаривать значит, не просто принимать голосовые приказы, но действительно понимать человека, поддерживать и даже инициировать разговор. Это тот самый искусственный интеллект, находящийся внутри нашей разработки — роботе-ассистенте Cubic (о нем мы рассказывали подробно в прошлой статье).

Также на базе V.O.I.S. уже создаются и проектируются разговаривающие автомобили, интеллектуальные помощники для смартфонов и носимых гаджетов.

Принципы работы

Нужно быть честными с самими собой: создать настоящий искусственный интеллект вряд ли удастся в ближайшее время: на это нужны огромные деньги, вычислительные мощности огромных лабораторий, и лучшие умы планеты. Однако существующие сегодня технологии позволяют создать операционную систему с элементами ИИ.

С технологической точки зрения, V.O.I.S. представляет собой язык программирования, ядро системы и набор приложений управляющих разнообразными речевыми функциями.

Основой принцип работы V.O.I.S. – это умение понимать контекст разговора, а так же эмуляция человеческой беседы. Вы задаете вопрос и получаете ответ, а не набор ссылок, найденных в поисковой системе.
На самом деле изнутри процесс выглядит примерно так: как только к серверу приходит фраза пользователя, то он начинает искать варианты, которые могли бы подойти в качестве ответа. Для этого у нас используется несколько разных движков от классического чат-бота до статистического алгоритма поиска по базе диалогов. Например, пользователь спрашивает – «Что там на улице»?

На этот вопрос существует несколько вариантов ответа. Среди прочего, сервер будет рассматривать такие варианты:
— На улице 25 градусов и светит солнце.
— На улице очень серьезные пробки, не стоит ехать на машине.

А поиск по базе удачных диалогов может выдать что-нибудь вроде: «Ты и сам можешь посмотреть, в отличие от меня, у тебя есть ноги».

Относительно правильных ответов может быть довольно много (сотни). Важно выбрать из них тот, который нужен пользователю именно сейчас. За это отвечает алгоритм проверки контекста (статистический).
Он может показать, что если в базе данных есть информация о том, что у пользователя есть автомобиль, то ему скорее всего интересны пробки. А если пользователь только что говорил о погоде (например, спросил погоду на завтра), то логичнее ответить ему про погоду на улице.



Определение контекста – сложная задача. Частично она строится на анализе имеющейся базы корректных диалогов. Некоторые правила приходится прописывать вручную, другие вытекают из формальной логики. Например, самое простое и действенное правило: если два ответа одинаково хороши, то будет выбран тот, тема которого ближе всего к последнему разговору.

Конечно, на нынешнем этапе развития V.O.I.S. периодически дает очень странные ответы: многие сценарии еще не прописаны и не внесены в его базу данных, поэтому случаются курьезы.



Что будет дальше
Сегодня ряд компаний уже проявил интерес к V.O.I.S. и устройствам на ее базе: не так давно мы общались с представителями корпорации Samsung и автоконцерна КАМАЗ.
Samsung дважды встречались с нами, на одну из встреч прибыли представители из головного офиса компании, которых очень заинтересовал проект Cubic. В свою очередь КАМАЗ предложил создать голосовой интерфейс для бортового компьютера новой модели КАМАЗа.

В обоих случаях конкретных договоренностей мы пока не достигли, но переговоры продолжаются.
Однако, наши главные цели сейчас – это запуск серийного производства робота Cubic (сейчас идут отладочные работы на фабрике в Китае) и создание API для V.O.I.S., чтобы таким образом сделать систему доступной для каждого разработчика.

Мы надеемся, что уже к концу 2014 года будет создана инфраструктура обеспечивающая возможность всем желающим разрабатывать собственные приложения под V.O.I.S. или создавать говорящие устройства на ее базе.

Тем более, что разработка приложений для V.O.I.S. – дело куда более простое, чем создание подобных вещей для смартфонов: графические интерфейсы пользователя не нужны.
О примерах интегрирования в нашей системы в различные устройства мы расскажем в следующей статье, а пока готовы ответить на ваши вопросы.

Источник: habrahabr.ru/company/cubicrobotics/blog/222655/