Google enseña a los robots de realizar las tareas en "el jardín de la infancia"

En el jardín de infancia, los robots aprenden a abrir la puerta

La habilidad de aprender — uno de los más importantes para los robots. Si llegan a aprender, acumulando la información con el paso del tiempo, se pueden utilizar para la ejecución de tareas complejas, que no han sido previamente programados. Las tareas pueden ser muy diferentes — desde la atención a las personas mayores y los pacientes en los hospitales antes de la limpieza. La verdad es que si tiene que enseñar cada robot por separado, esto se llevará a la gran cantidad de tiempo. Y que, si los robots van a enseñar a los robots? Y que, si el grupo de robots serán de aprender juntos?

Este problema no es nada nuevo, más de una vez, describe la ciencia ficción. Los profesionales de la robótica y la inteligencia artificial también tratan de resolver la cuestión. Google más interesada en lograr que los robots самообучаемости. Probablemente, una de las formas más sencillas de conseguirlo es crear una base de datos de conocimientos de robots, donde se recopilará la información obtenida de cada una de las máquinas.

Todos los robots deben estar vinculados con esta base. Si algo se aprende de un robot, el conocimiento y la experiencia en seguida reciben todos los demás. Los empleados de Google han probado esta idea (también nuevo) en la práctica, y han obtenido buenos resultados. En particular, las acciones realizadas por uno de los robots, de inmediato se convirtieron dominio público y de sus "colegas".

Los robots pueden realizar la misma acción de manera muy diferente. Resulta a veces mejor, a veces peor. Toda la información sobre estas actividades se confirma y llega al servidor, donde se procesa con la ayuda de нейросети. El sistema cognitivo evalúa las acciones de cada máquina, y solo selecciona la información sobre la experiencia positiva, descartando los datos sobre el fracaso del intento de llevar a cabo cualquier otra tarea. Los robots cargan procesados нейросетью los datos con cierta frecuencia. Y con cada nueva carga actúan todos de manera más eficiente. En el siguiente video del robot estudia el proceso de apertura de la puerta.

Después de varias horas de aprendizaje de la máquina transmite información acerca de sus acciones en la red. Durante la ejecución de la apertura de la puerta robots aprenden los detalles de este procedimiento, poco a poco "darse cuenta", el papel de la manija de la puerta, y lo que hay que hacer para abrir la puerta lo más rápido posible.

El proceso de aprendizaje por ensayo y error es bueno, pero no es perfecto. La gente y los animales, por ejemplo, se pueden analizar los elementos del entorno, valorando su posible influencia en sus acciones. A medida que crecen y en el hombre y en los animales, se genera una cierta visión del mundo. Está claro que el hombre es mucho más complicado que el de la mayoría de los animales, pero las similitudes hay, en ambos casos.

Por lo tanto, los ingenieros de Google han decidido mostrar a los robots, como las leyes de la física influyen en sus acciones. En uno de los experimentos de un robot pidieron estudiar los diferentes tipos de objetos comunes para cualquier hogar u oficina. Esto lápices, bolígrafos, libros y otros objetos. Los robots rápidamente aprendido y transmitido la información recibida a sus "colegas". Todo el equipo de robots en poco tiempo recibió la noción de las consecuencias de sus acciones.

En el nuevo experimento, los ingenieros daban el comando robot para mover un objeto de un punto. En este caso el sistema no ha recibido ninguna instrucción acerca de la naturaleza del objeto. Los objetos han estado en constante cambio. Esto podría ser una botella de agua, un banco con una cerveza, una pluma o un libro. Como resultado, es el trabajo de los robots han realizado utilizando los datos de la experiencia anterior sobre la interacción con el mundo real. Ellos fueron capaces de calcular las consecuencias de movimiento de un objeto sobre la superficie al punto deseado.

Y que la misma persona?
Los dos anteriores experimento se llevaron a cabo con la participación de los robots, sin ayuda de la persona. Cómo se sienten los empleados de Google, la formación de los sistemas robóticos puede ir mucho más rápido, si la persona va a ayudar a la máquina. Ya que el hombre rápidamente se puede contar qué pasa en la final de la ejecución de cualquier acción. Por ejemplo, en una experiencia de la persona ayudaba a los diferentes robots de abrir las puertas de todo tipo. Cada sistema ha recibido única de la puerta y la cerradura.

El resultado fue unida de estrategia de todos los robots que han llamado "la política". Todas las acciones de los robots se procesen con la ayuda de la red neuronal. Se manejaria imágenes de las cámaras, фиксировавших pasos de los robots, y pasaba ya tratada la información en el servidor central, en forma de políticas.

Los robots constantemente perfeccionado la "política" a través del método de ensayo y error. Cada robot trataba de abrir la puerta usando actualizada de la política. La acción de los robots todavía se procesen neuronal de la red y las cargaban en el servidor. Con el paso del tiempo, los robots se han convertido trabajar mucho más eficaz que la primera vez.

Después de que los robots se han convertido para funcionar con éxito, cada uno de los instructores que trabajan con robots, varios cambió las condiciones de la tarea. Los cambios fueron fuertes (se cambiaba la posición de la puerta, el ángulo de apertura, etc.), pero suficientes para pre-diseñada la política no es muy relevante para la decisión de una nueva tarea. Los robots poco a poco aprendieron a lidiar con los nuevos para sí mismos términos, y que, posteriormente, han aprendido a realizar las tareas más desafiantes para abrir diferentes puertas y cerraduras. Final del experimento demostró la eficacia de este tipo de aprendizaje: los robots capaces de abrir la puerta del castillo, que hasta ahora no han tenido.

Los autores del proyecto sostienen que la interacción de robots el uno con el otro y el almacén central de datos les ha ayudado a aprender más rápido y más eficiente. Y el uso de la red neuronal ha mejorado considerablemente los resultados preliminares.

Por desgracia, mientras que la lista de tareas que pueden realizar los robots, es sumamente limitado. Con el trabajo se dan, incluso la más simple de movimiento y de trabajo así como la apertura de las puertas o el levantamiento de objetos diferentes. El hombre todavía está obligado a hablar de un robot que hacer y como actuar. Pero los algoritmos han mejorado gradualmente, y las redes neuronales han dejado de ser algo impresionante. Por lo tanto, existe la esperanza de que en un futuro los robots podrán realizar tareas complejas. Puede ser, el futuro ya está aquí.

Fuente: geektimes.ru/post/281170/

el mit tecnológico de massachusetts robots autoaprendizaje