GTA V conectado a la plataforma de OpenAI Universe para la enseñanza de ia piloto automático





Ha pasado poco más de un mes desde entonces, como una organización sin fines de lucro OpenAI ilona Máscara presentó el software de conexión Universe para el entrenamiento y la formación de un fuerte de la ia. En teoría, el aprendizaje puede ocurrir a toda la información de la humanidad, accesible a través de internet. Con la ayuda de la plataforma de software Universe inteligente, el agente utiliza el equipo exactamente de la misma manera como lo hace el hombre: él mira sobre los píxeles de la pantalla del ordenador e interactuar con la ayuda de virtual el teclado y el ratón.

Ahora a decenas de juegos disponibles para el entrenamiento de la ia, ha añadido el juego de Grand Theft Auto V, que es excepcional realismo.

Usted puede crear un agente de la ia no tripulado del vehículo en cualquier framework para la máquina de aprendizaje y relativamente fácil de conectar al juego en un equipo con el GTA V.



El agente de la ia se encuentra en una intersección. En la consola, el diagnóstico de la izquierda se muestra el estado de presionar el pedal del freno (true) y otros de la actual configuración del piloto automático

El juego GTA V, aunque a practicar la violencia, ofrece muchas oportunidades para el aprendizaje de la ia para no tripulado del vehículo. Es uno de los más grandes y ricas de mundos abiertos. La acción ocurre en el territorio de la isla de san andreas con casi el 20% de este de los ángeles. Aquí se puede ejecutar una variedad de secuencias de comandos para probar la ia. Los agentes están disponibles 257 diferentes tipos de coches, 7 tipos de bicicletas, 14 tipos de clima, el medio ambiente pueda cambiar en el momento de la simulación.



La Isla De San Andrés

Gracias a los numerosos модам, en el juego de GTA V se puede descargar de un edificio de estas ciudades, los presentes autos, estas señales de tráfico y otros objetos. En consecuencia, su agente de ia serán capacitados en el manejo del vehículo en estas condiciones.

La Plataforma Universe
La apertura universal de la plataforma universal Universe — continuación de la планомерных de acción OpenAI de creación mundial abierto y universal de la ia. En abril de este año, la organización ha lanzado la beta pública-versión instrumental de OpenAI Gym para la elaboración y comparación de algoritmos de aprendizaje por refuerzo. "El gimnasio" OpenAI Gym se compone de un gran número de entornos (del simulador humanoide a los juegos de Atari). Hay sitio para la comparación y la reproducción de los resultados.

OpenAI considera que el aprendizaje por refuerzo es una manera importante de aprendizaje automático, que permitirá en gran medida a mejorar la ia. En el proceso de aprendizaje por el método de испытуемая sistema (agente) aprende interactuando con un cierto entorno. A diferencia de la enseñanza tradicional con el maestro, la respuesta a las decisiones de la ia son las señales de refuerzo, con algunas reglas de refuerzo se generan de forma dinámica y de fácil acceso a la comprensión de la persona, es decir, se basan en simultáneo de la actividad formal de las neuronas.

Ejecutar el agente de la ia en su equipo con el GTA V
La integración Universe con Grand Theft Auto V, creado y mantenido en el marco del proyecto DeepDrive, que ahora se pasó al open source. El proyecto contempla la posibilidad de ejecutar el agente creador de su propio equipo una copia del juego.



A través de Universe agente de la inteligencia artificial, se obtiene acceso a la realista tridimensional de juego mundo de GTA V. En el siguiente vídeo muestra imágenes de los juegos que se han enviado para su tratamiento a un agente de la ia (artificialmente retrasó hasta 8 FPS, arriba a la izquierda), la información de diagnóstico del agente y el entorno (abajo a la izquierda), así como fácil de usar para ver el hombre de la cámara (a la derecha).

La integración de la ia en el juego prohíbe toda acción violenta en GTA V.


Para empezar, el agente en su equipo, es necesario iniciar un proceso de servidor de GTA V. debe establecer Preliminarmente питоновскую biblioteca universe y, a continuación, conectar el agente con el siguiente código.

<code class="python">import gym import universe # register Universe environments into Gym from universe.spaces import joystick_event env = gym.make('gtav.SaneDriving-v0') env.configure(telecontroles='vnc://$host:$port') # point to the GTA V Universe server observation_n = env.reset() while True: steer = joystick_event.JoystickAxisXEvent(-1) # turn right throttle = joystick_event.JoystickAxisZEvent(-1) # go in reverse # Alternatively, use las teclas WASD to steer: ('KeyEvent', 'w', True) action_n = [[steer, throttle] for _ in observation_n] observation_n, reward_n, done_n, info = env.step(action_n) env.render()</code>Como de costumbre para los agentes Universe, ai usa el teclado virtual, pero en este caso lo disponible y joystick virtual. Los mejores resultados de ia demuestra exactamente con el joystick.

DeepDrive
DeepDrive es un sistema especializado de la plataforma para el desarrollo de la ia para no tripulados de coches con código abierto. En ella se utilizan моддерские marcos y técnicas especiales, a fin de convertir el GTA V en el coche simulador. Están disponibles previamente entrenados por agentes de la capacidad de gestión de transporte y conjuntos de datos en los que pasaba en su formación.

Aunque la plataforma DeepDrive apareció antes que el Universe, pero ahora su desarrollador decidió que sería razonable traducir su trabajo en esta universal de plataforma abierta. Este fue el paso correcto. Antes de iniciar el agente se necesitaba un equipo basado en Windows y muchas horas de la configuración del entorno (allí se utilizó la interceptación de DirectX para la captura de pantalla, y para la escritura de los agentes era necesario utilizar la interfaz de C++ a Caffe bajo Windows). Ahora DeepDrive se instala en 20 minutos, funciona bajo Linux y OS X, y escribir agentes en algún framework para el aprendizaje de máquina.

En el acceso abierto publicado el código fuente y AMI para GTA V, previamente entrenado, el agente-el conductor. Su formación continuó 21 h (600 miles de imágenes). El agente con habilidades básicas de conducción y es un buen comienzo para sus propios experimentos.


Conjuntamente a los miles de agentes de la ia puede crear realmente exquisito conductor de un programa que puede administrar el presente беспилотным el vehículo en el mundo real.

Fuente: geektimes.ru/post/284522/

Tags

Vea también

Nueva y Notable