1348
Difiere del bus en el coche GPS-pistas
Foto Artem Svetlov sup>
Para construir una imagen plausible de un proyecto Mapas Mail.Ru maneja una gran cantidad de información en un GPS-pista del movimiento. A menudo, la fuente de las pistas, se sabe poco, incluso por razones de seguridad. Sin embargo, para determinar la verdadera situación en las carreteras que siempre he querido saber más. Al menos a fin de comprender cómo la velocidad de la máquina corresponde a la velocidad del resto de la corriente de fuente. En este artículo vamos a hablar sobre el método de asignación de vehículos de ruta (autobuses, trolebuses, minibuses y tranvías) de la corriente de datos GPS en bruto.
¿Por qué es esto vehículos vazhnoMarshrutnye menudo no se mueven a la velocidad del resto de la secuencia. Ellos, por supuesto, pueden ser indicadores de la situación del transporte, pero con algunas particularidades:
- Los autobuses y trolebuses tienden a tener su propio calendario con un montón de paradas a lo largo de la ruta. Esto significa que en la carretera el autobús irá flujo obviamente más lento y, a menudo permanecer por un corto tiempo. En la hora punta, cuando los autobuses pasan cada 7-10 minutos, pueden enviar la información suficiente para reducir la velocidad del flujo cerca de la parada.
- Gracias a los carriles dedicados, el autobús puede ir más rápido en el flujo de tráfico.
- Los conductores de minibuses a menudo van en contra de todas las reglas.
Inicial dannyeZaranee decir, que el propósito de este artículo no es para comparar cuál de los sistemas de navegación por satélite mejor. Casi todos los dispositivos cliente ahora chips de costo que recibe los datos de todos los sistemas disponibles y producen coordenadas generalizadas. Para ahorrar espacio, aquí y en el futuro va a llamar a la pista, producido mediante el uso de un sistema de navegación por satélite, el GPS-pista.
Para empezar, vamos a definir lo que es una vía GPS. GPS-pista - una secuencia de la posición de coordenadas del dispositivo con el tiempo. Por desgracia, lo único que sabemos acerca de cada pista por favor envíe el dispositivo - que es un número de identificación único. Esos son los estrictos requisitos de confidencialidad.
Todas las pistas tienen una naturaleza diferente y provienen de diferentes proveedores. En este artículo, voy a considerar el caso cuando el dispositivo está fijado rígidamente al vehículo y envía los datos a intervalos regulares. Esta simplificación permitirá a mí no considerar la situación en la que el dispositivo estaba grabando la pista en las manos de alguien, entonces que alguien subió al autobús y se fue en él un par de paradas.
El propósito del análisis es la asignación de la lista de pistas total de los que la mayor parte del tiempo de moverse a lo largo de la misma secuencia de calles -. La ruta
Método resheniyaPervym asunto pista continua original debe ser dividida en viajes individuales, que vamos a comparar entre sí. Como se describió anteriormente - en las máquinas se encuentra físicamente GPS-tracker que cada pocos segundos envía sus coordenadas. Muy a menudo, el rastreador funciona cuando el motor esté encendido, pero hay dispositivos que funcionan durante todo el día. Por lo tanto los viajes de separación toman período de tiempo en el que la velocidad era siempre 0 o dispositivo no envíe los datos por más tiempo.
Ejemplo de una separación de la pista en un viaje sup>
Ahora, para cada vehículo que tenemos un conjunto de pistas, viajes que ha cometido durante un determinado período de tiempo. Entre ellos son auténticos viajeros y pistas malosvyazannye causados por errores de la determinación de las coordenadas, los desplazamientos dentro de la zona cerrada de la empresa ", pereparkovkami" y desperdicios similares. Con el fin de no perder en los recursos informáticos, puedo filtrar todas las pistas de menos de 400 metros, el número de puntos es inferior a 10, y la propagación geográfica de menos de 200 metros al rectángulo de delimitación de la pista (cuadro delimitador). Esto evitará que las pistas, ruedas dentadas, que se forman debido a grandes errores aleatorios en el receptor GPS.
Piñones pista característicos sup>
La siguiente tarea - Comparar las pistas juntos y determinar si son probados por la misma ruta. Para ello, en primer lugar le doy todos los GPS-pistas en una sola forma, atándolos a nuestro gráfico de enrutamiento. Los privyazchika trabajo que escribí en mi último post . Desde entonces, ha sufrido algunos cambios, pero los principios básicos siguen siendo los mismos. A la salida de privyazchika tengo la pista como una cadena de pares (id bordes de la gráfica, la dirección (adelante o atrás)). En esta etapa, puede filtrar las pistas que no entran en nuestro gráfico de ruta. Esto puede ser las pistas de aviones / helicópteros contenedores en los mares, las cosechadoras. O simplemente de máquinas que han pasado por lugares en los que tenemos, por las razones que sean, no gráfica de enrutamiento. Tomo nota de que no se filtran sólo aquellas pistas que no corresponden a la gráfica de enrutamiento. Si el coche sale de la zona de aparcamiento, donde no tenemos el gráfico de enrutamiento, entonces mucho montar a caballo en los caminos, donde adjuntan a la gráfica de enrutamiento y el camino nos detuvimos en el extremo de la playa de estacionamiento (donde de nuevo no hay gráfica de enrutamiento), esta pista se contará.
La cadena resultante es mucho más fácil comparar entre sí. Estaba navegando a través de varios indicadores de comparación y, finalmente, se detuvo en метрике Lowenstein . Alfabeto en este caso es el conjunto de todos los posibles pares de borde-dirección. Así que me dio la oportunidad de determinar numéricamente la "similitud" de las pistas como el número de ediciones costillas ruta (añadir / quitar / reemplazar las costillas) con una ruta para llegar otra ruta.
El siguiente paso es la pena la agrupación de las pistas en la ruta. Esta pregunta se responde algoritmos de agrupamiento de datos. Puesto que ya tienen una métrica unidimensional de "similitud" de las pistas, me tomó un algoritmo muy simple para la agrupación jerárquica de los datos: дендрограмму. El árbol se construye en base a la distancia mínima Levenshtein después de romper sus ramas, que difieren por más de n bordes. Imperativamente sucedido calcular el n óptimo igual a 16.
Al final, aparece un conjunto de grupos que contiene unas rutas similares. Con esta información, ya es posible llegar a una conclusión acerca de si el vehículo se desplaza a lo largo de una ruta predeterminada. Tuve la idea de utilizar diferentes n en función del número de aristas en la ruta, pero no reconocen la mejora del crecimiento de la calidad de búsqueda, y me decidí a mantener un n fijo.
Originalmente pensado que la mayoría de los vehículos tienen 2 itinerario (desde el extremo a extremo) en ambas direcciones. Pero, como la experiencia ha demostrado, a veces, la ruta puede ser circular, o constar de varias partes.
vehículos de rutas no siempre se mueven a lo largo de la ruta. Hay viajes al garaje para abastecerse de combustible, etc. sup>
pistas de la ruta. Cierre de vista sup>
Por lo tanto, la mayoría de los vehículos tienen al menos un grupo en el que la acumulación de viaje y algo de sobrecarga, rutas desechables o más raras (al garaje antes de cargar combustible, etc.). Con base en estos resultados, se puede comprobar otra hipótesis: una vez que tengamos rutas de vehículos y rutas comparaciones métricas, podemos asignar los vehículos que operan en la misma ruta. Para ello, basta con tomar grupos separados de diferentes vehículos y compararlos entre sí (especialmente la función de comparación de clusters ya está en la aplicación de un árbol jerárquico).
Dos autobús diferente viajando por el mismo camino sup>
Por lo tanto, puedo especificar los vehículos de ruta y de grupo en los parques.
Datos VyvodyAnonimnye GPS llevan una gran cantidad de información. Analizar correctamente estos datos, podemos aprender mucho más información acerca de cómo producir pistas vehículo y sobre la ciudad y sus caminos. Por lo tanto, el alcance de las pistas no debe limitarse en la obtención de información sobre atascos de tráfico, y la información en sí puede beneficiar no sólo a los automovilistas, sino también servicios de planificación municipal y de la ciudad. Por otra parte, para la tramitación de estas pistas no saben necesariamente los datos exactos de la máquina que los crea. Toda la información necesaria sobre el vehículo puede decir a sus estadísticas de movimientos. Al mismo tiempo, GPS-pistas - información específica herramienta es imprecisa. Para obtener el resultado que debe examinar una gran cantidad de datos, que es muy exigente en la infraestructura de fabricación.
Fuente: habrahabr.ru/company/mailru/blog/228289/
Energía eólica turbina vale la pena en 5-7 meses
Motor Rocket está totalmente impreso en el 3d-impresora para crear un "gesto de la mano"