¿Cómo comparar el tráfico en Bogotá con el de otras ciudades usando análisis topológico de datos?

Recientemente, Bogotá fue declarada la ciudad capital con el peor tráfico del mundo, según un artículo publicado en la revista Portafolio en julio del 2023. Este documento se basa en un estudio realizado por la firma TomTom Traffic Index. Interesantemente, el tráfico de Manila (Filipinas) obtuvo el tercer lugar en esta categoría. Este estudio es basado en el tiempo que necesita una persona para conducir un trayecto de diez kilómetros. Sin embargo, la calidad del tráfico en una ciudad de Bogotá se puede interpretar también por el tiempo de trayecto que utiliza una persona para moverse de un punto a otro. A pesar de que aún no se ha regulado en Colombia, la aplicación Uber, la cual es usada en casi todo el mundo, permite capturar las coordenadas del origen, del movimiento y del destino de un pasajero, también como el tiempo empleado en el trayecto. En la Figura 1 mostramos los gráficos de dispersión para los datos recopilados por Uber en el año 2017 correspondiente a varias ciudades, incluyendo a Bogotá.

 

Figura 1
Figura 1

 

 

Figura 2
Figura 2

 

Estos gráficos muestran la identificación del servicio (DMovID) vs. el tiempo promedio de viaje al destino (MTT). El análisis topológico de datos permite primero identificar una nube de datos con una filtración creciente de espacios topológicos asociados a lo que se denomina complejos simpliciales. Propiedades topológicas como el número de componentes conexas, agujeros, y espacios vacíos son detectados por medio de este proceso, como se muestra en la Figura 2.

 

Este proceso también determina lo que llamamos un diagrama de persistencia, el cual indica en la filtración el momento en que una propiedad topológica “nace” y el momento cuando “fallece”. Por ejemplo, en la Figura 2, podemos observar que hay un agujero que nace en el segundo paso, pero muere (desaparece) en el tercero. Por ejemplo, en la Figura 2, podemos observar que hay un agujero que nace en el segundo paso, pero muere (desaparece) en el tercero. Este proceso se puede implementar en un computador utilizando por ejemplo el programa RStudio con el paquete TDA.  Por ejemplo, en la Figura 2, podemos observar que hay un agujero que nace en el segundo paso, pero muere (desaparece) en el tercero.

 

Figura 3
Figura 3

 

Este proceso se puede implementar en un computador usando, por ejemplo, el programa RStudio con el paquete TDA.  Al realizar este proceso con los datos para Bogotá y Manila, tenemos los diagramas de persistencia en la Figura 3. Estos diagramas detectan el nacimiento y fallecimiento de las componentes conexas (en negro) y agujeros (en rojo) correspondientes a estas ciudades. Finalmente, después de que se obtienen los diagramas de persistencia para dos nubes de datos, procedemos a medir que tan diferentes son estos diagramas empleando lo que se denomina la distancia de cuello de botella (bottleneck distance). Por ejemplo, si denotamos por medio de P y Q los diagramas de persistencia de Bogotá y Manila respectivamente, tenemos que la distancia de cuello de botella es: dß (P,Q)= inƒ y sup xep ||x-y (x)|| ∞ donde el infimum es sobre todos los pareos. El paquete TDA en RStudio nos permite también calcular la distancia de cuello de botella entre los datos de las ciudades de Bogotá, Boston, Johannesburgo, Manila, París y Sídney, las cuales están incluidas en la Tabla 4.

 

Figura 4
Figura 4

 

Utilizando esta tabla, podemos ver que, con respecto a la distancia de cuello de botella, el diagrama de persistencia (y por ende las propiedades topológicas) de los datos de Bogotá es más cercano al de Manila. De hecho, la menor distancia de cuellos de botella en la Tabla 4 es entre estas dos ciudades. Es importante observar que estos resultados son consistentes con los estudios realizados por el TomTom Traffic Index en donde se concluye que Bogotá y Manila están en rangos similares entre las ciudades con el peor tráfico en el mundo. Sin embargo, es relevante resaltar que el tráfico en Bogotá ha cambiado mucho desde el 2017 debido a las construcciones de nuevas troncales de Transmilenio como también de la primera línea del metro, entre otros factores. Por tal motivo, esta metodología aplicada a datos más recientes podría dar a relucir resultados más confiables.   Para más información sobre el análisis topológico de datos y sus aplicaciones, recomendamos al lector revisar el artículo por G. Carlsson titulado “Topology and Data” publicado por la Sociedad Americana de Matemáticas (AMS).

 

José A. Vélez Marulanda PhD.

Docente.

Matemáticas e Ingeniería.

Fundación Universitaria Konrad Lorenz.

Carácter Académico: Institución Universitaria. Personería Jurídica por Resolución 18537 del 4 de noviembre de 1981 del Ministerio de Educación Nacional. Institución de Educación Superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional (Art. 2.5.3.2.10.2, Decreto 1075 de 2015). Vigilada Mineducación.
  • imagen
  • imagen
  • imagen
  • imagen
  • imagen