Introducción
Existen muchos problemas a resolver para garantizar el correcto funcionamiento de la sociedad, tales como los problemas de localización de instalaciones 1 y los de orientación para generar itinerarios turísticos. 2 En ambos casos existen parámetros que pueden cambiar según transcurre el tiempo. Su manejo permite tomar decisiones según los datos y su implicación en el tiempo, siendo más precisas y certeras. Los intervalos de tiempo pueden referirse a meses u horarios del día.
Deben crearse modelos flexibles que permitan dinamismo asociado a la variación de los parámetros. Esta investigación presenta nuevos modelos de optimización para 2 familias de problemas: localización con cobertura, y orientación para generar rutas turísticas. Los modelos desarrollados y los algoritmos creados para resolverlos son aportes novedosos.
Modelos de localización con variabilidad en el tiempo
La solución a los problemas de localización consiste en encontrar las mejores ubicaciones para un conjunto de instalaciones. 1,3 Estos trabajan con 2 conjuntos fundamentales: los clientes demandantes de un servicio y las instalaciones que deben proveerlo. Entre estos problemas está el de máxima cobertura (MCLP). 4 El MCLP es NP-duro y pretende maximizar la cobertura sobre los clientes con un número limitado de instalaciones, considerando restricciones de distancia que limitan el acceso de los clientes a las instalaciones. 4
Existen variantes del MCLP con instalaciones de diferentes tipos diferenciadas por su servicio o radio de cobertura. En Church RL et al.1 proponen una variante con tipos de instalaciones (MCLP-FT: problema de máxima cobertura con tipos de instalaciones) con un radio de cobertura diferente por tipo. Entre sus aplicaciones están: estaciones de bomberos,5 unidades de emergencias médicas 6 y estaciones de teletaxis. 7
Variantes del MCLP-FT consideran cambios en sus parámetros en diferentes periodos de tiempo. 1 En Cheu et al.8 se contemplan tipos de servicios con diferentes radios por tipo, donde los clientes resulta ser el parámetro variable en el tiempo. Existen otros modelos similares propuestos por Andrade, 9 Pérez, 10 Lee, 11 Bagheri, 12 Basar 13 y Ghaderi. 14 Aunque hay modelos en que la demanda de los clientes cambia en el tiempo, no se encontraron modelos con restricciones de disponibilidad de los tipos de instalaciones en los periodos.
Es importante desarrollar modelos con mayor flexibilidad que permitan modelar nuevos escenarios. Por ejemplo, en la planificación del patrullaje policial para un día, en la noche un policía a pie no deberá patrullar en cualquier zona, sino en algunas específicas. Por otro lado, una patrulla podrá vigilar en cualquier horario ya que tiene mayor protección. En la localización de antenas WiFi, si se desea realizar la planificación del encendido/apagado en el día, pueden existir horarios donde los niveles de potencia de las antenas queden inhabilitados por razones energéticas. En resumen, el MCLP-FT debe extenderse con parámetros dependientes del tiempo para agregar mayor flexibilidad.
Modelos de orientación con variabilidad en el tiempo
Los problemas de orientación (OP) son una versión de problemas de ruteo, que pretenden encontrar un conjunto de sitios a visitar, los cuales tienen una puntuación de interés, y el objetivo es maximizar la puntuación total visitada. 2 Una aplicación muy desarrollada del OP es la generación de itinerarios turísticos, 15 conocido como el problema del diseño de rutas turísticas (TTDP) compuesto por un conjunto de puntos de interés (POI), donde cada POI tiene un nivel de interés y se desea maximizar el interés total de la ruta, limitando su tiempo total.
Determinar el nivel de interés de un POI no es trivial y depende de factores que pueden variar. Por ejemplo, la estación del año o la hora del día puede implicar una variación en la atracción de un POI. Hay trabajos acerca de este enfoque, utilizando funciones decrecientes en el interés en el tiempo, 16 beneficios basados en la duración de la visita, 17 o con algoritmos para obtener la puntuación de un recorrido donde las puntuaciones de los POI pueden cambiar en función del periodo de tiempo. 18 En Yu VF et al.19 se propuso una variante de TTDP considerando varias rutas, ventanas de tiempo y niveles de interés de los POI en función de un factor de recomendación dependiente del tiempo donde se tienen tiempos de espera para llegar a un POI cuando su nivel de interés es mayor. El retraso en la llegada de los POI también se ha abordado en otras variantes del TTDP. 16,20
Es importante notar que la inclusión del factor de recomendación dinámico en el modelo puede (o no) tener un impacto y debe ser analizado. Entonces, además de añadir nuevas características a los problemas existentes, la utilidad y el impacto de dichas características deben evaluarse adecuadamente. Se puede ver que en el OP/TTDP es importante modelar los parámetros dinámicos, pero que es pertinente la evaluación de su impacto en la solución del problema, y proponer una alternativa para disminuir este posible impacto.
En esta investigación, el objetivo es modelar y solucionar variantes de los problemas MCLP-FT y TTDP incorporando parámetros dependientes del tiempo.
Métodos
Aquí se presentan modelos y algoritmos desarrollados que permiten tener mayor flexibilidad en la modelación de la variabilidad en el tiempo.
Modelo y algoritmo de solución para el problema dinámico de máxima cobertura con tipos de instalaciones con disponibilidad variable en el tiempo
Modelo propuesto problema de máxima cobertura con tipos de instalaciones
El caso (DMCLP_FT por sus siglas en inglés) publicado en Porras C, 2021 y Porras C et al. 2022 21,22 tiene como objetivo: maximizar la demanda cubierta con un conjunto de instalaciones de diferentes tipos. Los parámetros, variables y restricciones son:
Parámetros y variables:
𝑖, 𝐼: índice y conjunto de nodos de demanda,
𝑗, 𝐽: índice y conjunto de instalaciones,
𝑡, 𝑇: índice y conjunto de periodos de tiempo,
𝑎𝑖𝑡: demanda del nodo 𝑖 en el periodo 𝑡,
𝑘, 𝐾: índice y conjunto de tipos de instalaciones,
𝑆𝑘 : radio de cobertura de las instalaciones de tipo 𝑘,
𝑝𝑘: cantidad de instalaciones de tipo 𝑘 a ubicar,
La función objetivo del problema es: (ecuación 1, 2, 3, 4, 5, 6, 7)
Sujeto a:
La figura 1 muestra 3 ejemplos del modelo con T = 2 periodos de tiempo, K = 3 tipos de instalaciones y se desean ubicar o abrir 2 instalaciones de tipo 1 (p 1 = 2); 2 instalaciones de tipo 2 (p 2 = 2) y 1 instalación de tipo 3 (p 3 = 1). El primer ejemplo (figura 1 A) muestra un caso genérico donde se nota que el valor p k no es un valor para cada periodo, sino que las instalaciones abiertas se reparten entre todos los periodos. Por ejemplo, en el caso de las instalaciones abiertas de tipo k = 1 (círculo pequeño), donde p 1 = 2, hay ubicada una en el periodo t = 1 y otra en el periodo t = 2.
El segundo ejemplo (figura 1 B) muestra la aplicación del modelo a la localización de antenas WiFi. Se tendrá un conjunto de antenas de distintos tipos a ser ubicadas, o antenas que tienen distintos niveles de señal, el cual aumenta o disminuye el radio de cobertura (que puede ser visto como su tipo).
El tercer ejemplo (figura 1 C) muestra la planificación del patrullaje policial. En este escenario existen fuerzas policiales de distintos tipos: a pie, en motos y patrullas. Los incidentes tienen un comportamiento diferente según el horario del día. Es posible visualizar la disponibilidad variable de los tipos en los horarios, ya que en el horario t = 1 se puede observar que los 3 tipos de fuerzas policiales están disponibles, pero en el horario t = 2 no aparecen patrullas (tipo k = 3).
Enfoque heurístico de solución para el problema de máxima cobertura con tipos de instalaciones
Para solucionar el modelo propuesto se puede usar un enfoque exacto o heurístico. Como el DMCLP-FT es un modelo lineal, para algunas instancias, se puede resolver de manera exacta usando CPLEX. 23 Sin embargo, al ser NP-Duro conviene usar metaheurísticas.
El enfoque heurístico publicado en Porras C 21 se define por la representación de una solución en una lista de tamaño 𝑇 ∗ 𝐽 con variables enteras, donde 0 significa que la instalación está cerrada y 𝑘 que está abierta con el tipo 𝑘. Las instalaciones a abrir de cada tipo 𝑝𝑘 son repartidas por todos los periodos.
Para la solución inicial se desarrolla un enfoque ávido (HA) que abre las instalaciones que más cubren. Para ello, los tipos fueron ordenados descendentemente según 𝑆𝑘 y se van abriendo las instalaciones entre todos los periodos, hasta 𝑝𝑘. Por cada instalación abierta, se actualizan los nodos de demanda cubiertos.
Se usaron 4 operadores para explorar soluciones: NSS1-FT que intercambia una instalación abierta con una cerrada en distintos periodos, NSS2-FT lo hace en el mismo periodo, NSS3-FT hace varios intercambios y NSS-O-FT realiza un intercambio de 2 instalaciones abiertas. Para usar el algoritmo genético se propuso un cruzamiento en un punto con reparación de soluciones. 24 Para la validación, solución y aplicación del DMCLP-FT se implementó un componente informático utilizando la biblioteca BiCIAM. 21,25
Función objetivo del de máxima cobertura con tipos de instalaciones
Para calcular la función objetivo del DMCLP-FT se usa evaluación parcial 26 y descarte eficiente, 27 donde se intenta no realizar cálculos innecesarios. La manera convencional de calcular la función objetivo tiene complejidad (𝐼 ∗ 𝑝). 3 Las propuestas que se presentan también tienen una complejidad (𝐼 ∗ 𝑝) en el peor caso, pero mejoran mucho el tiempo de ejecución en el caso promedio.
Para ello, se deben guardar las posiciones de las instalaciones que cambiaron con el NSS1-FT y NSS2-FT, y solamente evaluar los nodos de demanda que se vieron afectados por los operadores. No afectan las demandas cubiertas por instalaciones que se mantienen abiertas y las no cubiertas por ninguna de las instalaciones afectadas. Cuando se emplea descarte eficiente también se eliminan las demandas según se van cubriendo. El algoritmo fue publicado en Porras C, 2021 y Porras C et al. 2021. (21,28
Otros resultados para extender la aplicabilidad del modelo
Se han desarrollado otros aportes que extienden el núcleo del DMCLP-FT propuesto:
familia de posibles soluciones con disponibilidad de las instalaciones desde una perspectiva difusa; 29
asignación de la demanda a instalaciones capacitadas; 30
herramientas que implementan las soluciones propuestas y facilitan su empleo en condiciones reales, con particular énfasis en las aplicaciones para la seguridad y el orden interior. 31,32
Modelos del de generación de itinerarios turísticos con factores de recomendación dependientes del tiempo
Aquí se refine el modelo de un caso particular (con un itinerario y sin ventanas de tiempo) del caso (TTDP por sus siglas en inglés) propuesto en Yu VF et al., 19 con factores de recomendación dependientes del tiempo y con tiempos de espera (WT), y se propone una adecuación para no considerar los tiempos de espera (NWT). La idea es saber si para un conjunto de instancias es necesario considerar tiempos de espera, ya que la inclusión del factor de recomendación dinámico aumenta la complejidad del modelo. Los resultados fueron publicados en Porras C et al. (33
Modelo general
Los parámetros y variables generales son: 33
𝑁 = 1, 2, . . ., 𝑛: conjunto de nodos donde 1 y 𝑛 son los nodos de inicio y final del itinerario, respectivamente,
𝑇: número de periodos de tiempo,
𝑆𝑖: puntuación del POI 𝑖,
𝑓𝑖𝑡: factor de recomendación del POI 𝑖 en el periodo 𝑡,
𝑇𝑚𝑎𝑥.: tiempo máximo de duración del itinerario,
𝑡𝑖𝑗: tiempo de viaje desde el POI 𝑖 al 𝑗,
𝑣𝑖: tiempo de visita en el POI 𝑖,
𝑏𝑡: hora de inicio del periodo 𝑡,
𝑒𝑡: hora de finalización del periodo 𝑡,
𝑀: una constante muy grande,
𝑎𝑖 ∈ [0, 𝑇𝑚𝑎𝑥.]: tiempo de llegada al nodo 𝑖,
𝑋𝑖𝑗 ∈ {0,1}: 1 si hay un camino desde el POI 𝑖 al 𝑗 en la ruta, 0 en caso contrario,
𝑌𝑖𝑡 ∈ {0,1}: 1 si la visita al POI 𝑖 comienza en el periodo 𝑡, 0 en caso contrario.
Cuando un turista llega a un POI y el tiempo de visita se ha consumido, hay 2 alternativas: salir inmediatamente hacia el siguiente POI; o esperar un cierto tiempo, llegando al siguiente POI en un periodo de tiempo con un factor de recomendación más alto. La figura 2 muestra 2 itinerarios: el B es un itinerario que permite tiempos de espera, mientras que el A no. El factor de recomendación del POI 4 en el segundo periodo es 0,5; mientras que es 0,75 en el tercero. Si se permiten los tiempos de espera, un turista que sigue el itinerario B retrasa la llegada al POI 4 para obtener un mayor interés. El interés del itinerario A es 110, mientras que el del B es 112,5. 33
A continuación, se presentan las características específicas de cada modelo.
Modelo con tiempo de espera
En este modelo el turista puede esperar un tiempo para llegar a un POI en un periodo en el que su factor de recomendación sea mayor (ecuación 8): (33
Sujeto a: (ecuación 9, ecuación 10 , ecuación 11 , ecuación 12 , ecuación 13 , ecuación 14 , ecuación 15 , ecuación 16)
La función objetivo (8) maximiza el interés total del recorrido. Las restricciones controlan el cumplimiento de las condiciones del problema. 33
Modelo sin tiempo de espera
Este modelo considera la función objetivo (8) y las restricciones (ecuación 9, ecuación 10 , ecuación 11 , ecuación 12 , ecuación 13 , ecuación 14 , ecuación 15 , ecuación 16). Para garantizar que no exista tiempo de espera y se llegue al POI 𝑗 desde el POI 𝑖 exactamente en el instante 𝑎𝑗 = 𝑎𝑖 + 𝑡𝑖𝑗 + 𝑣𝑖, se añade la restricción (17): 33
Enfoque de solución
Las variantes de TTDP han sido resueltas usando métodos exactos y aproximados. 15 En este trabajo se decidió resolver el WT y NWT de manera exacta, ya que el objetivo es evaluar si hay una repercusión significativa entre la inclusión o no de tiempos de espera. En trabajos futuros se abordarán soluciones aproximadas del problema ya que siendo NP-Duro, no se pueden usar métodos exactos siempre. 33
Resultados
Solución del problema de máxima cobertura dinámico con tipos de instalaciones con disponibilidad variable en el tiempo
Rendimiento de la función objetivo con evaluación parcial y descarte eficiente
Para probar la eficiencia (tiempo de ejecución) de la función objetivo con evaluación parcial y descarte eficiente (EPD) se presentan los resultados de la ejecución sobre un conjunto de instancias, para compararlas con la función original (FO), en el MCLP y MCLP dinámico (DMCLP). Los resultados fueron publicados en Porras C, 2021, Porras C et al. 2021. 21,28 Este experimento provee el análisis del caso promedio de EPD usando el escalador de colinas como metaheurística con los operadores NSS1-FT y NSS2-FT. Se empleó una adaptación del conjunto de instancias de prueba del TSP 34 descritas en Porras C et al. 28
La figura 3muestra el porcentaje de tiempo de ejecución promedio que representan las funciones EPD del MCLP y DMCLP con respecto a FO. La EPD ahorra como promedio alrededor de un 85 % de tiempo para el MCLP y un 89 % para el DMCLP, siendo entre 6 y 9 veces más rápidas. 21,28
Análisis del rendimiento del enfoque heurístico
En esta sección se describen los resultados de los algoritmos propuestos para resolver varias instancias del DMCLP-FT. 21 A continuación, se describen los resultados de la aplicación de los algoritmos propuestos para resolver un conjunto de instancias del DMCLP-FT. El objetivo es evaluar el rendimiento de los algoritmos. Se comparan 6 algoritmos: algoritmo genético (AG), búsqueda en una vecindad variable (BVV), escalador de colinas (EC), heurística ávida (HA), recosido simulado (RS) y el portafolio de algoritmos (PA), el cual está compuesto por los algoritmos anteriores. Todos los algoritmos usan HA para crear la solución inicial.
Se crearon 60 instancias similares a los presentados en la literatura, como el propuesto en Zarandi MF et al. 35 como G2 y los datos del TSP 34 como G1. Para cada grupo se aplicó una distribución de tipos de instalaciones diferente: en el primer grupo (D1) para cada periodo se consideró que el 70 % de J tiene disponible el tipo k = 1, 50 % con k = 2 y 30 % con k = 3. Para el segundo grupo (D2), en t = 1 y t = 2, todas las instalaciones se pueden abrir con cualquier tipo, en t = 3 y t = 4 la distribución de los tipos disponibles es la misma que D1 y en t = 5, las instalaciones solo se pueden abrir con k = 1.
Para medir el rendimiento de los algoritmos se calcularon varias métricas: promedio de evaluaciones de la función objetivo y brecha (Gap) con respecto a la mejor solución encontrada por la herramienta CPLEX 12.6.1 23) usando 1 h como límite.
La prueba de Friedman mostró diferencias significativas entre los algoritmos. Todos los algoritmos lograron mejorar la solución de la HA. El mejor ranking en el escenario global para G1 fue obtenido por la búsqueda en una vecindad variables (BVV) con 2,1 y para G2 fue obtenido por el EC y la BVV con 2,2.
En la figura 4 se presentan los valores de la métrica Gap (eje y) por cada instancia (eje x) para la mejor solución encontrada por cada algoritmo. Se puede observar que los algoritmos de manera general lograron una calidad cercana a la obtenida por CPLEX, no rebasando el 0,07 valor de Gap (21) en las mejores soluciones de cada instancia.
Solución del modelo con tiempo de espera y sin tiempo de espera
Se describen los resultados de la solución de las versiones WT y NWT, publicados en Porras C et al. 33 El objetivo es evaluar en un conjunto de instancias el impacto en la calidad de las soluciones cuando se toma en cuenta el tiempo de espera según: la calidad de las soluciones, tiempo de ejecución, y la similitud/diferencias entre las soluciones. Los experimentos computacionales estudiaron 27 instancias 33 usando CPLEX 20.1.0 23 con un tiempo computacional máximo de 1 h guardando el mejor valor. Se utilizó la distancia Damerau-Levenshtein 36 para medir la similitud entre soluciones (figura 4). 33
La herramienta CPLEX en la figura 5B no alcanzó los valores óptimos en instancias grandes (≥ 80 POI) en el modelo WT, y en el NWT sí lo logró en las de 80 POI. No hay diferencias relevantes en los valores de la función objetivo. 33 CPLEX (figura 5A) tardó más en resolver el modelo WT en la mayoría de los casos. Los valores de similitud (figura 5C) muestran que las soluciones son similares: en 18 casos los valores de similitud fueron superiores a 0,5 y solo en un caso fue inferior a 0,25. 33
Discusión
Un efecto positivo de los nuevos modelos es que permiten modelar mejor la realidad. En el DMCLP-FT el comportamiento de los datos a lo largo de cualquier periodo de tiempo es tomado en cuenta a través del parámetro 𝑊𝑗𝑡𝑘. Tanto la programación lineal como el enfoque heurístico respetan las restricciones del DMCLP- FT. El algoritmo BVV con HA fue el más efectivo. Las metaheurísticas obtienen valores cercanos al de CPLEX.
En el caso del TTDP se comprobó que el modelo WT recrea adecuadamente la realidad y que al adicionar el modelo NWT se comprueba que no es necesario el tiempo de espera en las instancias analizadas, mejorando así la eficiencia. Usando la solución exacta, se evaluaron las 2 opciones de modelos, lo cual si no existiera el dinamismo no tendría sentido. Una versión de TTDP sin el parámetro dinámico de los factores de recomendación no necesitará evaluar los tiempos de espera, ya que tendrá el mismo efecto llegar antes o después a un POI, manteniendo el mismo interés. Por tanto, al incluir los factores de recomendación dependientes del tiempo, era necesario valorar el momento en que se llegaba a un POI.
Conclusiones
A partir del trabajo realizado, se concluye que:
El DMCLP-FT incluye dinamismo y tipos de instalaciones, donde la inclusión de 1 nuevo parámetro y 4 restricciones permitió manejar la disponibilidad variable de los tipos de instalaciones en el tiempo.
El enfoque de solución del DMCLP-FT usando metaheurísticas permite solucionarlo de manera aproximada y eficiente, y la BVV con la HA fue el de mejor rendimiento.
La inclusión de evaluación parcial y descarte eficiente en la función objetivo del problema ahorra aproximadamente de 80 % del tiempo. Aunque las soluciones obtenidas con el modelo WT son teóricamente mejores que las obtenidas con el modelo NWT en el 78 % de las instancias usadas las puntuaciones son iguales, su estructura es similar y con el NWT se obtienen más rápido.
El uso de los tiempos de espera en el WT no está justificado, al menos en las instancias de prueba seleccionadas.