INTRODUCCIÓN
El complejo dinamismo en el que se desenvuelven las empresas comercializadoras y en específico las mayoristas (también conocidas como B2B), las ha llevado a buscar una mejor comprensión del comportamiento de sus clientes a través de formas innovadoras de almacenar y analizar la información sobre estos (Khajvand, Zolfaghar, Ashoori, y Alizadeh, 2011).
En este sentido uno de los principales desafíos de la gestión de las relaciones con los clientes (CRM, por sus siglas en inglés) es establecer relaciones más duraderas y rentables con clientes (Kord y Tavoli, 2015), a través de la recopilación, almacenamiento y análisis de los datos del cliente para aumentar su lealtad, valor y los beneficios organizacionales (Kandeil, Saad y Youssef, 2014).
Con el surgimiento de las tecnologías de la informática y las comunicaciones han ocurrido cambios importantes en la capacidad de las organizaciones para recopilar, almacenar y analizar grandes conjuntos de datos. Por lo tanto, se pueden almacenar más de miles de datos para cada cliente, lo que permite el análisis su historial de compras (Miguéis, Poel, Camanho y Cunha, 2012). Para comprender e identificar a los clientes según el valor que representan para las organizaciones, estas deben segmentarlos según su comportamiento.
A fin de aumentar la satisfacción del cliente y evitar que abandonen la organización, esta debería centrarse en la segmentación y satisfacción de las necesidades individuales de ellos (Tsai, Hu y Lu, 2015).
En general la segmentación del cliente es el proceso de dividirlos en diferentes grupos según información geográfica, demográfica y etnológica, para adoptar estrategias adaptadas a cada grupo basadas en el consumo de bienes y servicios y compra de clientes (Tsai et al., 2015). El proceso de segmentación continua potencia la armonía en el valor de los clientes; junto con la detección y correcta colocación de estos en grupos relacionados, y es uno de los factores más esenciales en CRM y el éxito empresarial (Kandeil et al., 2014; Tsai et al., 2015). Dado que no existe un enfoque preferido para la segmentación de clientes, el mejor modelo es aquel que dibuja un adecuado conocimiento de clientes actuales y potenciales, y ayuda a las organizaciones para lograr mercados efectivos y apropiados.
Como contribución a dicha problemática este artículo se planteó como objetivo: proponer una metodología multicriterio para la clasificación de clientes, considerando algoritmos KNN como sustento para la planeación agregada, a partir de una modificación al modelo RFM.
DESARROLLO
El modelo RFM
El modelo más utilizado en la segmentación del cliente es el denominado RFM, que consta de tres variables de comportamiento: R (actualidad), F (frecuencia) y M (monetario) (Kandeil et al., 2014). Su método general se expresa a continuación:
Se establece una escala de 5 elementos para cada indicador (desde 1 hasta 5) siendo 1 el mejor caso y 5 el peor. La combinación ideal de cliente será el que cumpla con la combinación 111 y el peor 555.
Se construye una tabla en la que se muestren los elementos clasificados en 1 y 2 los mejores, 4 y 5 los peores y 3 los promedios.
No obstante, el modelo RFM en la mayoría de los casos requiere de mejoras para adecuarse a condiciones específicas, por lo que múltiples estudios intentan mejorar y desarrollar el modelo al incluirle otras variables (Moghaddam, Abdolvand y Harandi, 2017). Este modelo intenta identificar a los clientes en función del comportamiento de sus características (Chen, Kuo, Wu y Tang, 2009; Noori, 2015; Silva, Varela, Borrero y Rojas, 2019). Este comportamiento es modelado con el empleo de tres criterios de transacciones de clientes, que son entonces interpretados por herramientas y algoritmos de minería de datos.
Por lo tanto, el modelo RFM predice los próximos movimientos del cliente basados en su comportamiento (Asllani y Halstead, 2015). Además, no solo se considera como un modelo de segmentación, sino también incluye el concepto de valor del cliente. Es por eso que muchos estudios usan este modelo para el descubrimiento y análisis del valor del cliente basado en el comportamiento de compra pasado (Chen et al., 2009; Silva et al., 2019). Sobre la base del comportamiento de sus compras, el RFM revela que los clientes valiosos son aquellos que se manifiestan más recientemente, con la mayor frecuencia y valor monetario. A pesar de su simplicidad de comprensión, interpretación e implementación, el modelo tiene defectos, como la falta de atención a características personalizadas y variables demográficas de los clientes (Hosseini, Maleki, y Gholamian, 2010).
En este sentido, Chen et al. (2009) basaron su estudio en el modelo RFM aplicado a clientes segmentados de una empresa de servicios electrónicos en Taiwán. La clasificación se hizo con el propósito de agregar al modelo, la variable crédito de clientes. Después del agrupamiento de clientes con su algoritmo propuesto LEM2, extrajeron reglas importantes para la toma de decisiones de marketing y así potenciar las estrategias de la empresa. Por otra parte, Khajvand et al. (2011) en su estudio en la industria cosmética, han clasificado y valorado a clientes según la cantidad de productos comprados por estos, junto con otras variables de comportamiento. En este mismo contexto Noori (2015) agregó la variable del depósito del cliente al modelo RFM para clasificar dispositivos móviles de los usuarios bancarios. Indicó que identificar clientes por una puntuación de comportamiento facilita la asignación de estrategias de marketing.
Esos estudios emplearon el enfoque minorista (B2C); sin embargo, otros han realizado estudios en el campo mayorista (B2B). Una de las características más interesantes en el campo de B2B lo constituye que la empresa obtendrá grandes ganancias del gran volumen de compras al realizar ventas en la mayoría de los casos por lotes. Por lo tanto, entender a los clientes en este tipo de organizaciones sería la clave del éxito.
Otros como Hosseini et al. (2010) han agregado el ciclo de vida del producto/duración del producto como variables al modelo RFM y clasificaron los clientes en 34 categorías en una empresa B2B. Por su parte, Kandeil et al. (2014) emplearon técnicas de agrupamiento para segmentar clientes de un distribuidor B2B. Más recientemente Moghaddam et al. (2017) adicionaron la variable de variedad de productos como una nueva variable de comportamiento en el modelo RFM, y para clasificar a los clientes de la empresa de tipo B2B.
En este artículo se muestra una modificación al modelo RFM con el fin de incluir la variable tiempo de concurrencia para determinar qué clientes solicitan productos en el mismo horizonte de tiempo, cuestión fundamental para poder desagregar desde la planeación recursos de las organizaciones de tipo B2B.
Diferentes técnicas y formas del análisis de datos se pueden usar para la segmentación de clientes; aunque los más comunes son el uso de técnicas de minería de datos y variables de comportamiento del cliente. La minería de datos es el proceso de descubrir y extraer patrones ocultos de grandes cantidades de datos (Kord y Tavoli, 2015). Uno de sus algoritmos de clasificación más eficientes lo constituye el K-Nearest Neighbor.
Clasificador K-Nearest Neighbor
El algoritmo K-Nearest Neighbor (KNN) es uno de los métodos más simples para resolver problemas de clasificación; a menudo produce resultados competitivos y tiene ventajas significativas sobre otros métodos de minería de datos. Se ha demostrado que es capaz de superar algunos de los problemas asociados con otros algoritmos disponibles. Según Adeniyi, Wei y Yongquan (2016) entre sus características se encuentran:
Superar el problema de escalabilidad común a muchos métodos de minería de datos existentes, como la técnica del árbol de decisión, a través de su capacidad para manejar datos de entrenamiento que son demasiado grandes para caber en la memoria.
El uso de la distancia euclidiana simple para medir las similitudes entre las tuplas1 de entrenamiento y las tuplas de prueba en ausencia de conocimiento previo sobre la distribución de datos, por lo tanto, facilita su implementación.
Reducción de la tasa de error causada por la inexactitud en los supuestos hechos para el uso de otra técnica, como la técnica de clasificación Bayesiana Naive, como la independencia condicional de clase y la falta de datos de probabilidad disponibles, que generalmente no es el caso cuando se utiliza el método KNN.
Proporcionar una recomendación más rápida y precisa al cliente con cualidades deseables, como resultado de la aplicación directa de similitud o distancia para fines de clasificación.
El algoritmo KNN se describió por primera vez a principios de la década de 1950. KNN es aplicable en muchos campos como el patrón reconocimiento, extracción de texto, finanzas, agricultura y medicina, entre otros (Imandoust y Bolandraftar, 2013). Es un algoritmo no paramétrico. No requiere ningún conocimiento previo sobre el conjunto de datos y supone que las instancias en los conjuntos de datos están distribuidas de forma independiente e idéntica, por lo tanto, las instancias cercanas entre sí tienen la misma clasificación (Pooja, 2017).
KNN también se conoce como estudiante perezoso porque en su fase de aprendizaje simplemente almacena todas las tuplas de entrenamiento que se le dan como entrada sin realizar ningún cálculo o solo hace un poco de procesamiento y espera hasta que se le dé una tupla de prueba para clasificar. Todos los cálculos o procesos se aplican al momento de la clasificación de una tupla de prueba. La forma más común es clasificar la tupla desconocida comparándola con tuplas de entrenamiento que son similares a ella. Cuando se le da una tupla desconocida, un clasificador de k-vecino más cercano busca en el espacio del patrón las t-vecinas más cercanas o las tuplas más cercanas a la tupla desconocida. La cercanía se define en términos de una distancia métrica (Han y Kamber, 2006). Para encontrar las tuplas de entrenamiento K más cercanas a la tupla desconocida se usa como medida la distancia euclidiana. La distancia euclidiana estándar d(x,y) es a menudo utilizada como la función de distancia.
A continuación, se proporciona la función de distancia euclidiana que calcula la distancia entre dos tuplas x e y.2
Donde n es el número de atributos totales y a es el valor del atributo en las instancias x (tupla de prueba) e y. Para la clasificación en este algoritmo se puede ponderar la contribución de cada vecino de acuerdo a la distancia entre el vecino y el ejemplar a ser clasificado (en nuestro caso x) y dando mayor peso a los vecinos más cercanos. Este cálculo se muestra en la siguiente ecuación.
Donde son los k vecinos más cercanos de x, k es el número de vecinos totales, de los cuales se busca los mejores valores (ar gmax), y en concordancia con que los valores se encuentren en vecindad como se expresa por , 1 si y 0 de lo contrario.
La elección de K es muy importante en la construcción del modelo KNN. Es uno de los factores más importantes de este modelo que puede influir fuertemente en la calidad de las predicciones. Para cualquier problema, un pequeño valor de K conducirá a una gran variación en las predicciones. Alternativamente, establecer K en un valor grande puede conducir a un sesgo de modelo grande. Por lo tanto, K debe establecerse en un valor lo suficientemente grande como para minimizar la probabilidad de clasificación errónea y lo suficientemente pequeña (con respecto al número de tuplas en el conjunto de datos) para que el punto K más cercano esté lo suficientemente cerca del punto de consulta. Cuando K = 1, a la tupla desconocida se le asigna la clase de la tupla de entrenamiento que está más cerca de él en el espacio del patrón (Han y Kamber, 2006). El valor de K suele ser números impares, es decir, K = 1, K = 3, K = 5, esto es concebido para evitar los lazos3 (Adeniyi et al., 2016).
Su empleo en la clasificación es ampliamente reconocido como efectivo y como se muestra en Geler, Kurbalija, Ivanović y Radovanović (2020) puede emplearse con éxito en la clasificación de series temporales. Por otra parte, en la regresión logística y combinado con el algoritmo Random Forest se evidenció su empleo exitoso en Shah, Patel, Sanghvi y Shah (2020). Igualmente se utiliza con éxito como método de detención de anomalías como demostraron (Sarmadi y Karamodin, 2020). Más recientemente siguen aportes que atestiguan su vigencia y su evolución; de los que se consideran como relevantes pueden citarse a Jasmir, Nurmaini y Tutuko, 2021; Harinadha (2022) y Yikun, Zhibin, Dong (2022).
El procesamiento de grandes cantidades de datos para respaldar los procesos de decisión, requiere, aparte de algoritmos de clasificación, de metodologías para su aplicación industrial. En tal sentido la más aceptada es la CRISP-DM (Huber, Wiemer, Schneider y Ihlenfeldt, 2019).
Metodología CRISP-DM
CRISP-DM es una metodología de proceso independiente de la industria para la minería de datos (Huber et al., 2019), la cual, según Acosta, Janeth, Cuesta, Umaña y Coronado (2022) tiene gran aceptación para estudios de análisis de datos al no estar restringida a ninguna tecnología. Consta de seis fases iterativas de entendimiento del negocio hasta el despliegue (Tabla 1). CRISP-DM sigue un enfoque orientado a objetivos; se trata de un enfoque maduro que continúa siendo ampliamente aceptado en proyectos de minería de datos a través de algoritmos de aprendizaje automático de datos (Schröer, Kruse y Marx, 2021).
Entre sus reconocidas ventajas según (Huber et al., 2019) se encuentran:
gran capacidad para el descubrimiento de conocimiento a través del procesamiento de bases de datos;
prevé la especialización de acuerdo con un contexto predefinido.
Fase | Explicación |
---|---|
Comprensión del negocio | En ella se evalúa la situación del negocio para obtener una visión general de los recursos disponibles y necesarios. |
Comprensión de datos | En esta fase se efectúa la recopilación de datos de las fuentes de datos, su exploración, descripción y la verificación de su calidad. |
Preparación de datos | Se seleccionan los datos a utilizar atendiendo a criterios de inclusión y exclusión. |
Modelado | Consiste en seleccionar la técnica de modelado, construir el caso de prueba y el modelo. |
Evaluación | En esta fase los resultados se comparan con los objetivos comerciales definidos. |
Implementación | Se despliegan los resultados obtenidos. |
Fuente: Elaboración propia
Consecuentemente, en el presente artículo se empleó el algoritmo KNN para modelar y clasificar los comportamientos de compra de los clientes. Además, se utiliza la metodología CRISP-DM, que es uno de los mejores métodos analíticos para proyectos de minería de datos. El algoritmo KNN y la medida de la calidad de agrupación de siluetas se utiliza para medir y determinar el número de grupos. Esta operación se llevó a cabo en 739 registros normalizados de clientes con el uso del software SPSS.21. Luego se utiliza, el método de análisis jerárquico para ponderar las variables R, F, M, V, C, T y calcular el valor de cada cliente. Finalmente se ejecuta la prueba ANOVA en los grupos obtenidos, para determinar la significación de los datos conseguidos en ellos, utilizando el software SPSS.21.
Resultados
Basados en las seis fases con que consta la metodología CRISP-DM: comprensión empresarial, comprensión de datos, preparación de datos, modelado, evaluación y despliegue (Moro, Laureano y Cortez, 2011), se procede a mostrar el resultado de su aplicación en este estudio.
Fase 1. Comprensión empresarial
Descripción: en esta fase, se realiza la descripción general del tipo de negocio, en función del cual se realiza la investigación.
El estudio se ejecutó para la empresa ACINOX UEB Holguín comercializadora, la cual es de tipo B2B y su objeto es la comercialización de metales y derivados. Tiene como objetivo principal agrupar a los clientes en clusters, lo que contribuirá a poder tomar mejores decisiones sobre la planeación agregada que se requiere en dicha institución.
Con este fin los clusters se ordenarán según la ponderación jerárquica de las seis variables que componen el modelo RFMVCT, las cuales determinan agrupaciones sobre su fidelidad con la empresa, la frecuencia con que realiza sus compras, el valor patrimonial de los clientes, la variedad de productos que compran, la cercanía física a los almacenes de la empresa y el horizonte temporal en el cual concurren sus compras. Se hará especial énfasis en la variable, horizonte temporal en el cual realizan sus compras (T), la cual contribuye con mayor notoriedad a la agregación de los recursos que requiere una planeación agregada más eficiente, que permita satisfacer necesidades comunes por grupos de clientes.
Fases 2. Comprensión de datos
Descripción: la segunda fase consiste en recopilar, describir y evaluar la calidad de los datos.
En general, el objetivo de esta fase es seleccionar la fuente de datos apropiada para alcanzar la meta (Moghaddam et al., 2017). Por lo tanto, se empleó la información disponible de la base de datos del sistema de gestión de la empresa ACINOX UEB Holguín. De esta se obtuvieron los datos de 53 clientes.
De estos datos se obtuvieron lo referente a las seis variables del modelo, las cuales se determinaron como se muestra en la Tabla 2. Y todo el conjunto de datos de salida se procesaron con el software Microsoft Excel versión 2019.
Variable | Forma de medida |
---|---|
Fidelidad con la empresa (R) | Tiempo, expresado en meses que lleva siendo cliente. |
Frecuencia con que realiza sus compras (F) | Cantidad de compras que realiza, expresada en unidades. |
Valor patrimonial de los clientes (M) | Valor monetario que reportan sus compras, expresado en unidades. |
Variedad de productos que compran (V) | Cantidad de productos que compra, expresado en unidades. |
Cercanía física (C) | Distancia requerida para la transportación de la compra, expresado en kilómetros. |
Horizonte temporal de compras. (T) | Momento en el año que realiza sus compras, expresado en cuartos*. |
*La planeación agregada requiere de un mínimo de tres meses para su concreción(Krajewski, Malhotra y Ritzman, 2018); en tal sentido se divide el año en cuatro trimestres y se asigna numéricamente el rango correspondiente al equivalente de una unidad (0,25; 0,5; 0,7; 1).
Fuente: Elaboración de los autores
Fases 3. Preparación de datos
Descripción: en esta fase se preparan los datos para el modelado.
La preparación de los datos incluye el proceso de exclusión de valores atípicos y normalización de datos. En este estudio se recopilaron 927 registros de los cuales, después de eliminar duplicados y datos incompletos, se redujeron a 739 registros de datos. Se utilizó el software SPSS.21 para identificar valores atípicos. Posteriormente, basados en el método MIN-MAX y con el uso de las fórmulas (1), (2), (3), (4), (5) y (6) se normalizan los índices en el rango de cero y uno para prepararse para el modelado (siguiente fase). Con este fin, estas fórmulas, MAX R , MAX M , MAX F , MAX V , MAX C y MAX T representan el valor más alto de cada variable; y MIN R , MIN M , MIN F , MIN V , MIN C y MIN T representa el valor más bajo en el conjunto de datos, que posteriormente se normalizan a los valores finales de R, M, F, V, C y T.
Fase 4. Modelado
Descripción: en esta fase se conforma y aplica el modelo.
Basado en el estudio de Moghaddam et al. (2017) -el cual desarrolla una solución similar a la requerida en este problema-, se determina el uso de tres clusters para resolver el problema de clasificación.
Valoración y determinación del modelo RFMVCT
Cada variable se pondera con el empleo de un análisis jerárquico el cual debe determinarse en orden para calificar y agrupar clientes. En este estudio se emplea un método de análisis jerárquico sustentado en Saaty (2001), para determinar los pesos de las variables R, F, M, V, C y T. Para este fin se pidió a los encuestados que hicieran parejas de comparación, y les asignaran un valor de 1 a 9 a cada índice.
Se consultaron a los especialistas comerciales de la empresa objeto de estudio y a su director. De acuerdo con la fórmula (7), se considera el valor total de 1 y un índice de inconsistencia de 0,1. El peso total de las variables se muestra en la Tabla 3.
Entonces, el valor de cada cliente (VC) es calculado en base a la fórmula (8).
En lo adelante se muestra todo el procedimiento para el conglomerado de la variable VC que es el resultado de la suma ponderada de todas las variables del modelo RFMVCT (Tabla 4). No obstante, el mismo procedimiento se desglosa para cada variable individual y se muestra en los resultados de la Fase 6.
Conglomerado | |||
1 | 2 | 3 | |
Puntuación R | 1,706 55 | -1,836 05 | 3,035 02 |
Puntuación F | 3,064 54 | -1,224 25 | 1,127 67 |
Puntuación M | -,3079 1 | -,502 81 | 3,650 11 |
Puntuación V | 1,647 54 | -1,298 83 | 1,647 54 |
Puntuación C | 1,877 15 | 1,433 32 | -,792 97 |
Puntuación T | -,333 81 | 1,435 38 | -,333 81 |
Puntuación VC | -,306 69 | -,501 97 | 3,650 06 |
Fuente: Elaboración de los autores
Después de determinar los pesos de las variables y el valor de todos los clientes, se procede a determina, de acuerdo con el valor medio de cada cluster, los rangos de clientes. Cada índice es determinado a partir de los datos extraídos en la primera fase.
A continuación se corrigen los centros de cada cluster. Esto se obtiene después de cinco iteraciones como se muestra en la Tabla 5 y de ahí, los conglomerados finales como aparece en la Tabla 6.
Una vez determinados los clusters, se procede a clasificar los clientes dentro de cada clúster, como se muestra en la Tabla 7, donde se visualiza el resultado de los conglomerados de la variable VC.
Fase 5. Evaluación
Descripción: en esta fase se prueba estadísticamente el modelo realizado y se muestran los resultados de su aplicación en el conjunto de datos.
Después de agrupar y analizar los resultados, la diferenciación de grupos creados por el algoritmo KNN y su resolución, se evalúa a través de la prueba ANOVA. Como se indica en la Tabla 8, los niveles de significación (sig) de todos variables: R (sig) = 0,000; F (sig) = 0,000; M (sig) = 0,000; V (sig) = 0,000; C (sig) = 0,095 y T (sig) = 0,030 son inferiores a 0,05, por lo tanto, la media de homogeneidad de las poblaciones se rechaza, y se muestra que los grupos tienen diferencias significativas.
Fase 6. Despliegue
Descripción: en esta fase los resultados son analizados en la empresa objeto de estudio.
Después de revisar los resultados y la valoración, el modelo es juzgado. Si los resultados son consistentes con el objetivo primario de los negocios, y parecen satisfacer las necesidades del negocio, entonces se utilizarán en un entorno real. Una nueva fase se definirá de otra manera y el proceso se repetirá. En la Tabla 9 se muestra un ejemplo con 10 clientes de la empresa del informe final, el cual potencia el desarrollo de la planeación agregada en la empresa objeto de estudio.
CONCLUSIONES
Los resultados de los conglomerados obtenidos de la variable VC dan una panorámica de los grupos de clientes con características similares, los cuales se ponderan en un conjunto de seis variables que tributan a VC. De esta forma quedan determinados los mejores clientes de la empresa.
Los conglomerados individuales de cada variable permiten tributar a la planeación agregada y así poder tomar decisiones en conjunto con distintas empresas y optimizar el proceso de venta para cada una de ellas desde una visión general.
Para la planeación agregada de la institución, se puede afirmar que:
Los conglomerados de clientes resultado de la variable C, permiten compartir recursos, específicamente transporte, ya que estos están agrupados según la distancia a los almacenes de la institución objeto de estudio.
Los conglomerados de clientes, resultado de la variable T, permiten compartir recursos (espacio de almacenamiento, transporte, entre otros) para cubrir sus demandas, ya que estas se realizan en un mismo horizonte temporal. En tal sentido la planeación agregada para los clientes 1, 3, 7 y 8 considera el primer trimestre del año; los clientes 2, 4 y 5 el cuarto; los clientes 6 y 10 el tercero; y el cliente 9 el segundo trimestre.