Machine Learning, Data Science y Segmentación de clientes.

Como les vengo contando en los distintos posteos semanales combinar Data Science y Machine Learning para trabajar los datos que las empresas tienen y no le están sacando provecho.

Hoy hablaremos de segmentar los clientes en base a 3 variables. Frecuencia de compra, unidades compradas y facturación.



  1. Segmentación de clientes

  2. Programa para segmentación de clientes

  3. Sistema de clasificación de clientes

  4. Sistema de recomendación de productos

A la base de datos histórica de ventas vamos a extraer estar 3 columnas y sumamos numero de cliente y razón social. Pueden ser los últimos 3,5,10 años. Lo que tengan.

En HGDAY desarrollamos un modelo de segmentación y clasificación de clientes basados en el alegorismo Kmeans.

Por ser un Algoritmo No Supervisado es necesario definir el número de Clústers antes de ejecutar el Algoritmo, pudiendo repetirse la ejecución para diferentes números de Clústers y comparar los resultados obtenidos

El objetivo:

Segmentar la Cartera de Clientes con el fin de encontrar Patrones Comunes que se puedan explotar mediante Marketing focalizado


Proceso de segmentación




Que obtenemos:

Clúster: Numero de clúster

Facturación: Valor promedio de facturación del clúster

Frecuencia: Valor promedio de frecuencia de compra del clúster.

Unidades: Valor promedio de compra de unidades del clúster.

% Facturación: Peso de la facturación generada por el clúster.

% Clientes: peso de la cantidad de clientes que pertenecen al clúster.




Descripción de los segmentos:

  • Clientes usuarios: Clientes con frecuencia y con facturación alto. Estos Clientes son muy importantes para la empresa y no se pueden perder, por lo que hay que intentar diseñar estrategias para fidelizarlos al máximo.

  • Clientes potenciales: Comparado con el segmento anterior, estos Clientes tienen una frecuencia y facturación inferior, aunque significativo. Se diseñaran campaña de Marketing con el fin de “subirlos ” hacia el segmento Usuarios.

  • Clientes Nuevos/poco usuarios: Clientes que hace poco compraron por primera vez o que tienen baja frecuencia de compra. Hay que convertirlos, aunque sea una parte, en Clientes más frecuentes/fidelizados de cara al futuro.

  • Clientes con Baja Frecuencia, unidades bajas y facturación baja: Estos Clientes se podrían considerar prácticamente perdidos. En este caso, se diseñarán activaciones de Marketing para volver a atraer su atención hacia los productos de la empresa.

Podemos ampliar el modelo añadiendo más variables:



Luego con el mismo algoritmos podemos calificar un nueva clientes con solo suministrar los datos de las 3 variables.




Por último, podemos generar un sistema de recomendación de productos a nuestros clientes en forma personalizada.





Espero que les resulte de utilidad. Próximamente estaremos subiendo un archivo con el algoritmo para que lo bajen y puedan hacer ustedes mismo este trabajo.