viernes, 17 de diciembre de 2010

Herramienta de minería de datos (Analizando un Carrito de compras)

Este ejemplo muestra cómo aplicar un análisis sencillo para analizar un carrito de compras, para lo cual se utilizo SQL Server 2008 con la base de datos de prueba de AdventureWorks y los complementos de Minería de datos add-In de Excel.
Para hacer el análisis del carrito de compras se usara el algoritmo de reglas de asociación de Microsoft para detecta la relación de elementos que con frecuencia se compran juntos, esta análisis le puede ayudar a crear recomendaciones para  grupos asociados, a diseñar la posición del producto y a avaluar el impacto sobre su cuenta de resultados.
Por ejemplo, si está analizando todos los pedidos recibidos mediante un sitio web, cada pedido tendría un identificador de pedido o un identificador de transacción asociado con uno o más elementos de compras.
Los elementos que se ocupan para hacer este análisis generalmente son el Id de la Transacción (Número de Orden), ítem (Categoría del producto) y opcionalmente se puede utilizar el valor del artículo.
Al ejecutar el análisis con el add-in de Excel se puede observar que éste arroja dos resultados
·         Elementos incluidos en la cesta de la compra.
·         Recomendaciones para la cesta de la compra.
Elementos incluidos en la cesta de la compra
Este reporte identifica los patrones de los datos y enumera los elementos que aparecen frecuentemente en las transacciones, también muestra que elementos están comprando juntos los clientes y el valor para su compañía.

La primera fila podemos observar los clientes que compran conjuntamente bicicletas de carretera y cascos. El resultado muestra el primer elemento, porque es el de más valor (Número de ventas en relación al valor promedio de venta, lo cual nos da valor global del lote).
La fila nos indica que 805 clientes unieron estos dos elementos con un valor promedio por venta de $1,570.00 con un valor total para la compañía de $1,263,850.00
La segunda fila nos indica que 569 clientes unieron bicicletas de montaña de poleas y neumáticos, con un valor de venta de $2,208.00 con un valor total para la compañía de aproximadamente $1,250,000.00
Podemos observar que este lote tiene un valor por venta superior al primero, pero se produce con menos frecuencia y por tanto tiene menos valor para la compañía.
Una manera que tiene la compañía de usar esta información es que cuando un cliente compra una bicicleta de carretera, el sitio web puede recomendar automáticamente un casco.
Además, cuando un cliente compra una bicicleta de montaña, el sitio web puede recomendar automáticamente poleas y neumáticos.
Recomendaciones para el carrito de compras
El siguiente informe usa los datos estadísticos derivados del análisis para crear reglas acerca de cómo se relacionan los elementos.

Por ejemplo, una regla podría ser que si los clientes compran limpiadores es muy probable que compren poleas y neumáticos. Las reglas se pueden usar para crear recomendaciones.
Cada regla tiene datos estadísticos de apoyo que le ayudan a evaluar la fuerza potencial de la regla, para que pueda hacer una recomendación solamente si la regla supera un determinado umbral de probabilidad.
Al revisar este informe, resulta interesante que unir poleas y neumáticos sea la recomendación de máximo valor en cuatro productos diferentes.
Hay que tener muy en cuenta que los lotes se clasifican en función al valor general de las ventas, por lo que el valor promedio más grande no es necesariamente la recomendación más elevada.

3 comentarios:

  1. Excelente entrada, me ha dejado algo más claro el concepto y sobre todo la aplicación de la minería de datos. además que siempre es interesante conocer herramientas que faciliten el trabajo lo que es la intención principal del post. felicidades

    ResponderEliminar
  2. genial entrada, cuando creas un estructura de minería de datos dentro de analysis services que selecciono, para eso el cubo ya debe estar deployado.

    ResponderEliminar