martes, 14 de diciembre de 2010

Herramienta de Minería de Datos (Pronosticos)

SQL Server Business Intelligent Developer

Los complementos de minería de datos de SQL Server 2008 para Office 2007 proporcionan asistentes y herramientas que facilitan la tarea de extraer información significativa de los datos. Con ellos podrá obtener tendencias y patrones que se encuentran ocultos en datos complejos, visualizar dichos patrones en gráficos y visores interactivos y, por último, generar resúmenes completos y coloridos para presentaciones o análisis comerciales. Puede analizar correlaciones y ejecutar predicciones con los datos almacenados en tablas de Microsoft Office Excel, así como crear y modificar modelos de minería de datos almacenados en una instancia de SQL Server 2008 Analysis Services.

Introducción a la predicción y el análisis

Si ésta es la primera vez que usa la minería de datos, conviene que comience con las Herramientas de análisis de tabla para Excel, que incluyen herramientas fáciles de usar para las tareas siguientes:
·         Analizar los factores que influyen en un resultado
·         Buscar categorías en los datos
·         Rellenar con valores basados en los ejemplos proporcionados
·         Realizar predicciones basadas en una serie
·         Identificar valores potencialmente erróneos en los datos
·         Realizar análisis Y si
·         Identificar requisitos para alcanzar un objetivo especificado
·         Crear una hoja de cálculo que se pueda usar para calcular puntuaciones
·         Analizar patrones de productos que habitualmente se compran juntos.
En este ejemplo vamos a usar la herramienta Pronostico del Add-In de Microsoft  de SQL Server 2008 que usa el algoritmo de series de tiempo de Microsoft para predecir valore futuros basándose en las tendencias de los datos de series temporales existentes en los siguientes meses de una compañía basándose en las condiciones actuales y en otros factores de sus datos.
Ejercicio básico de pronóstico
El objetivo es pronosticar las ventas en Europa y Norteamérica.
En este ejemplo haremos un pronóstico del potencial de compra de bicicletas a partir de un nuevo conjunto de datos de los clientes teniendo en cuenta las características de los actuales compradores de bicicletas en base al siguiente conjunto de datos:

Puntos a considerar
·         Cabe mencionar que esta herramienta utiliza el algoritmo para series temporales de Microsoft.
·         Un dato interesante es que este algoritmo no puede usar las herramientas pronóstico para predecir una fecha.
·         Como podemos ver en la siguiente grafica estos los valores de la tabla muestran las nuevas predicciones, en una columna nueva, al final de la tabla de datos de origen.

·         La grafica contiene dos tipos de línea, la continua es la tendencia en base a los datos descriptivos y la línea punteada muestra la predicción de los datos en base a algoritmos para obtener la inferencia.
·         En algunos casos, la predicción puede no tener tantos segmentos como se solicita, esto significa que los datos eran insuficientes para habilitar el algoritmo para pronosticar hasta ese punto del futuro.
·         La herramienta Pronóstico solamente hará predicciones que cumplan con un umbral mínimo de probabilidad.
·         También hay que observar que no hay etiquetas para valores predichos. Esos valores los podemos agregar en la hoja de cálculo de manera manual.

1 comentario:

  1. Estoy suponiendo que es la entrada de la semana 7 y te pongo 6 puntos. Sería más interesante tener datos que sabemos qué significan y también el saber sí o no estuvo bien el pronóstico.

    ResponderEliminar