martes, 12 de octubre de 2010

Data Werehouse y servicios OLAP (arquitectura, conceptos y soluciones)

Los sistemas de data werehouse se han convertido un una pieza clave en el componente de la información en los sistemas de arquitectura, en el cual la información juega un papel crucial al construir sistemas para la toma de decisiones. Mediante la recolección y consolidación de una variedad de datos de fuentes internas y externas de información, el data werehouse a intentado proveer una homogeneidad en la información básicamente para la planificación y toma de decisiones. Recientemente somos testigos de lo rápido que han ido creciendo el numero de productos de almacenamiento de datos y servicios que se ofrecen dia con dia, así como la aceptación de estas tecnologías por parte de la industria.

Dentro pocos años, el data werehousing se ha enfrentado a cambios enormes desde simples repositorios centralizados usados para almacenar transacciones de dinero en efectivo hasta plataformas para la integración de los datos, federación, y análisis sofisticados. Ahora en dia, las tecnologías con data werehousing se utilizan con mucho éxito en las industrias, incluyendo la fabricación al pormenor, servicios financieros, la banca, la telecomunicación, el cuidado de la salud y así sucesivamente.

La tecnología de data werehousing esta actualmente muy activa en el campo de la investigación. Los problemas de investigación asociados con la creación, mantenimiento, y uso de la tecnología de data werehouse son particularmente similares a los específicos de las bases de datos. De hecho, data werehouse se puede considerar como el “gran” sistema de bases de datos con funcionalidad adicional. Sin embargo, los problemas conocidos como la selección de índices, el particionado de los datos, la integración de datos, la optimización de las consultas, han recibido una atención renovada en el almacenamiento de investigación. Algunos problemas de investigación son específicos para el data werehousing: la adquisición de los datos y la depuración de los datos, la actualización de los datos, y la evolución del esquema data werehousing, la calidad del manejo de los datos, etcétera. Por lo que es importante conocer las nuevas tendencias y el futuro del desafío en el contexto de los sistemas de próxima generación de almacenamiento de datos.

Es importante conocer algunos aspectos el modelamiento y diseño de sistemas de data werehousing.

Ahora en dia la economía esta caracterizada por el rápido y continuo cambio de mercados y oportunidades de negocios. Por lo tanto, con el fin de tener éxito es esencial para una empresa tomar las decisiones de negocio de una manera correcta y rápida. La toma de decisiones en los negocios se basa en el análisis del pasado y las condiciones actuales de una empresa, además del análisis de mercado y las predicciones del futuro. Para este fin, varias colecciones de datos de una empresa son analizadas. Típicamente, la operación de los datos son almacenados dentro de una empresa en los sistemas de almacenamiento (subsistemas) que se encuentran geográficamente distribuidos, los cuales son heterogéneos y autónomos.

La heterogeneidad del almacén de los datos significa que ellos provienen de diferente proveedor de software, los cuales son implementados en diferentes tecnologías (C, C++, .NET, Java), estos ofrecen diferentes funcionalidades (bases de datos, bases de datos ODBC, páginas web, archivos de texto.) y estas usan diferentes modelos (base de datos relacionales, orientadas a objetos, semi-estructuradas, etc.) y diferentes técnicas de almacenamiento, los cuales a su vez son instalados sobre diferentes sistemas operativos, usando protocolos de comunicación diferentes.

La autonomía del almacenamiento de los datos implica que ellos son a menudo independientes desde entre si y permanecen bajo control separado e independiente; esto es, un administrador del sistema local puede decidir cuales datos locales están disponibles desde afuera del sistema.

La gerencia de una empresa requiere una completa vista de todos los aspectos de la compañía, por consecuencia esto requiere acceso a todos los posibles datos de interés almacenados en múltiples subsistemas. Sin embargo, un análisis del almacenamiento de los datos en la distribución, heterogeneidad, y subsistemas autónomos es probable que sea difícil, lento e ineficiente. Por eso, la habilidad para integrar la información desde múltiples fuentes de datos es crucial ahora en dia para los negocios.

Uno de los mas importantes enfoques para la integración de las fuentes de datos es basado sobre la arquitectura de data werehouse. En esta arquitectura, los datos provienen desde múltiples bases de datos externas (EDS) que son extraídas, filtradas, fusionadas, y almacenadas en un repositorio central, a lo que se llama data werehouse (DW). Los datos son también enriquecidos por información recopilada e histórica. Desde un punto de vista tecnológico, el data werehouse es una enorme base de datos de varios miles de Gigabytes por varias docenas de Terabytes. Gracias a esta arquitectura, los usuarios operan sobre un local, homogéneo, y centralizado repositorio que reduce el tiempo de acceso a los datos. Por otra parte, los datos son independientes a las EDSs que pueden estar temporalmente no disponibles. Sin embargo, el data werehouse tiene que mantenerse hasta la fecha con respecto al contenido de las EDSs, para ser periódicamente renovada.

El contenido de un data werehouse es analizar para llamar en línea el proceso analítico (OLAP) de las aplicaciones para el propósito de descubrir tendencias, patrones de comportamiento, y anomalías, así como para encontrar dependencias ocultas entre los datos. Los resultados de esos análisis son entonces la base para hacer varias decisiones de negocios. El análisis de mercado de demanda y abastecimiento es uno de los importantes pasos en tomar decisiones estratégicas de los negocios. Del mismo modo, un análisis de la evolución y el curso de enfermedades, así como el impacto de diferentes medicamentos en el campo de las enfermedades es indispensable a fin de elegir los métodos mas eficaces de tratamiento. Muchas otras aplicaciones incluyen, entre otras, el mercado de valores, la banca, las aseguradoras, el manejo de la energía, y la ciencia. El Data werehouse y las aplicaciones con servicios OLAP son el componente núcleo de los sistemas para la toma de decisiones.

Desde finales de 1980, cuando la tecnología del data werehouse se desenvolvió, la mayoría de las grandes y medianas empresas en todo el mundo han estado construyendo sus propio data werehousing en sus sistemas de infraestructura de información y han sido exitosos en aplicar tecnología en los negocios. Importantes manejadores bases de datos comerciales están disponibles (Oracle 10g, Sysbase IQ, MS SQL Server, SAP Business Werehouse, etc.) Incluyendo el Data werehousing y la tecnología OLAP en sus motores de bases de datos. Sin embargo, a pesar de que hay algunos logros importantes en esta tecnología, todavía es y será una investigación muy atractiva en el campo de la tecnología.

1 comentario:

  1. ¿Es tu reseña de libro este? En reseñas, es un costumbre indicar de cuál libro son :P

    ResponderEliminar