Desde su aparición, a mediados de los años ’70, las bases de datos (y la teoría sobre bases de datos) no se han detenido. Las primeras versiones de las bases de datos se centraron alrededor de un único repositorio sirviendo a todos los propósitos orientados al procesamiento de la información (desde el transaccional, pasando por el procesamiento batch, hasta lo analítico). En la mayoría de los casos, el principal foco de las primeras bases de datos fueron los sistemas operacionales o transaccionales.
En las últimas décadas, ha surgido una noción más sofisticada de las bases de datos. Por un lado, el objetivo de servir a las necesidades operacionales, y por otro, cubrir las necesidades analíticas de la información.
El mercado de Data Warehousing consiste de herramientas, tecnologías y metodologías que permiten la construcción, uso, manejo y mantenimiento del hardware y software usado tanto para un data warehouse como para los datos en sí mismos. Las encuestas y la realidad marcan que los proyectos de Data Warehousing (o asociados al concepto de Data Warehouse) son las mayores iniciativas después de finalizado los esfuerzos de Y2K. [Ree00a].
Los Data Warehouses (base de datos OLAP, on-line analytical processing) son diseñados para cumplir con un conjunto de metas, las cuales son bien diferentes de los objetivos de un sistema transaccional (OLTP, on-line transaction processing). Por ejemplo, una meta de los OLTP es maximizar la concurrencia mediante el uso de locks, dicho objetivo no es pertinente en el diseño de DW donde las consultas son sólo del tipo SELECT (por los menos en los modelos mas puros que trataremos en este trabajo)
¿Qué es un Data Warehouse?- Es una colección de datos orientada a temas, integrada, de tiempo variante y volatil para ayudar al proceso de toma de decisiones gerenciales.
- Orientado a temas: datos que brindan información sobre un “sujeto” del negocio en particular, en un lugar de concentrarse en dinámica de las transacciones de la organización.
- Integrado: los datos con los que se nutre el data warehouse vienen diferentes fuentes y son integrados para dar una visión de un “todo” coherente.
- Tiempo variante: todos los datos en el data warehouse son asociados con un periódo de tiempo específico.
No volátil: los datos son estables en el data warehouse. Más datos son agregados por los datos existentes no son removidos.
![]() |
El Data Warehouse es un conjunto de datos integrados |
Características
1. Se trata, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea).
2. El almacenamiento de los datos no debe usarse con datos de uso actual.
3. Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sean necesario.
Pero si se han dado cuenta en este apartado se habla de Bases de datos OLAP y OLTP, para entender bien lo que se quiere decir aocntinuación se presenta una tabla de lo que es cada una, aspi como también las diferencias de cada una de ellas.
Bases de Datos OLAP y OLTP
OLAP
|
OLTP
| |
Definición
|
Procesamiento Analítico en Línea
|
Procesamiento de Transacciones En Línea
|
Objetivos
|
¯ Asistir en el análisis del negocio
¯ Identificando tendencias, comparando periodos,
¯ Gestiones, mercados, índices mediante el almacenamiento de datos.
|
¯ Asistir a aplicaciones específicas.
¯ Mantener integridad de los datos
|
Alineación de datos
|
¯ Están alineados por dimensión
¯ Los datos son organizados definiendo dimensiones del negocio.
¯ Se focaliza en el cumplimiento de requerimientos del análisis del negocio.
|
¯ Están alineados por aplicación.
¯ Se focaliza en el cumplimiento de requerimientos de una aplicación especial o una tarea específica.
|
Integración de datos
|
¯ Los datos deben ser integrados.
¯ Son conocidos como datos derivados o DSS, dado que provienen de sistemas transaccionales y sistemas de archivos maestros.
|
¯ Los datos no están integrados.
¯ Son calificados como datos primitivos, operacionales.
¯ Son estructurados independientemente uno de otros.
¯ Son almacenados en diferentes formatos de archivos.
¯ Pueden residir en diferentes plataformas de hardware o RDBMS.
|
Historia
|
Almacenan tanta historia como sea necesario para el análisis del negocio, son guardados por 2 a 5 años, retienen valores para cada periodo en la Base de Datos.
|
¯ Retienen datos para 60 o 90 días después son resguardados por administradores de B.D en almacenamientos secundarios.
|
Acceso y manipulación de datos
|
¯ Tienen una carga y acceso masivo de datos, la carga y refresco es batch(bulk copy).
¯ La validación de datos se realiza antes o después de la carga, se realizan sentencias de Select sobre varios registros y tablas.
|
¯ Realizan manipulación de datos registro por registro con inserts, updates y deletes.
¯ Necesitan rutinas de validación y transacciones a nivel de registro.
|
Patrones de Uso
|
¯ Patrón de uso liviano con picos de uso eventuales en el tiempo.
¯ Los picos de uso suceden diario o semanal
|
¯ Patrón de uso constante
¯ Requiere grandes cantidades de recursos consumiendo solo el tiempo referido a la transacción.
|
Perfil de Usuario
|
¯ El perfil de usuario corresponde a la comunidad gerencial para la toma de decisiones.
|
¯ El perfil de usuario corresponde a los que interactúan con dichos sistemas, puesto que es la comunidad operativa.
|
Ejemplos
OLAP
![]() |
Son bases de datos multidimensionales |
OLTP
![]() |
Son bases de datos simples o transacciones |
No hay comentarios:
Publicar un comentario