DISEÑO DE UN DATAWAREHOUSE
Conceptos Básicos:
1. Proceso de Negocio:
Un proceso de negocio es un conjunto de tareas relacionadas lógicamente llevadas a cabo para lograr un resultado de negocio definido. Cada proceso de negocio tiene sus entradas, funciones y salidas. Las entradas son requisitos que deben tenerse antes de que una función pueda ser aplicada. Cuando una función es aplicada a las entradas de un método, tendremos ciertas salidas resultantes.
Ejemplos:
- En los recursos humanos: Contrata empleados, evalúa el desempeño, enrola a los empleados en planes de beneficios.
- En la manufacturación y producción: Ensambla el producto, verifica la calidad y crea una lista de materiales.
2. Sistema Transaccional:
Es un tipo de sistema de información diseñado para recolectar, almacenar, modificar y recuperar todo tipo de información que es generada por las transacciones en una organización. Una transacción es un evento o proceso que genera o modifica la información que se encuentran eventualmente almacenados en un sistema de información.
Ejemplos:
- Un sistema transaccional debe controlar las transacciones para mantener la seguridad y consistencia de los datos involucrados. Por ejemplo, supongamos que un cliente transfiere una fuerte suma dinero de una cuenta a otra cuenta dentro de un mismo banco. La cantidad de dinero que se descuenta de la cuenta emisora debe ser igual a la que se suma en la cuenta receptora, de no ser as{i, la transacción no se realizará.
- Un sistema transaccional debe ser capaz de enmendar cualquier error ocurrido durante una transacción, pudiendo deshacer las operaciones realizadas, manteniendo los datos tal cual estaban antes del error.
3. Sistema Analítico:
Sistema analítico es aquel que usa la información y datos históricos de la empresa para la toma de decisiones.
Tiene un esquema que está optimizado para ejecutar rápidamente consultas complejas.
Utiliza estructuras multidimensionales (también llamados cubos OLAP -OnLine Analytical Processing) que contienen datos resumidos de sistemas OLTP.
Almacena varios niveles de datos conformados por estructuras altamente optimizadas para consultas.
Permite el uso interactivo con los usuarios y está preparado para realizar informes complejos. Además, permite cambiar fácilmente las filas, las columnas y las páginas en dichos informes. La información necesaria está integrada y el diseño de la base de datos está normalizado.
Ejemplo: Tiene varios usos
- Análisis de la producción
- Análisis de servicios
- Evolución del costo del producto.
4. Almacén de Datos:
Un almacen de datos (o también llamado Data Warehouse) es una colección de datos orientada a un determinado ámbito integrado (empresa, organización, área, etc), no volátil y variable en el tiempo.
Características:
- Ayuda a la toma de decisiones.
- Va más allá de los datos transaccionales y operacionales.
- Favorece el análisis y divulgación eficiente de datos.
- Contiene gran cantidad dei nformación, que se dividen en unidad lógicas más pequeñas, denominadas DATAMARTS.
Ventajas:
- Confiable y controlado.
- No existe la duplicación de esfuerzos.
- No existe la confusión en los algoritmos.
- No hay restricciones al drill-down.
- Información de calidad.
5. Dimensión:
Una tabla almacena registros de la forma: D1, D2, D3, ... M1, M2, M3...
Para que Di sea una dimensión:
- Debe describir un aspecto del negocio
- Debe definir la organización lógica de los datos.
- Debe proveer un medio para analizar datos del negocio.
- Debe permitir filtrar y manipular los datos almacenados.
6. Medidas:
También conocido como hechos, las medidas representan los valores que son analizados.
Por ejemplo:
- Cantidad de pacientes admitidos.
- Llamadas efectuadas.
- Importe Total = PrecioDelProducto*CantidadVendida
- PromedioGeneral = AVG(NotasFinales)
Son valores numéricos, ya que estos valores son las bases de las cuales el usuario puede realizar cálculos.
Si la medida es no numérica, debemos codificarla a un valor numérico y cuando tengamos que exponerla, decodificarla para mostrarla con el valor original.
Características:
- Deben ser numéricos.
- Cruzan todas las dimensiones en todos los niveles.
Clasificación:
- Naturales: suma, cuenta, mínimo, máximo, cuenta distintos.
- Calculadas: cálculos matemáticos, expresioens condicionales, alertas.
7. Tabla de Hechos:
Las tablas de hechos contienen hechos. Los hechos o medidas son los valores de datos que se analizan (son numéricos).
La tabla de hechos tiene una CLAVE PRIMARIA compuesta por las claves primarias de las tablas de dimensiones relacionadas a este.
Los hechos son utilizados para crear indicadores, a través de sumarizadores preestablecidos al momento de crear un cubo multidimensional.
B.B.D.R.
000087368
Badestra Laboratorio