DISEÑO DE UN DATAWAREHOUSE

04.04.2012 11:27

Conceptos Básicos:

 

1. Proceso de Negocio:

Un proceso de negocio es un conjunto de tareas relacionadas lógicamente llevadas a cabo para lograr un resultado de negocio definido. Cada proceso de negocio tiene sus entradas, funciones y salidas. Las entradas son requisitos que deben tenerse antes de que una función pueda ser aplicada. Cuando una función es aplicada a las entradas de un método, tendremos ciertas salidas resultantes.

Ejemplos:

  • En los recursos humanos: Contrata empleados, evalúa el desempeño, enrola a los empleados en planes de beneficios. 
  • En la manufacturación y producción: Ensambla el producto, verifica la calidad y crea una lista de materiales.

 

2. Sistema Transaccional:

Es un tipo de sistema de información diseñado para recolectar, almacenar, modificar y recuperar todo tipo de información que es generada por las transacciones en una organización. Una transacción es un evento o proceso que genera o modifica la información que se encuentran eventualmente almacenados en un sistema de información.

Ejemplos:

  • Un sistema transaccional debe controlar las transacciones para mantener la seguridad y consistencia de los datos involucrados. Por ejemplo, supongamos que un cliente transfiere una fuerte suma dinero de una cuenta a otra cuenta dentro de un mismo banco. La cantidad de dinero que se descuenta de la cuenta emisora debe ser igual a la que se suma en la cuenta receptora, de no ser as{i, la transacción no se realizará.
  • Un sistema transaccional debe ser capaz de enmendar cualquier error ocurrido durante una transacción, pudiendo deshacer las operaciones realizadas, manteniendo los datos tal cual estaban antes del error.

 

3. Sistema Analítico:

Sistema analítico es aquel que usa la información y datos históricos de la empresa para la toma de decisiones.

Tiene un esquema que está optimizado para ejecutar rápidamente consultas complejas. 

Utiliza estructuras multidimensionales (también llamados cubos OLAP -OnLine Analytical Processing) que contienen datos resumidos de sistemas OLTP.

Almacena varios niveles de datos conformados por estructuras altamente optimizadas para consultas.

Permite el uso interactivo con los usuarios y está preparado para realizar informes complejos. Además, permite cambiar fácilmente las filas, las columnas y las páginas en dichos informes. La información necesaria está integrada y el diseño de la base de datos está normalizado.

Ejemplo: Tiene varios usos

  • Análisis de la producción
  • Análisis de servicios
  • Evolución del costo del producto.

 

4. Almacén de Datos:

Un almacen de datos (o también llamado Data Warehouse) es una colección de datos orientada a un determinado ámbito integrado (empresa, organización, área, etc), no volátil y variable en el tiempo.

Características:

  • Ayuda a la toma de decisiones.
  • Va más allá de los datos transaccionales y operacionales.
  • Favorece el análisis y divulgación eficiente de datos.
  • Contiene gran cantidad dei nformación, que se dividen en unidad lógicas más pequeñas, denominadas DATAMARTS.

Ventajas:

  • Confiable y controlado.
  • No existe la duplicación de esfuerzos.
  • No existe la confusión en los algoritmos.
  • No hay restricciones al drill-down.
  • Información de calidad.

 

 

5. Dimensión:

Una tabla almacena registros de la forma: D1, D2, D3, ... M1, M2, M3...

Para que Di sea una dimensión:

  • Debe describir un aspecto del negocio
  • Debe definir la organización lógica de los datos.
  • Debe proveer un medio para analizar datos del negocio.
  • Debe permitir filtrar y manipular los datos almacenados.

 

6. Medidas:

También conocido como hechos, las medidas representan los valores que son analizados.

Por ejemplo:

  • Cantidad de pacientes admitidos.
  • Llamadas efectuadas.
  • Importe Total =  PrecioDelProducto*CantidadVendida
  • PromedioGeneral = AVG(NotasFinales)

Son valores numéricos, ya que estos valores son las bases de las cuales el usuario puede realizar cálculos.

Si la medida es no numérica, debemos codificarla a un valor numérico y cuando tengamos que exponerla, decodificarla para mostrarla con el valor original.

Características:

  • Deben ser numéricos.
  • Cruzan todas las dimensiones en todos los niveles.

Clasificación:

  • Naturales: suma, cuenta, mínimo, máximo, cuenta distintos.
  • Calculadas: cálculos matemáticos, expresioens condicionales, alertas.

 

7. Tabla de Hechos:

Las tablas de  hechos contienen hechos. Los hechos o medidas son los valores de datos que se analizan (son numéricos).

La tabla de hechos tiene una CLAVE PRIMARIA compuesta por las claves primarias de las tablas de dimensiones relacionadas a este.

Los hechos son utilizados para crear indicadores, a través de sumarizadores preestablecidos al momento de crear un cubo multidimensional.

 

 

B.B.D.R.

000087368

Badestra Laboratorio