La base de datos multidimensional es una tecnología muy popular cuando hablamos de Business Intelligence. Permite a una empresa llevar a cabo análisis estratégico en profundidad teniendo en cuenta una gran variedad de factores que afectan a la empresa.
Además, una base de datos multidimensional permite que se puedan aprovechar los conocimientos en herramientas con las que ya se suele estar familiarizado, como Microsoft Excel, para trabajar y analizar los datos de dicha base de datos multidimensional mediante lo que se conoce como “slice and dice”, lo que podría traducirse como rebanadas y cubos de datos, y que viene a indicar la facilidad con la que se pueden dividir y cortar los datos para su estudio teniendo en cuenta diferentes variables o dimensiones.
Términos y funcionamiento básico de una base de datos multidimensional
Para entender una base de datos multidimensional de algunos términos que necesitamos entender.
El primer término es el de procesamiento de transacciones online comúnmente conocido como OLTP. Como su nombre indica, consiste en sistemas basados en transacciones, los cuales frecuentemente utilizan una base de datos relacional como almacén de datos. Los sistemas OLTP suelen centrarse en tiempos de respuesta rápida y necesidades de servicio inmediatas.
Un buen ejemplo de un sistema OLTP es un cajero automático. Cuándo vas a retirar dinero del cajero automático no estás realmente interesado en analizar un montón de datos. Estás allí sólo para hacer una retirada de dinero y terminar para que la siguiente persona que espera pueda completar también su transacción. El sistema OLTP facilita estos procesos.
Esto nos lleva a otro término conocido como OLAP, que nos ayuda con el procesamiento analitico online. El enfoque OLAP se centra en el análisis de datos, y típicamente los datos provienen de los sistemas OLTP. Esto no quiere decir que la tecnología OLAP sea más lenta que la tecnología OLTP, sino que los dos se centran en cosas completamente diferentes. OLTP se enfoca en hacer el trabajo y OLAP en analizar los resultados del trabajo.
Un sistema OLTP puede tener miles de millones de registros por lo que intentar ejecutar informes en un sistema OLTP es malo ya que podríamos ralentizarlo o hacer que deje de funcionar. Los sistemas OLTP suelen ser de misión crítica para el negocio y no es conveniente sobrecargarlos.
Ahí es donde entra la tecnología OLAP. Podemos coger los datos del sistema OLTP y cargarlos en nuestro sistema OLAP, y cuando hablamos de OLAP nos estamos refiriendo realmente a una base de datos multidimensional. Los dos términos significan esencialmente lo mismo. También es posible que escuches el término cubo o cubo OLAP para referirse también a esto. Realmente los términos base de datos multidimensional, cubo y cubo OLAP se utilizan de forma bastante intercambiable.
El proceso de carga de datos desde el sistema OLTP a la base de datos multidimensional suele ser complicado y pueden requerir retocar los datos para tenerlos de forma que puedan ser analizados en la base de datos multidimensional. El término para este proceso de carga se denomina ETL (extracción, transformación y carga) y hay muchas herramientas sl en el mercado que realizan esta función.
Habitualmente se realiza una carga nocturna mediante una herramienta ETL que se ejecuta contra los datos en el sistema OLTP. Estos datos se cargan en la base de datos multidimensional OLAP y a la mañana siguiente el analista puede utilizarlos y encontrar respuestas a sus preguntas
Lo interesante es que el uso de una base de datos multidimensional permite analizar los datos sin afectar al sistema OLTP. Éste sigue ejecutando procesos de negocio mientras que el analista puede hacer análisis crítico de datos importantes que pueden ayudar a determinar cómo el negocio está funcionando y cómo se puede mejorar.