Mediante la arquitectura de un datawarehouse almacenamos una colección de datos de un entorno determinado. En nuestro caso lo habitual es almacenar datos de negocio. En cualquier caso, los datos a integrar en el datawarehouse pueden provenir de múltiples fuentes y resulta muy útil integrarlos para poder utilizarlos como ayuda a la toma de decisiones a través de informes históricos o de análisis de tendencias.
Son muchas las razones por las que es útil construir un datawarehouse. Estas son algunas de ellas:
- Reduce el estrés en el sistema de producción.
- Está optimizado para acceso de lectura.
- Integra muchas fuentes de datos.
- Mantiene registros históricos por lo que no necesitarás guardar “fotografías” de informes por miedo a que desaparezcan o cambien los datos.
- Puedes reestructurar y renombrar tablas y campos. Te haces el modelo de datos a tu medida.
- Te protege contra las actualizaciones de los sistemas que contienen los datos originales.
- No necesitas personal de IT para que los usuarios creen sus propios informes.
- Puedes mejorar la calidad de los datos del sistema de origen.
- Facilita el uso de soluciones de Business Intelligence colocándolas por encima de la estructura del datawarehouse.
Pero para asegurarnos todos estos beneficios, la arquitectura de un datawarehouse es fundamental. La solución debe tener un diseño elegante e intuitivo, construido sobre una base sólida que sea capaz de soportar el crecimiento y el cambio, y también debe de estar bien soportada desde dentro de la empresa. Asegurar todo esto no es un proceso sencillo.
Para intentar ayudarte en ese proceso vamos a ver algunas de las mejores prácticas para la construcción de una arquitectura de un datawarehouse que pueda darte tranquilidad y asegurar el éxito, aunque se trate de una implementación compleja que siga creciendo en el futuro.
1. Asegúrate el apoyo de dirección
Teniendo en cuenta que vamos a tener que hacer inversiones importantes, debes asegurarte que la directiva de tu empresa te compra la idea. Sería deseable que dirección apoye abiertamente el proyecto. Si es el departamento de IT el que tiene que vender internamente este proyecto, va a ser visto como un proyecto de IT y el resto de usuarios de la empresa va a perder interés. Hay que considerar este proyecto como un proyecto de toda la organización y no de un departamento.
2. Consolida datos históricos desde el principio
Invierte esfuerzos cuanto antes en integrar y consolidar los datos provenientes del ERP y el CRM. Estos sistemas son unas de las mejores fuentes de datos y te van a ayudar a tener inmediatamente una buena calidad y cantidad de datos que pueden impulsar de forma más rápida y precisa el uso y éxito de las herramientas de Business Intelligence (BI).
3. Estudia bien las fuentes de datos
La arquitectura de un datawarehouse se construye para integrar datos desde diferentes fuentes. Para hacerlo bien, una de las cosas que deberás averiguar es si los diferentes sistemas interactúan unos con otros o si trabajan de forma individual. Por ejemplo, un banco tiene un sistema de banca central, un sistema para las tarjeta de crédito, un sistema ERP y otros sistemas a su alrededor. Cada uno de estos sistemas generan datos de forma diferente y tú debes saber cómo lo hacen para ser capaz de incorporar las diferentes variaciones de los mismos datos en el datawarehouse.
4. Asegura la flexibilidad y escalabilidad
Una de las claves del éxito de la arquitectura de un datawarehouse es asegurar que se trata de un modelo flexible. El modelo debería ser capaz de extraer datos de fuentes de datos adicionales a las propuestas inicialmente. No debe responder sólo a las necesidades actuales sino que también debe ser capaz de crecer junto con la demanda futura de tu empresa, sin necesidad de tener que rediseñar todo el datawarehouse. Muchas veces, la escalabilidad se considera sólo desde el punto de vista del rendimiento pero también implica tener facilidad para añadir más áreas.
5. Adquiere una herramienta ETL capaz de crecer con tu proyecto
La arquitectura de un datawarehouse debe contener una infraestructura ETL que integre la herramienta ETL, los servidores y la base de datos. Si te quedas simplemente con la herramienta ETL que viene con el paquete de Business Intelligence, es posible que te acabes enfrentando a un problema de flexibilidad. Esas herramientas puede que no se adapten bien a nuevas fuentes de datos. Haz un esfuerzo adicional, evalúa y compra una herramienta ETL apropiada.
6. Los metadatos deben facilitar un análisis intuitivo
Los metadatos provienen de la extracción, transformación y carga (ETL) y necesitan facilitar la creación de informes de business intelligence de forma intuitiva. Los nombres de las columnas y las tablas no pueden ser abstractos. De ser así nadie sabría relacionarlas automáticamente. Lo ideal es poder escribir scripts sin tener que preocuparse por los metadatos.
7. Mantén un equilibrio entre control de datos y auditoría
Auditar los datos regularmente es una parte del proceso de control de calidad de un datawarehouse. Esto asegura que los datos de las fuentes y los informes coinciden. Una buena práctica en la arquitectura de un datawarehouse es ser proactivo escribiendo scripts que supervisen el uso de datos e informes. Deberían emitir notificaciones de forma automática cuando haya discrepancias entre los datos de la fuente original y el datawarehouse.
8. Asegúrate de que tu equipo tiene suficiente conocimiento de business intelligence
Generalmente los proyectos de datawarehouse son emprendidos por las organizaciones cuando planean desplegar una herramienta de business intelligence. Lo hacen porque necesitan analizar la empresa y sus KPI’s. Evidentemente esto deberá de tenerse en cuenta a la hora de diseñar el datawarehouse por lo que el equipo que trabaja en su desarrollo deberá tener una buena comprensión acerca de lo que es un business intelligence.
Conclusión
La buena arquitectura de un datawarehouse es esencial para poder realizar un buen análisis de un negocio. El análisis siempre ha existido pero desde que el datawarehousing se ha popularizado, su uso para esta práctica se ha vuelto un estándar. Hoy hemos visto algunas de las mejores prácticas que debes tener en cuenta mientras diseñas la arquitectura de un datawarehouse. Utilizalas para conseguir que sea fiable y eficiente.