base de datos distribuida

¿Qué es una base de datos distribuida y porqué puede ser interesante?

En una base de datos distribuida tenemos una serie de bases de datos que pueden estar distribuidas geográficamente por todo el mundo. Por encima de esto tenemos un sistema de gestión de bases de datos distribuidas (DDBMS)  que se encarga de gestionar todo esto de manera que el conjunto aparezca como una sola base de datos para los usuarios.

Por lo tanto, una base de datos distribuida es una colección de múltiples bases de datos interconectadas, que pueden estar extendidas físicamente a través de varios lugares comunicados mediante una red informática.

 

Ventajas de una base de datos distribuida

A continuación veamos las ventajas de una base de datos distribuida sobre una base de datos centralizada.

  • Desarrollo modular. Si el sistema necesita ser ampliado con nuevas localizaciones o nuevas unidades, en sistemas de base de datos centralizados, esta acción requiere sustanciales esfuerzos adicionales, así como la interrupción del servicio. Sin embargo, en las bases de datos distribuidas, el trabajo simplemente requiere agregar nuevos ordenadores y datos en los nuevos sitios y finalmente conectarlos al sistema distribuido, sin que exista ninguna interrupción de funciones.
  • Mejor tiempo de respuesta. Si los datos están distribuidos de una manera eficiente, las peticiones de los usuarios van a poder ser satisfechas directamente desde los datos locales, por lo que se proporciona una respuesta más rápida. Por otro lado, en sistemas centralizados, todas las solicitudes tienen que pasar a través del ordenador central, lo cual incrementa el tiempo de respuesta.
  • Más fiable. En caso de fallo en la base de datos, el todo el sistema de base de datos centralizada se detiene. Sin embargo, en sistemas distribuidos, cuando un componente falla, el funcionamiento del sistema continua, aunque pueda tener una reducción de rendimiento. Por lo tanto, una base de datos distribuida es más fiable.
  • Menor coste de comunicación. En sistemas de bases de datos distribuidas, si el dato se localiza allí dónde es más usado, el coste de comunicación para manipulación de datos puede ser minimizado. Esto no es factible en sistemas centralizados.

 

Algunos inconvenientes de una base de datos distribuida  

A continuación vemos algunos posibles inconvenientes asociados a las bases de datos distribuidas.

  • Necesidad de software complejo y caro. Un sistema de gestión de base de datos distribuida exige un software complejo y a menudo costoso para proporcionar transparencia a los datos y coordinar los diferentes sitios.
  • Sobrecarga de procesamiento. Incluso con operaciones simples, se puede requerir un gran número de cálculos y comunicaciones para conseguir proporcionar uniformidad de datos en todos los sitios.
  • Integridad de datos. La necesidad de actualización de datos en múltiples sitios, plantea problemas de integridad de datos.
  • Sobrecarga por distribución de datos inadecuada. La capacidad de respuesta de las consultas depende en gran medida de una distribución adecuada de los datos. Si las distribución es incorrecta, a menudo nos encontraremos con una respuesta muy lenta a las solicitudes de los usuarios.

 

¿Por qué puedes necesitar una base de datos distribuida?

Los siguientes factores estimulan el uso de una base de datos distribuida.

  • Naturaleza distribuida de unidades organizacionales. Muchas organizaciones actuales se dividen en varias unidades que se distribuyen físicamente por el mundo. Cada unidad requiere su propio conjunto de datos local. Así, la base datos global de la organización se convierte en una base de datos distribuida.
  • Necesidad de intercambio de datos. Cuando hay múltiples unidades organizativas, a menudo necesitarán comunicarse entre sí y compartir sus datos y recursos. Esto requiere bases de datos comunes o bases de datos replicadas que deberían ser utilizadas mediante sincronización.
  • Soporte para procesamiento de transacciones online (OLTP) y procesamiento de analítica online (OLAP). OLTP y OLAP funcionan con sistemas diversificados que pueden tener datos comunes. Los sistemas de bases de datos distribuidas ayudan a ambos procesos proporcionando datos sincronizados.
  • Recuperación de base de datos. Una de las técnicas comunes utilizadas en un sistema de gestión de base de datos distribuida es la replicación de datos a través de los diferentes sitios. Esta replicación de datos, automáticamente ayuda a la recuperación de datos si una base de datos fuera dañada en algún sitio. Los usuarios podrían acceder a los datos desde otros sitios mientras que la base de datos dañada se reconstruye. Por lo tanto, un fallo en la base de datos puede llegar a ser casi imperceptible por los usuarios.
  • Soporte para múltiple aplicaciones. La mayoría de organizaciones utilizan una gran variedad de aplicaciones de software, cada una con su base de datos específica. Un sistema de gestión de base de datos distribuida proporciona una funcionalidad uniforme al utilizar  los mismos datos entre las diferentes plataformas.

 

ventajas trabajar en cloud