Diferencia entre DBMS distribuido y bases de datos paralelas

A partir de febrero de 2012, la mayoría de las bases de datos consisten en un software de servidor y un conjunto de archivos que residen en una sola computadora. Los enfoques más avanzados utilizan varias computadoras y muchos archivos, a veces en diferentes ubicaciones. Los métodos paralelos y distribuidos mejoran la velocidad de acceso para bases de datos muy grandes, el acceso para organizaciones dispersas geográficamente y la confiabilidad para aplicaciones que dependen del tiempo de actividad.

Estructura

Una base de datos distribuida alberga datos en dos o más servidores en ubicaciones separadas. Por ejemplo, una oficina central en Chicago tiene una base de datos y un almacén en Kansas City tiene otra. Los dos comparten un enlace a través de Internet de modo que la base de datos de Chicago recibe registros de envíos desde Kansas City todas las noches. Una base de datos paralela típica reside en una ubicación con un conjunto de archivos, aunque varias computadoras comparten la carga de trabajo.

Velocidad

La principal ventaja de una base de datos paralela es la velocidad. Al igual que una base de datos estándar que se ejecuta en una computadora, una base de datos paralela recibe lenguaje de consulta estructurado o solicitudes SQL de los usuarios. El servidor los divide en una serie de pasos y luego los ejecuta. Un servidor de base de datos estándar realiza todos los pasos por sí mismo, mientras que una base de datos paralela asigna pasos a diferentes computadoras. Cuando cada computadora termina su tarea, la base de datos reúne la información y envía los resultados al usuario. Debido a que cada computadora trabaja solo en una parte del trabajo, juntas completan una solicitud SQL en mucho menos tiempo. A medida que aumentan los requisitos de la base de datos de una organización, se agregan equipos a la base de datos paralela para cumplir con el aumento de la carga de trabajo.

Acceso

Las bases de datos distribuidas mejoran el acceso, ya que cada oficina local tiene su propia base de datos. La mayoría de las transacciones de SQL tienen lugar a nivel de oficina sin los retrasos en los que incurren las redes de datos de larga distancia. Cada base de datos local tiene información en común con las demás, pero también puede tener datos exclusivos de la ubicación. Periódicamente, las bases de datos locales se sincronizan a través de una red de larga distancia para mantenerse actualizadas entre sí. Por el contrario, una base de datos paralela no mejora el acceso a ubicaciones remotas.

Confiabilidad

Las bases de datos distribuidas y paralelas abordan la confiabilidad de diferentes maneras. Una base de datos que se ejecuta en una sola computadora depende completamente de la confiabilidad de esa máquina:en el momento en que la computadora falla, la base de datos deja de estar disponible. La mayoría de las bases de datos paralelas tienen una característica que monitorea el estado de cada computadora; si uno falla, el programa del servidor lo elimina del servicio, pero la base de datos permanece disponible, aunque con un rendimiento reducido. Para una base de datos distribuida, los servidores locales restantes continúan procesando información si uno desarrolla un problema; la interrupción afecta solo a los usuarios locales de la computadora fallida.