¿Por qué son importantes la integridad de la entidad y la integridad referencial en una base de datos?

La integridad de la entidad y la integridad referencial son dos formas de integridad de datos que son particularmente importantes en las bases de datos relacionales. Las bases de datos relacionales dividen el almacenamiento de datos en elementos que, por lo general, deben volver a unirse para producir resultados significativos. Sin garantías de estos dos tipos de integridad, los datos se perderían o se duplicarían.

Bases de datos relacionales

Los sistemas de gestión de bases de datos relacionales representan el modelo de base de datos más ampliamente implementado en el mundo actual. El modelo relacional se basa en datos "normalizados". La normalización es un proceso que se lleva a cabo en el proceso de diseño de la base de datos para garantizar que las tablas que contienen los datos no tengan datos repetitivos y no puedan crear repeticiones o pérdidas cuando se unen

Datos de referencia

La mayoría de las aplicaciones de bases de datos utilizan dos tipos diferentes de datos:datos de transacciones y datos de referencia. Como ejemplo, una base de datos de almacén muy básica registrará las transacciones de movimiento de existencias. Imagine un registro de transacción como:Artículo 1010, Cantidad 5, Dirección de salida. Un gerente puede desear ver un informe de estos datos con el nombre y la descripción del artículo, así como el número del artículo. Estos detalles son atributos de una entidad diferente que describe cada parte en el almacén. Esta es una tabla de referencia.

Normalización

En el ejemplo de la base de datos del almacén, la tabla de transacciones solo necesita contener un identificador para la pieza. Si los detalles como el nombre y la descripción se mantuvieran en la tabla de transacciones, esto provocaría una repetición innecesaria. Cualquier artículo siempre tiene el mismo nombre y descripción, y estos detalles se relacionan con la parte y no con la transacción. En este sistema de ejemplo, los detalles de las piezas se mantienen en una tabla diferente. Cada registro en la tabla tiene que ser identificado de forma única por un campo, o una combinación de campos, llamado clave principal. Dividir grupos repetitivos se llama "normalización".

Integridad de la entidad

En el ejemplo de la base de datos del almacén, la clave principal de la tabla de piezas debe ser un atributo que identifique de forma única cada registro. Esta es la integridad de la entidad. Generalmente, los campos numéricos son mejores para una clave principal que los campos de texto. En la tabla de piezas, el mejor campo para la clave principal sería el número de artículo. La organización puede vender una variedad de productos con el mismo nombre, como "llave pequeña". El número de artículo siempre será único por artículo, por lo que esto garantiza la integridad de la entidad para la tabla de piezas. Si varios registros tuvieran el mismo valor de clave principal, hacer referencia a los detalles de esta tabla uniéndola a la tabla de transacciones haría que los registros de transacciones se duplicaran para coincidir con cada registro con el mismo identificador.

Integridad referencial

La integridad referencial asegura que el vínculo entre la tabla de transacciones y la tabla de partes se forme correctamente. En la tabla de transacciones, el número de artículo forma la clave externa, que es el atributo que se vincula con la clave principal de la tabla de piezas. Solo los números de artículo enumerados en la tabla de piezas pueden aparecer en la tabla de transacciones. Esto es integridad referencial. Si la tabla de transacciones contiene un número de artículo que no está también en la tabla de piezas, unir las tablas provocaría que las transacciones con el número de artículo faltante quedaran fuera de los resultados.