¿Qué es un archivo delimitado y de ancho fijo?
Cada línea en un archivo representa una fila de datos, pero esos datos generalmente se dividen en campos o columnas. Dos métodos estándar delimitan campos. Una es tener campos de longitud fija y, por lo tanto, registros de longitud fija; la otra es tener campos de longitud variable con registros de longitud variable. Los campos de longitud variable deben estar separados por un símbolo, que es el delimitador. Una base de datos de registros de longitud variable producirá un archivo delimitado, una base de datos con registros de longitud fija producirá un archivo de ancho fijo.
Delimitadores
La forma más común de archivo delimitado utiliza la coma como separador de campo. Estos archivos se denominan archivos de valores separados por comas (CSV). La coma es adecuada para datos numéricos, pero puede causar problemas con el texto. Otros delimitadores incluyen el espacio (" "), la barra ("|") o el signo de sombrero ("^"). El diseñador o programador de archivos tiene que encontrar un carácter que rara vez se use en los datos. A veces puede ser necesario utilizar una combinación de caracteres.
Campos fijos
No siempre es posible garantizar que nunca se utilizará un carácter en los datos que se almacenarán en archivos, por lo que la dificultad de encontrar un delimitador adecuado puede hacer que los campos de longitud fija sean preferibles. Este formato presenta gastos generales tanto en el almacenamiento como en el procesamiento, por lo que los archivos delimitados son más comunes. Un campo de longitud fija tiene que ser rellenado. Las formas más comunes de relleno son el relleno izquierdo con ceros para datos numéricos y el relleno derecho con espacios para texto.
Procedimientos
Ya sea que un archivo tenga un ancho fijo o contenga campos delimitados, los programas de escritura y lectura deben seguir las mismas convenciones. Un programa que recibe un archivo de ancho fijo primero tiene que conocer la longitud y el tipo de datos de cada archivo. Un programa que recibe archivos delimitados debe conocer el delimitador que debe buscar.
Registros rechazados
En cada caso, los programas de importación deben tener procedimientos de notificación de excepciones que escriban los registros rechazados en un archivo separado. La razón más común por la que se rechaza un registro delimitado es que el delimitador aparece en los datos, creando columnas adicionales. Los registros de ancho fijo generalmente se rechazan por ser demasiado largos. Los registros cortos generalmente no causan errores. Los campos finales estarán despoblados. Si los campos finales son obligatorios, los registros cortos serán rechazados.