¿Cuánto comprime un archivo zip?

El formato de archivo zip fue desarrollado por Pkware. El desarrollo inicial del formato se completó en 1986. Permite comprimir y archivar datos, ahorrando espacio en disco y facilitando la copia de seguridad y la transferencia de archivos grandes o de varias partes. Hay muchos factores que afectan el grado de compresión que se puede lograr.

Tipos de compresión

Hay dos tipos de compresión de archivos:sin pérdida y con pérdida. El formato zip es un ejemplo de compresión sin pérdidas, lo que significa que los datos comprimidos se pueden devolver a su estado anterior exacto sin fallas. La compresión con pérdida favorece la eficiencia sobre la precisión, lo que permite que los datos se sustituyan o eliminen por completo. Un formato sin pérdidas no permite métodos de compresión que no permiten una recreación perfecta de los datos originales, incluso si esos métodos serían más efectivos.

Métodos

El formato zip incluye especificaciones para múltiples métodos algorítmicos de compresión de archivos. El método utilizado puede tener un efecto significativo en el nivel de compresión logrado. Algunos de los métodos disponibles incluyen encoger, reducir, implosionar y desinflar. De estos, el desinflado es el más utilizado. Es el método de compresión predeterminado que se usa en Pkzip, WinZip e Info-Zip.

Variabilidad

La medida en que se puede comprimir un archivo varía según el tipo de archivo. Por ejemplo, los archivos de texto por defecto carecen de compresión, y cada carácter se representa individualmente en hexadecimal. Hex, o hexadecimal, es un sistema numérico compuesto por 16 identificadores únicos de un solo carácter capaces de representar cada byte en un archivo. Las tasas de compresión en este tipo de archivos son generalmente muy buenas.

Muchos formatos de medios, como los MP3, incluyen la compresión como parte del formato estándar. Las tasas de compresión en estos archivos suelen ser bajas, lo que podría incluso dar como resultado un archivo zip "comprimido" que es más grande que el original debido a los datos adicionales en el archivo zip.

Comparación

El formato zip no es el único formato de compresión en uso. Otros formatos de compresión comunes incluyen RAR y 7-zip. Según Igor Pavlov, desarrollador de 7-zip, el formato zip estándar tiene un rendimiento inferior al de los otros dos formatos entre un 30 y un 40 por ciento, según el tipo de datos que se compriman.

En una prueba, Pavlov comprimió una instalación completa de Google Earth 3.0.0616. Los datos totalizaron 23,5 MB antes de la compresión. El formato zip estándar proporcionó aproximadamente un 62 por ciento de compresión. En comparación, RAR resultó en una tasa de compresión del 71 por ciento y 7-zip tuvo un 76 por ciento.

Limitaciones

Las primeras encarnaciones del formato zip se limitaban a manejar datos de no más de 4 gigabytes a la vez. Esto incluía el tamaño de archivo individual comprimido y sin comprimir y el tamaño total del archivo después de la compresión. Esta limitación se elimina en las versiones más recientes del formato con la adición de la extensión zip64. La compatibilidad con la extensión zip64 aún es limitada.