Un compresor de archivos es simplemente un programa informático que disminuye el tamaño en disco de un fichero o archivo.
El objetivo de este tipo de compresores es buscar secuencias de datos repetitivas dentro del archivo original y eliminarlas, de tal forma que al eliminar datos repetitivos no perdamos información importante. Lo más importante de un buen programa de compresión es que sea eficaz, gracias a la llamada relación de compresión (RC) que se mide en proporción a la cantidad reducida. De esta manera, nos queda que:
Relación de Compresión = 10:1. Nos indica que cada 10 bits originales nos queda 1 solo bit comprimido, conseguimos que el tamaño se reduzca 10 veces.
Vamos a ir más allá y vamos a explicar lo complejo de este proceso. Raramente los patrones de repetición son exactos por lo que nos hace falta implementar algoritmos de compresión:
- Algunos se dedican a buscar series largas de datos que después codifican de forma más breve.
- Otros utilizan el algoritmo Huffman, miran los caracteres que están repetidos y luego lo codifican de forma más corta.
- El algoritmo LZW, construye un diccionario con los patrones encontrados para después usarlos.
En una compresión existen dos conceptos fundamentales:
- Redundancia: Datos repetidos o que pueden aparecer.
- EntropÃa: Son los datos esenciales que se calcula como la diferencia entre la cantidad de información original y su redundancia.
La información de datos puede tener tres caracterÃsiticas:
- Redundante: Datos repetidos o que pueden aparecer.
- Irrevelante: Su eliminación no afecta al contenido del mensaje final. Ejemplo: Nuestro oÃdo solo capta las frecuencias que están comprendidas entre 16/20 Mhz, una señal que esté por encima o por debajo de esta cifra es irrelevante.
- Básica: La información que es importante. Debe ser transmitida.
Existen tres tipos de compresión:
- Sin pérdidas: Transmitimos el mensaje una vez eliminado lo redundante.
- Subjetivamente sin pérdidas: Transmitimos el mensaje sin la información redundante e irrelevante.
- Subjetivamente con pérdidas: Transmitimos el mensaje con errores pero tolerables, como la videoconferencia.
Existen programas compresores tan conocidos como el Winzip, WinRAR, 7Zip, etc.