Unterschied zwischen GZIP und BZIP2

GZIP vs BZIP2

GNU zip (auch bekannt als GZIP) ist eine Softwareanwendung mit dem Zweck, Dateien zu komprimieren. Es sollte ursprünglich das in den frühen Unix-Systemen verwendete Komprimierungsprogramm ersetzen - zur Verwendung im GNU-Projekt (ein freies Softwareprojekt)..

BZIP2 ist ein verlustfreier Open-Source-Datenkomprimierungsalgorithmus - im Grunde eine Klasse von Datenkomprimierungsalgorithmen, die es ermöglicht, dass die Originaldaten einer komprimierten Datei vollständig aus den komprimierten Daten rekonstruiert werden.

GZIP basiert auf einem Algorithmus, der als DEFLATE bekannt ist. Dies ist auch ein verlustloser Datenkompressionsalgorithmus. Es verwendet sowohl den LZ77-Algorithmus als auch die Huffman-Codierung. Im Wesentlichen bezieht sich GZIP auf das Dateiformat mit demselben Namen. Dieses Format ist ein 10-Byte-Header, der eine magische Zahl enthält (dh einen numerischen oder Textwert, der sich niemals ändert. Er wird verwendet, um ein Dateiformat oder -protokoll, einen unbenannten numerischen Wert, der sich niemals ändert, oder verschiedene Werte, die nicht verwechselt werden können, anzugeben (für alles andere) zusätzliche Kopfzeilen, die möglicherweise tatsächlich erforderlich sind oder nicht (z. B. Name der ursprünglichen Datei), einen Körper, der eine DEFLATE-komprimierte Nutzlast enthält (dies sind die Daten, die die Kopfzeilen tragen) und eine 8-Byte-Fußzeile enthält eine CRC-32-Prüfsumme sowie die tatsächliche Länge der ursprünglichen unkomprimierten Daten.

Das BZIP2-Format verwendet verschiedene Komprimierungstechniken, die in mehreren Ebenen aufeinander gestapelt werden. Sie treten in einer sehr unterschiedlichen Reihenfolge auf: Lauflängencodierung (das ist eine Folge von vier bis 255 doppelten Symbolen, die durch die ersten vier Symbole ersetzt wird, und eine Codierungslänge, die zwischen 0 und 251 wiederholt wird), Burrows-Wheeler-Transformation ( (die reversible Block-Sortierung, die den Kern des BZIP2 ausmacht), Move nach vorne (lässt die Größe des verarbeiteten Blocks unverändert), Lauflängencodierung (die aus langen Zeichenfolgen - normalerweise Nullen - besteht, also konstant in der Ausgabe wiederholen und durch das Symbol und eine Folge von zwei Codes ersetzt werden), Huffman-Codierung (ein Prozess, der Symbole mit fester Länge von 8-Bit-Bytes mit sich ändernden Längencodes ersetzt), Multiple Hoffman-Codierung (bestehend aus mehrere Hoffman-Tabellen mit identischer Größe), Unary-Base-1-Codierung, Delta-Codierung und Sparse-Bit-Array.

Zusammenfassung:

1. GZIP ist eine kostenlose Anwendung zum Komprimieren von Dateien. BZIP2 ist ein verlustfreier Open-Source-Datenkomprimierungsalgorithmus, mit dem die Originaldaten einer komprimierten Datei abgerufen werden können.

2. GZIP besteht aus einem 10-Byte-Header, optionalen Headern, einem Hauptteil und einer 8-Byte-Fußzeile. BZIP2 besteht aus neun Schichten von Kompressionstechniken.