Hintergrund
Von den 256 möglichen Zeichen, die ein Byte darstellen kann, werden unter den meisten Umständen nur einige verwendet. Könnten wir das nicht irgendwie ausnutzen und unsere Textdateien verkleinern, indem wir die selten verwendeten Buchstaben überflüssig machen?
Viele Buchstaben bieten in den meisten Situationen keinen Mehrwert und können durch häufigere Buchstaben ersetzt werden. Beispielsweise sehen ein Kleinbuchstabe "L", ein Großbuchstabe "I" und die Zahl "1" in den meisten Situationen nahezu identisch aus, sodass sie konsolidiert werden können.
Großbuchstaben werden kaum benötigt, sodass auf sie verzichtet werden kann. Das Dekomprimierungs- / Anzeigeprogramm kann sogar automatisch den ersten Buchstaben jedes Satzes, gebräuchlicher Namen usw. großschreiben.
Regeln
Die Beiträge werden bewertet nach:
- Kompressionsrate
- Lesbarkeit nach Dekomprimierung
Die Beiträge werden anhand der Nur-Text-Version dieses Artikels getestet: http://en.wikipedia.org/wiki/Babbage und eines zufällig ausgewählten BBC News- Artikels.
Zusätzliche Noten werden vergeben für; Beibehaltung von Markups, Verschönerung nach Dekomprimierung (dh Großschreibung von Sätzen usw.).
Sprachen
- Jeder, den Sie mögen, der aber auf einer einfachen * nix-Box leicht kompiliert (oder interpretiert) werden muss.
quelle
main = interact (\x -> take 90 x ++ " yada yada yada")
Antworten:
Perl
Sehr ineffizient und hat schlechte Preise. Benötigt
/usr/share/dict/words
.Kompressor
Dekompressor
quelle
Perl, 0 Zeichen
Kompressionsverhältnis von unendlich, obwohl nach Dekomprimierung nicht so lesbar, so dass einige Markierungen verloren gehen.
quelle
Bash, 5 Zeichen
Mein fauler Eintrag, der vielleicht gewinnen könnte:
Verlustfrei, so dass die Lesbarkeit perfekt erhalten bleibt und alle zusätzlichen Noten erhalten werden! Das Komprimierungsverhältnis im Babbage-HTML beträgt 4,79x (153804 bis 32084 Byte).
quelle