Reversible Hex-Dump-Utility (auch bekannt als "xxd")

12

xxdist ein Hilfsprogramm, das zusammen mit vimverwendet wurde, um Antworten auf Code-Golf-Probleme auf dieser Site zu codieren. Es konvertiert eine Binärdatei in einen Hex-Dump und wieder zurück.

Implementieren Sie die Befehle xxdund xxd -rin einer oder mehreren Programmiersprachen Ihrer Wahl. Die Bewertung basiert auf den Zeichen- / Bytelängen von a) Ihrem Programm (Ihren Programmen) und b) allen Befehlszeilenargumenten, die zum Umschalten eines kombinierten Programms zwischen den Modi erforderlich sind (dies muss nicht der Fall sein -r). Wie beim Golf sind niedrigere Punktzahlen besser.

  • Für zwei separate Programme: Vorwärtscode + Rückwärtscode
  • Für ein kombiniertes Programm: kombinierter Code + Summe ( Vorwärtsargumente ) + Summe ( Rückwärtsargumente ) - 2

Angabe der gewählten xxdTeilmenge

Der Vorwärtsbefehl ( z. B. xxd ) akzeptiert 0 ≤ n ≤ 2 16 Bytes von der Standardeingabe und generiert Ceil ( n / 16) Zeilen der Standardausgabe im folgenden Format (alle Hexadezimalstellen in Kleinbuchstaben):

  • Offset des ersten codierten Bytes (Formatstring "%07x:"); endet in"0"
  • Maximal 16 hexadezimal codierte Bytes, paarweise gruppiert (Formatzeichenfolge " %02x"für gerade Bytes, "%02x"für ungerade Bytes) und mit Leerzeichen auf 42 Zeichen rechts aufgefüllt
  • Die codierten Bytes werden als ASCII-Zeichen interpretiert, wobei die Werte nicht zwischen 0x20 und 0x7e ( '\40'und '\176') liegen"."
  • Eine Neue - Zeile ( "\n"; "\r\n"erlaubt , wenn die Standardausgabe im Binär - Modus)

Minimale Implementierung von ungolfed C:

#include <stdio.h>
int main() {
    unsigned char L[16];
    int t = 0, n, i, s;

    for (; (n = fread(L, 1, 16, stdin)); t += n) {
        printf("%07x:", t);
        s = 42;
        for (i = 0; i < n; i++)
            s -= printf(i & 1 ? "%02x" : " %02x", L[i]);
        printf("%*s", s, "");
        for (i = 0; i < n; i++)
            putchar(L[i] > '\37' && L[i] < '\177' ? L[i] : '.');
        printf("\n");
    }

    return 0;
}

Der Rückwärtsbefehl ( z. B. xxd -r ) akzeptiert alle unveränderten Ausgaben des Vorwärtsbefehls (sofern eine gültige Eingabe für diesen Befehl vorliegt) und erzeugt diese ursprüngliche Eingabe.

Anwendungsbeispiel

$ xxd < /dev/null | wc -c
0
$ php -r 'echo join(range("\0",~"\0"));' | xxd
0000000: 0001 0203 0405 0607 0809 0a0b 0c0d 0e0f  ................
0000010: 1011 1213 1415 1617 1819 1a1b 1c1d 1e1f  ................
0000020: 2021 2223 2425 2627 2829 2a2b 2c2d 2e2f   !"#$%&'()*+,-./
0000030: 3031 3233 3435 3637 3839 3a3b 3c3d 3e3f  0123456789:;<=>?
0000040: 4041 4243 4445 4647 4849 4a4b 4c4d 4e4f  @ABCDEFGHIJKLMNO
0000050: 5051 5253 5455 5657 5859 5a5b 5c5d 5e5f  PQRSTUVWXYZ[\]^_
0000060: 6061 6263 6465 6667 6869 6a6b 6c6d 6e6f  `abcdefghijklmno
0000070: 7071 7273 7475 7677 7879 7a7b 7c7d 7e7f  pqrstuvwxyz{|}~.
0000080: 8081 8283 8485 8687 8889 8a8b 8c8d 8e8f  ................
0000090: 9091 9293 9495 9697 9899 9a9b 9c9d 9e9f  ................
00000a0: a0a1 a2a3 a4a5 a6a7 a8a9 aaab acad aeaf  ................
00000b0: b0b1 b2b3 b4b5 b6b7 b8b9 babb bcbd bebf  ................
00000c0: c0c1 c2c3 c4c5 c6c7 c8c9 cacb cccd cecf  ................
00000d0: d0d1 d2d3 d4d5 d6d7 d8d9 dadb dcdd dedf  ................
00000e0: e0e1 e2e3 e4e5 e6e7 e8e9 eaeb eced eeef  ................
00000f0: f0f1 f2f3 f4f5 f6f7 f8f9 fafb fcfd feff  ................
$ xxd <<< 'The quick brown fox jumps over the lazy dog.'
0000000: 5468 6520 7175 6963 6b20 6272 6f77 6e20  The quick brown 
0000010: 666f 7820 6a75 6d70 7320 6f76 6572 2074  fox jumps over t
0000020: 6865 206c 617a 7920 646f 672e 0a         he lazy dog..
$ xxd <<< 'The quick brown fox jumps over the lazy dog.' | xxd -r
The quick brown fox jumps over the lazy dog.
PleaseStand
quelle
Sollte der Reverse-Modus falsche ASCII-Zeichen ignorieren? (FWIW macht das eigentlich xxd, was durchaus sinnvoll ist).
Peter Taylor
@PeterTaylor: Der Reverse-Modus muss nur bei unveränderten Hex-Dumps ordnungsgemäß funktionieren (Start bei 0000000, Hex-Ziffern in Kleinbuchstaben, 16 Bytes in allen Zeilen außer der letzten, keine Lücken usw. ). Eine Eingabevalidierung ist nicht erforderlich. Das heißt, es ist wahrscheinlich sinnvoll, die 16-stellige "ASCII" -Spalte rechts zu ignorieren, da sie nicht zur Unterscheidung von "" verwendet werden kann. und nicht druckbare Zeichen.
PleaseStand

Antworten:

3

Perl, 122 + 54 = 176, 122 + 45 = 167

Das Vorwärtsskript:

$/=$,;for(<>=~/.{1,16}/gs){$h="";$h.=sprintf"%*s%02x",++$m%2,"",ord for/./gs;
s/[^ -~]/./g;printf"%06x0:%-42s",$n++,$h;say}

Und das umgekehrte Skript:

/:(.+?)  /,print map{chr hex}$1=~/\w\w/gfor<>

(Dieser ist interessant; es gibt alle Arten von obskuren Fehlern, die je nach Eingabe im umgekehrten Skript auftreten können, wenn Sie nicht vorsichtig sind.)

Brot-Box
quelle
Da $1bekanntlich nur hexadezimale Ziffern und Leerzeichen enthalten, können Sie diese nicht /\w\w/anstelle von verwenden /[0-9a-f]{2}/?
Neil
$1enthält viele Dinge außer hexadezimalen Ziffern und Leerzeichen.
Brotkasten
Im Beispiel sehe ich nur hexadezimale Ziffern und Leerzeichen zwischen dem : und dem ``.
Neil
(Weiß jemand, wie man zwei Leerzeichen in Kommentaren erzeugt?)
Neil
@Neil Egal, ich habe meinen eigenen Code falsch gelesen. Ich erinnere mich jetzt nicht, warum ich es nicht nur benutzt habe /\w\w/. Es scheint so offensichtlich, dass ich das Gefühl habe, einen Grund zu haben, aber ich kann keinen sehen. Ich vermute, es war ein Überbleibsel aus einer Version, bei der versucht wurde, die anfängliche Regex zu vermeiden.
Brotkasten