Martin Ender hat vor kurzem 100.000 erreicht und sich einige ziemlich großartige Sprachen ausgedacht . Wir werden ein bisschen Spaß mit einem von ihnen haben, Hexagony (und ein bisschen Regex für Retina )
Als kurze Übersicht müssen Sie ein Programm schreiben, das ein Hexagony-Raster eingibt und feststellt, ob sich auf diesem Raster ein Pfad befindet, der mit einer Textzeichenfolge übereinstimmt
Generieren
Hexagony generiert Sechsecke aus einer Zeichenfolge mit den folgenden Schritten:
- Berechne die minimale Sechseckgröße (nimm die Länge des Strings und runde auf die nächste Sechseckzahl auf )
- Wickeln Sie den Text in ein Sechseck der obigen Größe
- Füllen Sie die restlichen Stellen mit
.
.
Beispielsweise abcdefghijklm
erfordert die Textzeichenfolge ein Sechseck mit der Seitenlänge 3 und wird daher zu:
a b c
d e f g
h i j k l
m . . .
. . .
Beachten Sie nun, dass es 6 mögliche Richtungen gibt, die Sie in einem Sechseck fahren können. Beispielsweise ist im obigen Sechseck e
neben abfjid
.
Verpackung
Außerdem werden in Hexagony Hexagone wie folgt umbrochen:
. . . . . a . . . . f . . a . .
a b c d e . . b . . . . g . . . b . . f
. . . . . . g . . c . . . . h . . a . c . . g .
. . . . . . . . h . . d . . . . u . . b . . d . . h . .
f g h i j k . i . . e . . j . . c . e . . i . .
. . . . . . j . . f k . . d . . . j . .
. . . . . k . . . . e . . k . .
Wenn Sie sich das 2. und 4. Beispiel ansehen, bemerken Sie, wie a
und k
an den gleichen Stellen, obwohl Sie in verschiedene Richtungen wickeln. Aufgrund dieser Tatsache grenzen diese Spots nur an 5 andere Standorte .
Um dies klarer zu machen:
a b c d
e f g h i
j k l m n o
p q r s t u v
w x y z A B
C D E F G
H I J K
- Kanten werden auf den gegenüberliegenden Nachbarn (
b->I
undG->j
) gewickelt . - Die oberen / unteren Ecken werden zur gegenüberliegenden mittleren Ecke und nach oben / unten (
d->K,p
undH->a,v
) gewickelt. - Die mittleren Ecken werden in die oberen und unteren Ecken gewickelt (
v->a,H
)
Pfade
Ein Pfad , der eine Folge benachbarter Orte sein soll, ohne an denselben Ort zurückzukehren.
a b c
d e f g
h i f k l
m . . .
. . .
Im obigen Sechseck aefkgm
ist ein gültiger Pfad. Ist abfd
jedoch kein gültiger Pfad ( f
und d
grenzt nicht an) und abea
ist nicht gültig (kehrt zum a
Speicherort zurück).
Wir können diese Pfade verwenden, um Text abzugleichen (wie Regex) . Ein alphanumerisches Zeichen entspricht sich selbst (und nur sich selbst), und ein .
Zeichen entspricht einem beliebigen Zeichen. Zum Beispiel kann der Weg aej..lgm
würde übereinstimmen aej..lgm
, aejAAlgm
, aeja.lgm
, oder aej^%gm
.
Input-Output
Ihr Programm sollte zwei Zeichenfolgen (in beliebiger Reihenfolge) enthalten. Die erste Zeichenfolge ist nicht leer und besteht nur aus alphanumerischen Zeichen [a-zA-Z0-9]
. Dies stellt das Sechseck dar, mit dem Sie arbeiten. Die zweite Zeichenfolge besteht aus druckbaren Zeichen.
Sie müssen einen Wahrheitswert zurückgeben, wenn sich im Sechseck ein Pfad befindet, der mit der angegebenen Zeichenfolge übereinstimmt, andernfalls ein falscher Wert.
Testfälle
Wahrheit:
"a","a"
"ab","a"
"ab","b"
"ab","ba"
"ab","aba"
"ab","&"
"ab","#7.J!"
"ab","aaaaaa"
"ab","bgjneta"
"ab","cebtmaa"
"abcdefg","dfabcg"
"AbCDeFG","GCbAeFD"
"aaaabbb","aaababb"
"abcdefghijklmnopqrs","alq"
"abcdefghijklmnopqrs","aqnmiedh"
"abcdefghijklmnopqrs","adhcgkorbefjimnqlps"
"11122233344455","12341345123245"
"abcdefgh","h%a"
"abcdefghijklm","a)(@#.*b"
"abcdefghijklm","a)(@#.*i"
"abcdefghij","ja"
"abcdefghijklmno","kgfeia"
"abcdefghijklmno","mmmmmiea"
"abcdefghijklmno","mmmmmlae"
"abcdefghijklmno","ja"
"abcdefghijklmnopqrs","eijfbadhmnokgcsrql"
Falsch:
"a","b"
"a","%"
"a","."
"a","aa"
"a","a."
"ab","#7.J!*"
"ab","aaaaaaa"
"ab","aaaabaaa"
"ab","123456"
"abcdefg","bfgedac"
"abcdefg","gecafdb"
"abcdefg","GCbaeFD"
"aaaabbb","aaaaabb"
"abcdefghijklmnopqrs","aqrcgf"
"abcdefghijklmnopqrs","adhlcgknbeifjm"
"abcdefghijklmnopqrs","ja"
"abcdefghijklm","a)(@#.*&"
"abcdefghijklmno","a)(@bfeijk"
"abcdefghijklmno","kgfeic"
"abcdefghijklmno","mmmmmmiea"
Dies ist ein Code-Golf , also machen Sie Ihre Antworten so kurz wie möglich in Ihrer Lieblingssprache.
quelle
Antworten:
Retina , 744 Bytes
Sorry Leute, diesmal kein Hexagony ...
Die Anzahl der Bytes setzt die Kodierung nach ISO 8859-1 voraus.
Erwartet die Zielzeichenfolge in der ersten Zeile und das Sechseck in der zweiten Zeile der Eingabe. Druckt
0
oder1
entsprechend.Probieren Sie es online! (Die erste Zeile aktiviert eine Testsuite, bei der jede Zeile ein Testfall ist und
¦
für die Trennung anstelle eines Zeilenvorschubs verwendet wird.)Der richtige Weg, um diese Herausforderung zu lösen, ist natürlich mit einem Regex. ;) Und ohne die Tatsache, dass diese Herausforderung auch das Entfalten des Sechsecks beinhaltet , würde diese Antwort eigentlich nur aus einem einzigen ~ 600 Byte langen regulären Ausdruck bestehen.
Dies ist noch nicht ganz optimal, aber ich bin mit dem Ergebnis ziemlich zufrieden (meine erste Arbeitsversion nach dem Entfernen von benannten Gruppen und anderem für die Vernunft erforderlichen Material war ungefähr 1000 Bytes). Ich denke, ich könnte ungefähr 10 Bytes einsparen, indem ich die Reihenfolge der Zeichenfolge und des Sechsecks vertausche, aber es würde am Ende ein vollständiges Umschreiben des regulären Ausdrucks erfordern, was ich derzeit nicht für richtig halte. Es gibt auch eine 2-Byte-Einsparung, wenn die
G
Bühne weggelassen wird , aber dies verlangsamt die Lösung erheblich. Ich werde mit dieser Änderung warten, bis ich sicher bin, dass ich so gut wie möglich Golf gespielt habe.Erläuterung
Der Hauptteil dieser Lösung verwendet in großem Umfang Bilanzkreise , daher empfehle ich, sie zu lesen, wenn Sie verstehen möchten, wie dies im Detail funktioniert (ich werde Ihnen keine Vorwürfe machen, wenn Sie dies nicht tun ...).
Der erste Teil der Lösung (dh alles außer den letzten beiden Zeilen) ist eine modifizierte Version meiner Antwort auf das Entfalten des Hexagony-Quellcodes . Es konstruiert das Sechseck, während die Zielzeichenfolge unberührt bleibt (und es konstruiert tatsächlich das Sechseck vor der Zielzeichenfolge). Ich habe einige Änderungen am vorherigen Code vorgenommen, um Bytes zu sparen:
×
anstelle eines Leerzeichens, damit es nicht zu Konflikten mit potenziellen Leerzeichen in der Eingabe kommt._
stattdessen.
, sodass Rasterzellen zuverlässig als Wortzeichen identifiziert werden können.Hier ist ein Beispiel. Für den folgenden Testfall:
Wir bekommen:
Vergleichen Sie dies mit der üblichen Anordnung des Sechsecks:
Wir können sehen, dass die Nachbarn jetzt alle die üblichen 8 Moore-Nachbarn sind, mit Ausnahme der Nordwest- und Südostnachbarn. Wir müssen also die horizontale, vertikale und südwestliche / nordöstliche Nachbarschaft prüfen (und dann gibt es die Umhüllungskanten). Die Verwendung dieses kompakteren Layouts hat auch den Vorteil, dass wir diese
××
am Ende verwenden können, um die Größe des Sechsecks im Handumdrehen zu bestimmen, wenn wir es benötigen.Nachdem dieses Formular erstellt wurde, nehmen wir eine weitere Änderung an der gesamten Zeichenfolge vor:
Dadurch werden die Ziffern durch die erweiterten ASCII-Buchstaben ersetzt
Da sie sowohl im Sechseck als auch in der Zielzeichenfolge ersetzt werden, hat dies keinen Einfluss darauf, ob die Zeichenfolge übereinstimmt oder nicht. Außerdem, da es sich um Buchstaben handelt
\w
und diese\b
immer noch als Sechseckzellen identifiziert werden. Der Vorteil dieser Ersetzung besteht darin, dass wir nun\D
in der kommenden regulären Ausdrucksweise jedes Zeichen (insbesondere Zeilenvorschübe sowie Nicht-Zeilenvorschübe) abgleichen können. Wir können dies
Option nicht verwenden, um dies zu erreichen, da wir.
Zeichen ohne Zeilenvorschub an mehreren Stellen abgleichen müssen.Jetzt das letzte Bit: Bestimmen, ob ein Pfad mit unserer angegebenen Zeichenfolge übereinstimmt. Dies geschieht mit einem einzigen monströsen Regex. Sie könnten sich fragen, warum?!?! Nun, das ist im Grunde genommen ein Backtracking-Problem: Sie beginnen irgendwo und versuchen einen Pfad, solange er mit der Zeichenfolge übereinstimmt, und wenn dies nicht der Fall ist, gehen Sie zurück und versuchen Sie es mit einem anderen Nachbarn als dem zuletzt funktionierenden Zeichen. Die eine SacheDas, was Sie bei der Arbeit mit Regex kostenlos bekommen, ist Backtracking. Das ist buchstäblich das einzige, was die Regex-Engine macht. Wenn wir also nur einen Weg finden, um einen gültigen Pfad zu beschreiben (der für diese Art von Problem schwierig genug ist, aber mit Bilanzgruppen definitiv möglich ist), dann wird die Regex-Engine diesen Pfad unter allen möglichen für uns herausfinden. Es wäre sicherlich möglich, die Suche manuell in mehreren Schritten durchzuführen ( und das habe ich in der Vergangenheit getan ), aber ich bezweifle, dass es in diesem speziellen Fall kürzer wäre.
Ein Problem bei der Implementierung mit einem regulären Ausdruck ist, dass wir den Cursor des regulären Ausdrucksmoduls während des Zurückverfolgens nicht willkürlich durch den String bewegen können (was wir benötigen würden, da der Pfad möglicherweise nach oben oder unten führt). Stattdessen verfolgen wir unseren eigenen "Cursor" in einer Erfassungsgruppe und aktualisieren diesen bei jedem Schritt (wir können mit einem Lookaround vorübergehend an die Position des Cursors springen). Auf diese Weise können wir auch alle früheren Positionen speichern, anhand derer wir überprüfen, ob wir die aktuelle Position noch nicht besucht haben.
Also lasst uns loslegen. Hier ist eine etwas vernünftigere Version des regulären Ausdrucks mit benannten Gruppen, Einrückung, weniger zufälliger Reihenfolge der Nachbarn und einigen Kommentaren:
Ich hoffe, dass die allgemeine Idee hieraus ungefähr klar wird. Schauen wir uns als Beispiel für eine dieser Bewegungen entlang des Pfades das Bit an, das den Cursor nach Süden bewegt:
Denken Sie daran, dass Lookbehinds von rechts nach links (oder von unten nach oben) gelesen werden sollten, da dies die Reihenfolge ist, in der sie ausgeführt werden:
Beachten Sie, dass es nicht erforderlich ist, einen Anker vor den
\k<pos>
zu setzen, um sicherzustellen, dass dieser tatsächlich den Anfang der Zeichenfolge erreicht.<pos>
Beginnt immer mit einer Menge×
, die nirgendwo anders zu finden ist, und fungiert daher bereits als impliziter Anker.Ich möchte diesen Beitrag nicht mehr als nötig aufblähen, deshalb gehe ich nicht auf die anderen 11 Fälle im Detail ein, aber im Prinzip funktionieren sie alle ähnlich. Wir überprüfen
<next>
mit Hilfe von Bilanzkreisen, ob von der alten Cursorposition aus eine bestimmte (zulässige) Richtung gefunden werden kann, und speichern dann die Zeichenfolge bis zu dieser Übereinstimmung als neue Cursorposition in<pos>
.quelle
Python 3,
990943770709 BytesErste Antwort, yay!
BEARBEITEN: Erstellen einer Golf-Adjazenzliste. Ich verwende jetzt eine etwas andere Formel
EDIT 2: Unnötige Flusen entfernt, viel mehr golfen.
EDIT 3: Der Code für die Konvertierung von Index in Liste in Koordinaten wurde verkürzt, und es wurden noch ein paar Dinge erledigt.
Der Großteil der Bytes bezieht sich auf die Erstellung der Adjazenzliste (sie hat das größte Potenzial zum Golfen). Von da an ist es eine einfache Sache, die Lösung brachial zu erzwingen (was ich möglicherweise in weniger Bytes tun kann).
Golf gespielt:
Ungolfed w / Erklärung:
So nah an der Retina! :(Yay, schlagen Sie Retina!quelle
Javascript (ES6),
511500496 BytesUngolfed und kommentiert
Testfälle
Das folgende Snippet geht alle wahrheitsgemäßen und falschen Testfälle durch.
Code-Snippet anzeigen
quelle