Dies ist weder ein Sudoku-Löser noch ein Sudoku-Prüfer.
Ihre Herausforderung besteht darin, eine Funktion oder ein Skript zu schreiben, die / das als Eingabe die "Block" -Größe eines 2D-Sudoku-Puzzles (3 für das klassische 9x9-Board , 4 für ein 16x16-Board usw.) eine Annäherung der Zahl berechnet von verschiedenen Rätseln (Lösungen), die für diese Größe existieren.
Bei Eingabe 3 sollte Ihr Programm beispielsweise mit der gewünschten Genauigkeit eine Annäherung an die Zahl 6.670.903.752.021.072.936.960 drucken, die der bekannten Anzahl unterschiedlicher 9x9-Sudoku-Rätsel entspricht , oder an 5.472.730.538, wenn die verschiedenen Symmetrien berücksichtigt werden. In Ihrer Lösung sollte angegeben werden, ob Symmetrien gezählt oder ignoriert werden.
"Gewünschte Genauigkeit" bleibt undefiniert: Ihr Programm wird möglicherweise für eine bestimmte Zeit ausgeführt und gibt dann das Ergebnis aus oder berechnet es bis zu einer bestimmten Anzahl von signifikanten Stellen oder wird sogar für immer ausgeführt, wobei immer bessere Näherungswerte gedruckt werden. Der Punkt ist, dass es möglich sein sollte, das Ergebnis in einer endlichen Zeit mit jeder erforderlichen Genauigkeit zu berechnen. ("42" ist also keine akzeptable Antwort.) Es ist akzeptabel, die Genauigkeit Ihres Ergebnisses auf die verfügbaren Maschinenschwimmer zu beschränken.
Kein Zugriff auf Online-Ressourcen, kein Speichern des Quellcodes im Dateinamen usw.
PS: Ich weiß, dass dies ein schwieriges Problem ist (NP-vollständig, wenn ich mich nicht irre). Diese Frage verlangt jedoch nur eine ungefähre statistische Lösung. Sie können beispielsweise zufällige Konfigurationen ausprobieren, die eine (oder besser zwei) Einschränkungen erfüllen, berechnen, wie viele davon vorhanden sind, und dann überprüfen, wie oft Sie ein Puzzle erhalten, das alle drei Einschränkungen erfüllt. Dies funktioniert in angemessener Zeit für kleine Größen (sicherlich für Größe = 3 und möglicherweise 4), aber der Algorithmus sollte generisch genug sein, um für jede Größe zu funktionieren.
Der beste Algorithmus gewinnt.
PS2: Ich habe von Code-Golf zu Code-Challenge gewechselt, um die Schwierigkeit des Problems besser widerzuspiegeln und intelligentere Lösungen zu fördern, anstatt dumme, aber gut Golf-fähige. Aber da der "beste Algorithmus" anscheinend unklar ist, möchte ich versuchen, ihn richtig zu definieren.
Welche Lösung würde bei genügend Zeit und ohne Berücksichtigung konstanter Faktoren (einschließlich CPU- und Interpreter-Geschwindigkeit) oder gleichwertig unter Berücksichtigung ihres asymptotischen Verhaltens am schnellsten zum exakten Ergebnis konvergieren?
quelle
Antworten:
C ++
Was ich hier vorstellen werde, ist ein Algorithmus, der anhand eines Beispiels für einen 3x3-Fall veranschaulicht wird. Es könnte theoretisch auf den NxN-Fall ausgedehnt werden, aber das würde einen viel leistungsstärkeren Computer und / oder einige geniale Verbesserungen erfordern. Ich werde im Laufe der Zeit einige Verbesserungen erwähnen.
Bevor wir fortfahren, wollen wir die Symmetrien des Sudoku-Gitters beachten, dh die Transformationen, die auf triviale Weise zu einem anderen Gitter führen. Für Blockgröße 3 sind die Symmetrien wie folgt:
Horizontale Symmetrie
Vertikale Symmetrie
Beachten Sie, dass horizontale und vertikale Reflexionen des Gitters durch eine Kombination dieser erreicht werden können, sodass sie nicht gezählt werden müssen. Es ist noch eine räumliche Symmetrie zu berücksichtigen, nämlich die Transponierung, die ein Faktor von ist
2
. Dies ergibt die gesamte räumliche Symmetrie vonDann gibt es noch eine andere, sehr wichtige Symmetrie, die als Relabelling bezeichnet wird.
Die Gesamtzahl der Lösungen kann nicht einfach durch Multiplizieren der Anzahl der symmetriespezifischen Lösungen mit dieser Anzahl ermittelt werden, da es eine Anzahl (weniger als 1%) automorpher Lösungen gibt. Das bedeutet, dass es für diese speziellen Lösungen eine Symmetrieoperation gibt, die sie sich selbst zuordnet, oder mehrere Symmetrieoperationen, die sie derselben anderen Lösung zuordnen.
Um die Anzahl der Lösungen abzuschätzen, gehe ich das Problem in vier Schritten an:
1.Füllen Sie ein Array
r[362880][12]
mit allen möglichen Permutationen der Zahlen 0 bis 8. (Dies ist Programmierung und es ist in C, daher werden wir nicht 1 bis 9 verwenden.) Wenn Sie klug sind, werden Sie feststellen, dass der zweite Index ist 12 nicht 9. Dies liegt daran, dass wir dabei drei weitere ganze Zahlen berechnen,r[9,10,11] == 1<<a | 1<<b | 1<<c
wobei sich 9,10,11 auf den ersten, zweiten und dritten Stapel beziehen , wobei wir berücksichtigen, dass dies eine "Zeile" ist und a, b, c sind die drei Zahlen, die in jedem Stapel für diese Zeile vorhanden sind.2.Füllen Sie ein Array
b
mit allen möglichen Lösungen eines Bandes aus 3 Zeilen. Um dies relativ klein zu halten, schließen Sie nur die Lösungen ein, bei denen die oberste Zeile 012.345.678 ist. Ich tue dies mit brutaler Gewalt, durch alle möglichen mittleren Reihen und ANDing Erzeugungr[0][10,11,12]
mitr[i][10,11,12]
. Jeder positive Wert bedeutet, dass sich zwei identische Zahlen auf demselben Quadrat befinden und das Band ungültig ist. Wenn es eine gültige Kombination für die ersten beiden Zeilen gibt, suche ich die dritte (untere) Zeile mit derselben Technik.Ich habe das Array als b [2000000] [9] dimensioniert, aber das Programm findet nur 1306368 Lösungen. Ich wusste nicht, wie viele es waren, also habe ich die Array-Dimension so verlassen. Dies ist eigentlich nur die Hälfte der möglichen Lösungen für ein einzelnes Band (verifiziert auf Wikipedia), da ich nur die 3. Zeile vom aktuellen Wert nach
i
oben scanne. Die verbleibende Hälfte der Lösungen kann trivial durch Austausch der 2. und 3. Reihe gefunden werden.Die Art und Weise, wie die Informationen im Array gespeichert werden,
b
ist zunächst etwas verwirrend. Anstatt jede Ganzzahl zum Speichern der0..8
an einer bestimmten Position gefundenen Zahlen zu verwenden , berücksichtigt hier jede Ganzzahl eine der Zahlen0..8
und gibt an, in welchen Spalten sie gefunden werden kann. Diesb[x][7]==100100001
würde darauf hinweisen, dass für Lösung x die Zahl 7 in den Spalten 0,5 und 8 (von rechts nach links) gefunden wird. Der Grund für diese Darstellung ist, dass wir den Rest der Möglichkeiten für das Band durch erneutes Etikettieren generieren müssen, und dies Darstellung macht es bequem, dies zu tun.Die beiden obigen Schritte umfassen das Setup und dauern ungefähr eine Minute (möglicherweise weniger, wenn ich die unnötige Datenausgabe entfernt habe. Die beiden folgenden Schritte sind die eigentliche Suche.)
3 Suchen Sie nach dem Zufallsprinzip nach Lösungen für die ersten beiden Bänder, die nicht zusammenstoßen (dh nicht zweimal dieselbe Nummer in einer bestimmten Spalte haben. Wir wählen eine Zufallslösung für Band 1 unter der Annahme, dass immer die Permutation 0 gilt, und eine Zufallslösung für Band 2 mit eine zufällige Permutation. Ein Ergebnis wird normalerweise in weniger als 9999 Versuchen gefunden (Trefferquote der ersten Stufe im Tausenderbereich) und dauert einen Bruchteil einer Sekunde. Mit Permutation meine ich, dass wir für das zweite Band eine Lösung aus b [] nehmen. [] wobei die erste Zeile immer 012.345.678 ist und neu beschriftet wird, so dass jede mögliche Folge von Zahlen in der ersten Zeile möglich ist.
4 Wenn in Schritt 3 ein Treffer gefunden wird, suchen Sie nach einer Lösung für das dritte Band, die nicht mit den beiden anderen zusammenstößt. Wir möchten nicht nur einen Versuch machen, da sonst die Verarbeitungszeit für Schritt 3 verschwendet würde. Auf der anderen Seite wollen wir uns nicht übermäßig anstrengen.
Nur zum Spaß habe ich es letzte Nacht so dumm wie möglich gemacht, aber es war immer noch interessant (weil es ewig nichts gab und dann eine große Anzahl von Lösungen in Bursts gefunden hat). Es hat die ganze Nacht gedauert, um einen Datenpunkt zu bekommen, selbst mit dem kleinen Hack
(!z)
Ich habe die letztek
Schleife abgebrochen, sobald wir wissen, dass dies keine gültige Lösung ist (wodurch sie fast neunmal schneller ausgeführt wird). Es wurden 1186585 Lösungen für das gesamte Raster gefunden, nachdem alle 362880-Neuetiketten aller 1306368 kanonischen Lösungen nach der letzten durchsucht wurden Block, insgesamt 474054819840 Möglichkeiten. Das ist eine Trefferquote von 1 zu 400000 für die zweite Stufe. Ich werde es bald erneut mit einer zufälligen Suche und nicht mit einem Scan versuchen. Es sollte in nur wenigen Millionen Versuchen eine vernünftige Antwort geben, was nur wenige Sekunden dauern sollte.Die Gesamtantwort sollte (362880 * (1306368 * 2)) ^ 3 * Trefferquote = 8,5E35 * Trefferquote sein. Wenn ich aus der Zahl in der Frage zurückrechne, erwarte ich eine Trefferquote von 1 / 1,2E14. Was ich bisher mit meinem einzelnen Datenpunkt erreicht habe, ist 1 / (400000 * 1000), was einem Faktor von ungefähr einer Million entspricht. Dies kann eine Zufallsanomalie, ein Fehler in meinem Programm oder ein Fehler in meiner Mathematik sein. Ich werde nicht wissen, was es ist, bis ich ein paar weitere Tests durchführe.
Ich werde das heute Nacht hier lassen. Der Text ist ein bisschen kratzig, ich werde ihn bald aufräumen und hoffentlich weitere Ergebnisse hinzufügen und vielleicht ein paar Worte darüber, wie man ihn schneller macht und wie man das Konzept auf N = 4 erweitert. Ich glaube aber nicht, dass ich noch zu viele Änderungen an meinem Programm vornehmen werde :-)
Ah .. das Programm:
quelle