Schneller Strichzeichnungsalgorithmus


Die Aufgabe besteht darin, einen Weg zu finden, um eine horizontale Linie in einem Array von 16-Bit-Ganzzahlen zu zeichnen.

Wir gehen von einem 256x192-Pixel-Array mit 16 Pixeln pro Wort aus. Eine Zeile ist ein zusammenhängender Lauf von gesetzten (1) Bits. Zeilen können in der Mitte eines Wortes beginnen, andere Wörter überlappen und in einem beliebigen Wort enden. Sie können auch mit demselben Wort beginnen und enden. Sie werden möglicherweise nicht in die nächste Zeile übernommen. Hinweis: Die mittleren Wörter sind einfach - schreiben Sie einfach 0xffff, aber die Kanten werden schwierig, ebenso wie die Behandlung des Falls für Anfang und Ende im selben Wort. Eine Funktion / Prozedur / Routine muss eine x0- und x1-Koordinate annehmen, die die horizontalen Start- und Stopppunkte sowie jede Koordinate angibt.

Ich schließe mich davon aus, weil ich selbst einen nahezu identischen Algorithmus für einen eingebetteten Prozessor entworfen habe, aber ich bin gespannt, wie andere vorgehen würden. Bonuspunkte für die Verwendung relativ schneller Operationen (zum Beispiel wäre eine 64-Bit-Multiplikations- oder Gleitkommaoperation auf einem eingebetteten Computer nicht schnell, eine einfache Bitverschiebung jedoch).

Bei Codegolf geht es um Kurzcode, nicht um schnellen Code oder die Optimierung der Geschwindigkeit.
@hallvabo Meine Lösung ist ziemlich kurz, etwa 5 Zeilen, wenn die Überprüfung der Grenzen und zusätzliche Funktionen (wie das Umschalten von Pixeln anstelle des Festlegens) entfernt werden.
@hallvabo, diese Seite nicht nur Codegolf. Es geht auch um die Optimierung der Geschwindigkeit, aber nicht um alle Arten der Optimierung: nicht um Hardwaredetails, sondern um die Komplexität des Algorithmus.
@ Nakilon: Ich bin anderer Meinung. Warum heißt diese Seite dann Code Golf? Es gibt Tausende anderer Websites für Diskussionen über algorithmische Komplexität und Geschwindigkeitsoptimierung.
@hallvabo: Aus den FAQ - "Code Golf - Stack Exchange ist für Code-Golfer und für diejenigen, die sich für Code-Golf (vom Anfänger bis zum Experten) und das Programmieren von Rätseln interessieren." Ich halte das für ein Programmierpuzzle.
Dieser Code setzt voraus, dass sowohl x0 als auch x1 inklusive Endpunkte sind und dass Wörter Little Endian sind (dh das (0,0) Pixel kann mit gesetzt werden array[0][0]|=1).

int line(word *array, int x0, int x1, int y) {
  word *line = array + (y << 4);
  word *start = line + (x0 >> 4);
  word *end = line + (x1 >> 4);
  word start_mask = (word)-1 << (x0 & 15);
  word end_mask = (unsigned word)-1 >> (15 - (x1 & 15));
  if (start == end) {
    *start |= start_mask & end_mask;
  } else {
    *start |= start_mask;
    *end |= end_mask;
    for (word *p = start + 1; p < end; p++) *p = (word)-1;
Der Haupttrick besteht darin, eine Nachschlagetabelle zum Speichern von Bitmasken der Pixel zu verwenden. Dies spart einige Operationen. Eine 1-KB-Tabelle ist heutzutage selbst für eine eingebettete Plattform nicht so groß

Wenn der Platz sehr knapp ist, kann die Nachschlagetabelle für den Preis von ein paar & 0xf auf nur 64B reduziert werden

Dieser Code ist in Python, kann aber einfach in jede Sprache portiert werden, die Bitoperationen unterstützt.

Wenn Sie C verwenden, können Sie die Schleife mit dem Gerätswitch von Duff abwickeln . Da die Zeile maximal 16 Wörter breit ist, würde ich die switchauf 14 Zeilen erweitern und auf die whileinsgesamt verzichten .

T=[65535, 32767, 16383, 8191, 4095, 2047, 1023, 511,
   255, 127, 63, 31, 15, 7, 3, 1]*16
U=[32768, 49152, 57344, 61440, 63488, 64512, 65024, 65280,
   65408, 65472, 65504, 65520, 65528, 65532, 65534, 65535]*16

def drawline(x1,x2,y):
    if x1_==x2_:
    while x1_<x2_:
        buf[x1_] = 0xffff

#### testing code ####

def clear():
    global buf

def render():
    for y in range(192):
        print "".join(bin(buf[(y<<4)+x])[2:].zfill(16) for x in range(16))

for y in range(0,192):
for x in range(10,200,6):
for y in range(-49,50):
    drawline(200-int((2500-y*y)**.5), 200+int((2500-y*y)**.5), y+60)

Hier ist eine C-Version meiner Python-Antwort, die die switch-Anweisung anstelle der while-Schleife verwendet und die Indizierung durch Inkrementieren eines Zeigers anstelle des Array-Index reduziert

Die Größe der Nachschlagetabelle kann erheblich reduziert werden, indem T [x1 & 0xf] und U [x2 & 0xf] für einige zusätzliche Anweisungen verwendet werden

#include <stdio.h>
#include <math.h>

unsigned short T[] = {0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001,
                      0xffff, 0x7fff, 0x3fff, 0x1fff, 0x0fff, 0x07ff, 0x03ff, 0x01ff,
                      0x00ff, 0x007f, 0x003f, 0x001f, 0x000f, 0x0007, 0x0003, 0x0001};

unsigned short U[] = {0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff,
                      0x8000, 0xc000, 0xe000, 0xf000, 0xf800, 0xfc00, 0xfe00, 0xff00,
                      0xff80, 0xffc0, 0xffe0, 0xfff0, 0xfff8, 0xfffc, 0xfffe, 0xffff};

unsigned short buf[192*16];

void clear(){
    int i;
    for (i=0; i<192*16; i++) buf[i]==0;

void render(){
    int x,y;
    for (y=0; y<192; y++){
        for (x=0; x<256; x++) printf("%d", (buf[(y<<4)+(x>>4)]>>(15-(x&15)))&1);

void drawline(int x1, int x2, int y){
    int y_ = y<<4;
    int x1_ = y_+(x1>>4);
    int x2_ = y_+(x2>>4);
    unsigned short *p = buf+x1_;

    if (x1_==x2_){

    switch (x2_-x1_){
    case 14: *p++ = 0xffff;
    case 13: *p++ = 0xffff;
    case 12: *p++ = 0xffff;
    case 11: *p++ = 0xffff;
    case 10: *p++ = 0xffff;
    case 9: *p++ = 0xffff;
    case 8: *p++ = 0xffff;
    case 7: *p++ = 0xffff;
    case 6: *p++ = 0xffff;
    case 5: *p++ = 0xffff;
    case 4: *p++ = 0xffff;
    case 3: *p++ = 0xffff;
    case 2: *p++ = 0xffff;
    case 1: *p++ = U[x2];

int main(){
    int x,y;

    for (y=0; y<192; y++){

    for (x=10; x<200; x+=6){

    for (y=-49; y<50; y++){
        x = sqrt(2500-y*y);
        drawline(200-x, 200+x, y+60);
    return 0;
@user unbekannt, wie lang ist ein Stück Schnur? Ich denke, es sollte schneller sein als die akzeptierte Antwort, da es eine Nachschlagetabelle verwendet, um den Arbeitsaufwand geringfügig zu reduzieren. Warum probierst du sie nicht aus und lässt uns wissen, was du findest?

Scala, 7s / 1M Zeilen 4,1s / 1M Zeilen

// declaration and initialisation of an empty field: 
val field = Array.ofDim[Short] (192, 16) 

erste Implementierung:

// util-method: set a single Bit:
def setBit (x: Int, y: Int) = 
  field (y)(x/16) = (field (y)(x/16) | (1 << (15 - (x % 16)))).toShort 
def line (x0: Int, x1: Int, y: Int) = 
  (x0 to x1) foreach (setBit (_ , y))

Nachdem ich den inneren Methodenaufruf eliminiert und die for- durch eine while-Schleife ersetzt habe, wird auf meinem 2-GHz-Single-Core mit Scala 2.8 1 Mio. freigesetzt. Linien in 4,1s sek. anstelle der ersten 7s.

  def line (x0: Int, x1: Int, y: Int) = {
    var x = x0
    while (x < x1) {  
      field (y)(x/16) = (field (y)(x/16) | (1 << (15 - (x % 16)))).toShort
      x += 1

Testcode und Aufruf:

// sample invocation:
line (12, 39, 3) 
// verification 
def shortprint (s: Short) = s.toBinaryString.length match {          
  case 16 => s.toBinaryString                                          
  case 32 => s.toBinaryString.substring (16)                           
  case x  => ("0000000000000000".substring (x) + s.toBinaryString)}

field (3).take (5).foreach (s=> println (shortprint (s)))            
// result:


  val r = util.Random 

  def testrow () {
    val a = r.nextInt (256)
    val b = r.nextInt (256)
    if (a < b)
      line (a, b, r.nextInt (192)) else
        line (b, a, r.nextInt (192)) 

  def test (count: Int): Unit = {
    for (n <- (0 to count))
      testrow ()

  // 1 mio tests
  test (1000*1000) 

Getestet mit der Unix-Tool-Zeit, Vergleich der Benutzerzeit, einschließlich Startzeit, kompiliertem Code, keine JVM-Startphase.

Das Erhöhen der Anzahl der Zeilen zeigt, dass für jede neue Million zusätzliche 3,3 Sekunden benötigt werden.

