DNA: Desoxyribonucleic ASCII

22

Ausgehend von einer Sequenz der Basen Adenin, Cytosin, Guanin und Thymin (kodiert als ACGT) müssen Sie eine ASCII-Art-Darstellung eines entsprechenden DNA-Doppelstrangs erstellen.

Der Strang wird sich vertikal erstrecken. Der linke Strang ist der, den Sie als Eingabe erhalten. Der rechte Strang wird seine Ergänzung sein. Für diejenigen, die nicht mit DNA vertraut sind, Aist gepaart mit Tund Cist gepaart mit G. Darüber hinaus gibt es auf beiden Seiten des Doppelstrangs eine Grundgerüststruktur, die für alle Basen identisch ist. Wenn Sie also die Eingabe erhalten TAGCATwürden, wäre die großräumige Struktur der ASCII-Grafik:

BTAB
BATB
BGCB
BCGB
BATB
BTAB

wo Brepräsentiert das Rückgrat. Jetzt steht jeder dieser Buchstaben für ein ganzes Molekül und Sie müssen die tatsächliche Molekülstruktur reproduzieren .

Die Grundlagen

Verwenden Sie die folgenden Vorlagen 1 für jede der Basen (jede wird zusammen mit ihrer komplementären Base und den beiden Grundgerüstmolekülen angezeigt):

1 Dank an Peter Taylor für die Unterstützung beim ASCII-Layout.

Adenin

 O    O
  \\ /
    P
   / \
--O   O
     /                                         |
    <            N      NH2 ..... O      *     |
     \         // \    /           \\   /      |
      +--O    //   ----             ----       |
      |   \   |   //  \\           /   \\      |
      |    >--N--<      N ...... HN      >  ---+
      |   /       \    /           \    /  /   |
      +---         N===             ---N--<    |
      |                            //      \   |
      |                           O         O--+
      |                                         \
      |                                          >
      |                                         /
                                               O   O--
                                                \ /
                                                 P
                                                / \\
                                               O    O

Cytosin

 O    O
  \\ /
    P
   / \
--O   O            NH2 ..... O      N
     /            /           \\   / \\        |
    <         ----             ----   \\    ---+
     \       //  \\           /   \\   |   /   |
      +--O  <      N ...... HN      >--N--<    |
      |   \  \    /           \    /       \   |
      |    >--N---             ===N         O--+
      |   /      \\           /                 \
      +---         O ..... H2N                   >
      |                                         /
                                               O   O--
                                                \ /
                                                 P
                                                / \\
                                               O    O

Guanin

 O    O
  \\ /
    P
   / \
--O   O
     /                                         |
    <            N      O ..... H2N            |
     \         // \   //           \           |
      +--O    //   ----             ----       |
      |   \   |   //   \           //  \\      |
      |    >--N--<      NH ...... N      >  ---+
      |   /       \    /           \    /  /   |
      +---         N===             ---N--<    |
      |                \           //      \   |
      |                 NH2 ..... O         O--+
      |                                         \
      |                                          >
      |                                         /
                                               O   O--
                                                \ /
                                                 P
                                                / \\
                                               O    O

Thymin

 O    O
  \\ /
    P
   / \
--O   O     *      O ..... H2N      N
     /       \   //           \    / \\        |
    <         ----             ----   \\    ---+
     \       //   \           //  \\   |   /   |
      +--O  <      NH ...... N      >--N--<    |
      |   \  \    /           \    /       \   |
      |    >--N---             ===N         O--+
      |   /      \\                             \
      +---         O                             >
      |                                         /
                                               O   O--
                                                \ /
                                                 P
                                                / \\
                                               O    O

Aufbau des Doppelstrangs

Diese wiederholen sich vertikal, so dass es keine Lücken in der Backbone-Struktur gibt. Dies bedeutet, dass sich die Begrenzungsrahmen dieser vier Vorlagen überlappen.

Das untere Ende des linken und oberen Endes des rechten Backbones wird mit dem Oeines verbunden OH.

Das freie OEnde am oberen Ende des linken und unteren Endes des rechten Rückgrats hat eine freie Bindung nach innen, angezeigt durch --.

Beispiel ATG

 O    O--
  \\ /
    P
   / \
--O   O                                        OH
     /                                         |
    <            N      NH2 ..... O      *     |
     \         // \    /           \\   /      |
      +--O    //   ----             ----       |
      |   \   |   //  \\           /   \\      |
      |    >--N--<      N ...... HN      >  ---+
      |   /       \    /           \    /  /   |
      +---         N===             ---N--<    |
      |                            //      \   |
      |                           O         O--+
      |                                         \
      |                                          >
      |                                         /
 O    O                                        O   O--
  \\ /                                          \ /
    P                                            P
   / \                                          / \\
--O   O     *      O ..... H2N      N          O    O
     /       \   //           \    / \\        |
    <         ----             ----   \\    ---+
     \       //   \           //  \\   |   /   |
      +--O  <      NH ...... N      >--N--<    |
      |   \  \    /           \    /       \   |
      |    >--N---             ===N         O--+
      |   /      \\                             \
      +---         O                             >
      |                                         /
 O    O                                        O   O--
  \\ /                                          \ /
    P                                            P
   / \                                          / \\
--O   O                                        O    O
     /                                         |
    <            N      O ..... H2N            |
     \         // \   //           \           |
      +--O    //   ----             ----       |
      |   \   |   //   \           //  \\      |
      |    >--N--<      NH ...... N      >  ---+
      |   /       \    /           \    /  /   |
      +---         N===             ---N--<    |
      |                \           //      \   |
      |                 NH2 ..... O         O--+
      |                                         \
      |                                          >
      |                                         /
      OH                                       O   O--
                                                \ /
                                                 P
                                                / \\
                                             --O    O

Mehr Beispiele:

Hier sind die MD5-Hashes mehrerer weiterer Beispiele (ohne führende oder nachfolgende Leerzeichen):

ATG      2e4a906c44a96fe84134bf4346adf11c (this is the above example)
C        e3648b8960967463784818c3eee57246
TTT      6028a90b05775905ef1a00e7a45463c5
TAGCAT   3b834d2b7b9adc4113ffabd52d354c41
GATTACA  a19463f965c641d071e07da59d64a418

Lassen Sie mich wissen, wenn Sie denken, dass eines davon falsch ist.

Wenn Sie nicht sicher sind, wie Sie die Hashes Ihrer Ergebnisse zuverlässig überprüfen können, probieren Sie diesen Online-MD5-Generator aus . Stellen Sie sicher, dass kein Zeilenumbruch erfolgt.

Weitere Hinweise

Sie können nach Belieben führende oder nachfolgende Leerzeichen verwenden. Wenn Sie führende Leerzeichen verwenden, muss die Anzahl in jeder Zeile gleich sein.

Wenn ich beim Kopieren der chemischen Struktur Fehler gemacht habe, sind die obigen Schablonen für die Zwecke dieser Herausforderung immer noch normativ.

Sie können eine Funktion oder ein Programm schreiben, das die Eingabe nimmt Zeichenfolge als Parameter, Befehlszeilenargument über STDIN oder erwartet , dass sie in einer Variablen gespeichert werden. Schreiben Sie die resultierende ASCII-Grafik in STDOUT.

Dies ist Codegolf, daher gewinnt die kürzeste Antwort (in Bytes).

Martin Ender
quelle
Erstaunliche Herausforderung!
Ray
9
GATTACA sollte erforderlich sein
Kevin
1
@ Kevin Ich habe sogar darüber nachgedacht, also habe ich es jetzt hinzugefügt. ;) Ich habe auch den Hash für behoben, TTTweil der String eine nachgestellte Newline enthielt.
Martin Ender
Wie bekommt man die md5-Prüfsumme? Ich habe Ihre ATGAusgabe kopiert und eine andere Prüfsumme erhalten. Und unterschiedliche Betriebssysteme erhalten unterschiedliche Prüfsummen. Sie können diese mit versuchen unix2dos, unix2mac....
Ray
@ Ray Ich habe sie mit Ruby's Digest::MD5.hexdigest()mit Unix-Linienenden. Außerdem hat keiner von ihnen eine nachgestellte neue Zeile. Fügen Sie es hier ein - dieser Online-MD5-Generator stimmt mit meinen Hashes überein.
Martin Ender

Antworten:

2

Perl 5 (510)

Perl ist in Ordnung mit Null-Bytes. Verwenden Sie daher den dafür vorgesehenen Hexdump.

Dies funktioniert, indem verschiedene Teile des DNA-Strangs ausgedruckt werden, wobei Teile eine oder mehrere Zeilen sind. Ein O oder H wird an die oberste Zeile jeder Komponente angehängt, um eine gültige Ausgabe sicherzustellen.

Angenommen, die Eingabe erfolgt in der Variablen $_ .

Golf Version:

use Compress::Zlib;@f=(eval uncompress q+xœÍUËnà ¼ó{³””¬”slqäù |xšÅ<
MÔv¤(1b¼;Ì„]8× `?CÐË×ÂÜ/¥À—¼ÃÍ"6p!ÇvDÿ@k
‘®^ÝÀ
²>ÈB$ì¡ÌHBýi`ã\qþˆRn^‚¢6WéJ±íRCXÀ\Cj[­ëzÖKg-µ€˜*Rt®abš3‘ª¤°È†"]ÖSX‰G2ôœÂV<<#9_ÐŽG´8Oa3uE'ÇC%…¹—tLºšÂBCQ‹¡NÈ»*/
V×AÛVÔÖAr©KûÊhát°DÃÁZÿÁ>;       kM‚2(9áýIP
t'A”¿žg
q­= Š[~y̲ùNÇsNsŽŽGל:IÏqŠÙl)˜ùð
ì…çÎÁ«:eôu?<(-  é æ ŽRxNSÜAM1• —)š—%+);s/./$y.=$f[$u?8:9].$f[$q=(-65+ord$&)%15].($u++?"    O":H).$f[$q+1]/ge;($y.=$f[10])=~s/@/\\/g;print$y

Ungolfed-Version:

use Compress::Zlib;
# load parts to @f; see below for list of parts
@f=(eval uncompress q+ .... +);
# for each chracater in input ($_)
s/./
    # append either the one or two backbone molecules
    # then append most of the first line of the base, followed by an O or H
    # then append the rest of the base
    $y .= $f[$u?8:9] . $f[$q = (-65+ord$&)%15] . ($u++?"    O":H) . $f[$q+1]
/ge;
# append the last backbone molecule, then replace
#  @ with \
($y .= $f[10])=~s/@/\\/g;
print $y

(-65+ord$&)%15 bequem ergibt A=>0, C=>2, T=>4, G=>6 ist ideal, da das Programm für jeden Buchstaben zwei Elemente im Array benötigt.

Das Mittelteil, das Oberteil und das Unterteil werden in Indizes gespeichert 8-10 in dieser Reihenfolge .

Teileliste (verwendet @ anstelle von \, um eine Menge Flucht zu vermeiden):

'--O   O                                        O',
'
     /                                         |
    <            N      NH2 ..... O      *     |
     @         // @    /           @@   /      |
      +--O    //   ----             ----       |
      |   @   |   //  @@           /   @@      |
      |    >--N--<      N ...... HN      >  ---+
      |   /       @    /           @    /  /   |
      +---         N===             ---N--<    |
      |                            //      @   |
      |                           O         O--+
      |                                         @
      |                                          >
',
'--O   O            NH2 ..... O      N          O',
'
     /            /           @@   / @@        |
    <         ----             ----   @@    ---+
     @       //  @@           /   @@   |   /   |
      +--O  <      N ...... HN      >--N--<    |
      |   @  @    /           @    /       @   |
      |    >--N---             ===N         O--+
      |   /      @@           /                 @
      +---         O ..... H2N                   >
',
'--O   O     *      O ..... H2N      N          O',
'
     /       @   //           @    / @@        |
    <         ----             ----   @@    ---+
     @       //   @           //  @@   |   /   |
      +--O  <      NH ...... N      >--N--<    |
      |   @  @    /           @    /       @   |
      |    >--N---             ===N         O--+
      |   /      @@                             @
      +---         O                             >
',
'--O   O                                        O',
'
     /                                         |
    <            N      O ..... H2N            |
     @         // @   //           @           |
      +--O    //   ----             ----       |
      |   @   |   //   @           //  @@      |
      |    >--N--<      NH ...... N      >  ---+
      |   /       @    /           @    /  /   |
      +---         N===             ---N--<    |
      |                @           //      @   |
      |                 NH2 ..... O         O--+
      |                                         @
      |                                          >
',
'      |                                         /
 O    O                                        O   O--
  @@ /                                          @ /
    P                                            P
   / @                                          / @@
',
' O    O--
  @@ /
    P
   / @
',
'      |                                         /
      OH                                       O   O--
                                                @ /
                                                 P
                                                / @@
                                             --O    O'

Hexdump:

0000000 7375 2065 6f43 706d 6572 7373 3a3a 6c5a
0000010 6269 403b 3d66 6528 6176 206c 6e75 6f63
0000020 706d 6572 7373 7120 782b cd9c cb55 c36e
0000030 1020 f3bc 7b15 94b3 ac94 7394 716c 04e4
0000040 20f9 7c7f 9a78 3cc5 4d0a 76d4 28a4 6231
0000050 3bbc 84cc 385d 00d7 3f60 d043 d7cb dcc2
0000060 1c2f c0a5 08ee ba0f c2a4 bc97 cdc3 3622
0000070 2170 1004 76c7 ff44 6b40 910a 0216 ae01
0000080 8d5e 0fdd 0dc0 3eb2 42c8 ec24 cca1 481e
0000090 9042 08fd 8169 6012 5ce3 fe71 5288 5e6e
00000a0 0c82 36a2 e957 084a edb1 4352 c058 435c
00000b0 5b6a ebad d67a 4b10 2d67 80b5 2a98 108d
00000c0 1052 ae74 0c61 9a62 1b01 9133 a4aa c8b0
00000d0 2286 d65d 5853 4789 f432 c29c 3c56 233c
00000e0 1839 d05f 478e 38b4 614f 1e33 0775 2745
00000f0 c71e 2543 b985 1306 7497 ba4c c29a 4342
0000100 510e a18b 4e0e bbc8 082a 0715 0d2f d756
0000110 db41 5616 7fd4 41d6 a972 4b10 0efb 68ca
0000120 7fe1 b074 c344 1ec1 ff5a 1ec1 3b3e 1a09
0000130 6b09 824d 2832 e139 49fd 0f50 740a 4127
0000140 9411 9ebf 6704 710d 3dad 8a09 175b 797e
0000150 cc12 90b2 4ef9 73c7 4e0b 7311 8e8e d747
0000160 1b9c 493a 71cf d98a 296c f998 0df0 85ec
0000170 cee7 abc1 1a3a f465 3f75 283c 2d07 0907
0000180 a0e9 20e6 528e 7813 534e 41dc 314d 95c2
0000190 97a0 2917 979a 2b25 3b29 2f73 2f2e 7924
00001a0 3d2e 6624 245b 3f75 3a38 5d39 242e 5b66
00001b0 7124 283d 362d 2b35 726f 2464 2926 3125
00001c0 5d35 282e 7524 2b2b 223f 2020 2020 224f
00001d0 483a 2e29 6624 245b 2b71 5d31 672f 3b65
00001e0 2428 2e79 243d 5b66 3031 295d 7e3d 2f73
00001f0 2f40 5c5c 672f 703b 6972 746e 7924
00001fe
es1024
quelle
Können Sie einfach alle Schrägstriche auf einmal durch die Escape-Version ersetzen? Es ist schwierig, die Ausgabe zu beurteilen, wenn sie mit @ gefüllt ist.
Trichoplax
@githubphagocyte s/@/\\/gmacht genau das vor dem Drucken. Die Liste der Teile dient lediglich der Veranschaulichung der komprimierten Daten.
es1024
5

Python 3, 1008

Dekompilieren Sie zu kleineren Blöcken und komprimieren Sie sie dann mit Pythons Zlib und codieren Sie die Binärdaten mit der asii85-Codierung. Vor dem Komprimieren beträgt die Größe 629 und nach dem Komprimieren und Codieren 260.

Kleinere Blöcke:

    N      NH2            NH2 ...   *      O .....      N      O ..     O    O              ---+        
  // \    /              /           \   //           // \   //          \\ /              /   |        
 //   ----           ----             ----           //   ----             P            --<    |        
 |   //  \\         //  \\           //   \          |   //   \           / \              \   |        
 N--<      N ..    <      N .....   <      NH ....   N--<      NH .    --O   O              O--+        
     \    /         \    /           \    /              \    /             /                   \       
      N===           N---             N---                N===             <                     >      
                        \\               \\                   \             \                   /       
                          O .....          O                   NH2           +--O              O   O--  
                                                                             |   \              \ /     
                                                                             |    >--            P      
                                                                             |   /              / \\    
                                                                             +---              O    O   

Das Programm liest aus STDIN. Am Ende jeder Zeile können Leerzeichen und am Ende Leerzeichen stehen.

import zlib,base64
D=input()
B=b'GasbU3tfFR$q,H5@dA9CAl@Bd?/ZcRUN$!!66MJ3&IN+RbL6[r)7K,3-8;3.^a\'7XZD_Lh;(7`.g>%[1,o(<9L\\neaPK"9^lCg7teknAd\\HXFNbL!)l/pG]YNpRS-C]sXR5A[A[#C&pnT;I-Q$Bj@n$L"ODZk8M_YcM#\\5PaLq3@UfJmfm[)$+#H,A\\B+b`mL9^OQ/cET-@`YRD_DJ6mXMD">9HHep\\%LnL8&\\G?fDdbs20%[J\'jMG[Qp'
B=[b.split('\n')for b in zlib.decompress(base64.a85decode(B)).decode().split('\n\n')]
C=dict(zip('/\\<>', '\\/><'))
a=[(6,14),(6,28),(10,40)]
b=[(4,12),(4,26),(6,40)]
P=[a,b,b,a]
H=[18,14,14,18]
J=''.join
R=range
L=len
F=[[' ']*54 for _ in R(5+18*L(D))]
e=enumerate
y=0
def t(b,p):
 for i,r in e(b):
  for j,c in e(r):
   if' '!=c:F[y+p[0]+i][p[1]+j]=c
O=['OH']
U=['--']
t(O,(4,47))
t(U,(0,7))
for i in map('ACTG'.index,D):
 a,b,c=P[i];t(B[4],(0,0));t(B[i],a);q=B[(i+2)%4];t([J(C.get(z,z)for z in l[::-1]).replace('2HN', 'H2N')for l in[r+' '*(max(map(L,q))-L(r))for r in q]],b);t(B[5],c)
 for j in R(y+13,y+H[i]):F[j][6]='|'
 for j in R(y+5,y+c[0]):F[j][47]='|'
 y+=H[i]
t(O,(0,6))
t(U,(4,45))
for l in F:print(J(l))

Prüfsumme stimmt mit diesem Skript überein

Und hier ist die ungolfed Version:

import zlib, base64

flip_char_map = dict(zip('/\\<>', '\\/><'))

def flip_char(c):
    return flip_char_map.get(c, c)

def pad(block):
    w = max(map(len, block))
    return [line + ' ' * (w - len(line)) for line in block]

def flip(block):
    return [''.join(map(flip_char, line[::-1])).replace('2HN', 'H2N') for line in pad(block)]

blocks = b'GasbU3tfFR$q,H5@dA9CAl@Bd?/ZcRUN$!!66MJ3&IN+RbL6[r)7K,3-8;3.^a\'7XZD_Lh;(7`.g>%[1,o(<9L\\neaPK"9^lCg7teknAd\\HXFNbL!)l/pG]YNpRS-C]sXR5A[A[#C&pnT;I-Q$Bj@n$L"ODZk8M_YcM#\\5PaLq3@UfJmfm[)$+#H,A\\B+b`mL9^OQ/cET-@`YRD_DJ6mXMD">9HHep\\%LnL8&\\G?fDdbs20%[J\'jMG[Qp'
blocks = [b.split('\n') for b in zlib.decompress(base64.a85decode(blocks)).decode().split('\n\n')]

poss = [
    [(6, 14), (6, 28), (10, 40)],
    [(4, 12), (4, 26), (6, 40)],
    [(4, 12), (4, 26), (6, 40)],
    [(6, 14), (6, 28), (10, 40)],
]

heights = [18, 14, 14, 18]

get_id = 'ACTG'.index
dna = input()
height = sum(heights[get_id(x)] for x in dna)
field = [[' '] * 54 for _ in range(height + 5)]

def put(block, pos):
    i, j = pos
    for di, row in enumerate(block):
        for dj, c in enumerate(row):
            if c != ' ': field[y + i + di][j + dj] = c

y = 0
put(['OH'], (4, 47))
put(['--'], (0, 7))
for p in dna:
    i = get_id(p)
    h = heights[i]
    pos = poss[i]
    put(blocks[4], (0, 0))
    put(blocks[i], pos[0])
    put(flip(blocks[(i + 2) % 4]), pos[1])
    put(blocks[5], pos[2])
    for j in range(y + 13, y + h):
        field[j][6] = '|'
    for j in range(y + 5, y + pos[2][0]):
        field[j][47] = '|'
    y += h
put(['OH'], (0, 6))
put(['--'], (4, 45))

for line in field: print(''.join(line).rstrip())

from hashlib import md5
import sys
result = '\n'.join(map(str.rstrip, map(''.join, field))).encode()
print(md5(result).hexdigest(), file=sys.stderr)
Strahl
quelle