Warum verwenden wir das Standard-Gate-Set, das wir machen?

13

Der für die Quantenberechnung üblicherweise verwendete Gatesatz setzt sich aus den einzelnen Qubits Cliffords (Paulis, H und S) und dem Controlled-NOT und / oder Controlled-Z zusammen.

Um über Clifford hinauszugehen, möchten wir vollständige Qubit-Rotationen haben. Aber wenn wir minimal sind, nehmen wir einfach T (die vierte Wurzel von Z).

Diese besondere Form der Toranlage bringt alles zum Vorschein. Wie zum Beispiel IBMs Quantum Experiment p.

Warum genau diese Tore? Zum Beispiel hat H die Aufgabe der Zuordnung zwischen X und Z S in ähnlicher Weise macht die Arbeit der Zuordnung zwischen Y und X, aber ein Faktor 1 wird ebenfalls eingeführt. Warum verwenden wir kein Hadamard-ähnliches unitäres (X+Y)/2 statt S? Oder warum verwenden wir nicht die Quadratwurzel von Y anstelle von H? Es wäre natürlich mathematisch äquivalent, aber als Konvention würde es nur ein bisschen konsequenter erscheinen.

Und warum ist unser Nicht-Clifford-Tor die vierte Wurzel von Z? Warum nicht die vierte Wurzel von X oder Y?

Welche historischen Konventionen führten zu dieser besonderen Wahl des Torsets?

James Wootton
quelle
1
Wäre die Antwort das Gottesman-Knill-Theorem? Bei Gates bleiben, die eine effiziente Simulation einer Quantenschaltung auf einem klassischen Computer ermöglichen?
Andrew O
@ AndrewO Ich denke, Gottesman-Knill würde die starke Neigung von Clifford erklären. Aber ich verstehe immer noch nicht, warum unsere Standardtore diejenigen sind, die sie sind, und nicht andere symmetrisch erscheinende Entscheidungen.
James Wootton

Antworten:

11

Jeder, der eine Arbeit geschrieben und sich gefragt hat, ob er die Notation verbessern oder die Analyse etwas anders darstellen könnte, um sie eleganter zu gestalten, ist mit der Tatsache vertraut, dass die Auswahl von Notation, Beschreibung und Analyse zufällig gewählt werden kann ohne tiefe Motivationen. Es ist nichts Falsches daran, es hat einfach keine starke Rechtfertigung, ein bestimmter Weg zu sein. In großen Gemeinschaften von Menschen, die (möglicherweise mit Vernunft) mehr daran interessiert sind, Dinge zu erledigen, als ein möglichst sauberes Bild zu liefern, wird dies die ganze Zeit passieren.

Ich denke, dass die endgültige Antwort auf diese Frage in diese Richtung gehen wird: Es ist meist ein historischer Unfall. Ich bezweifle , dass es irgendwelche tief als Gründe für die Gate-Sätze zu sein , wie sie sind, nicht mehr als es tief Gründe darüber nachgedacht , warum wir über den Bell - Zustand sprechen etwas häufiger als der Staat| Ψ-=(|01-|10) /|Φ+=(|00+|11)/2|Ψ=(|01|10)/2 .

Wir können uns aber noch überlegen, wie es zu dem Unfall gekommen ist und ob wir etwas über systematische Denkweisen lernen können, die uns dorthin geführt haben könnten. Ich gehe davon aus, dass die Gründe letztendlich von den kulturellen Prioritäten der Informatiker herrühren, wobei sowohl tiefe als auch oberflächliche Vorurteile eine Rolle bei der Beschreibung der Dinge spielen.

Ein Exkurs über Bell Staaten

Wenn Sie es mit mir aushalten, möchte ich auf das Beispiel der beiden Bell-Staaten und | Ψ - als indikativ Beispiel dafür , wie eine letztlich willkürliche Konvention über zufällig kommen kann, weil Vorurteile teil die Wurzeln nicht tief mathematische haben.|Φ+|Ψ

Ein offensichtlicher Grund für die Bevorzugung über | Ψ - ist , dass erstere mehr offensichtlich symmetrisch ist. Da wir die beiden Komponenten für | Φ + , es gibt keine klare Notwendigkeit zu verteidigen, warum wir es so schreiben, wie wir es tun. Genauso einfach können wir | definieren Ψ -= ( | 10 - | 01 ) /|Φ+|Ψ|Φ+ mit dem entgegengesetzten Vorzeichen, das nicht besser oder schlechter motiviert ist als die Wahl| Ψ-=(|01-|10) /|Ψ=(|10|01)/2 . Es fühlt sich so an, als würden wir bei der Definition von|willkürlichere Entscheidungen treffen Ψ-.|Ψ=(|01|10)/2|Ψ

Auch die Wahl der Basis ist bei etwas flexibel Φ + : wir können schreiben | Φ +: = ( | + + + | - - ) /|Φ+ und erhalten den gleichen Zustand. AberDinge beginnenein wenig noch schlimmerwenn Sie die EigenzuständeBerücksichtigung beginnen| ±i:=(|0±i|1) /|Φ+:=(|+++|)/2 desY-Operators: wir haben| Φ+=(|+i|-i+|-i|+i) /|±i:=(|0±i|1)/2Y . Dies sieht immer noch ziemlich symmetrisch aus, aber es wird deutlich, dass unsere Auswahl der Basis eine nicht triviale Rolle bei der Definition von| spielt Φ+.|Φ+=(|+i|i+|i|+i)/2|Φ+

Der Witz ist auf uns. Der Grund warum scheint "symmetrischer" zu sein als | Ψ - ist da | Ψ - ist buchstäblich der am wenigsten symmetrische Zwei Qubit - Zustand, und das macht es besser motivierte als | Φ + statt weniger motiviert. Die | Ψ - Zustand ist der einzigartige antisymmetrische Zustand: der einzigartige Zustand, der - 1|Φ+|Ψ|Ψ|Φ+|Ψ1 Eigenvektor der SWAP-Operation und damit unter anderem für die Qubit-Zustandsunterscheidbarkeit in den Controlled-SWAP-Test involviert.

  • Wir können beschreiben bis zu einer globalen Phase ( | & agr; | & agr; - | & agr; | & agr; ) /|Ψ für buchstäblich jeden Single-Qubit-Zustand| & agr;und orthogonaler Zustand| & agr;, was bedeutetdass die Eigenschaftendie es interessant sind unabhängig von der Wahl der Basismachen.(|α|α|α|α)/2|α|α
  • Auch die globale Phase , die Sie den Status schreiben verwenden wirkt sich nicht auf die Definition von | Ψ - bis zu mehr als eine globale Phase. Das Gleiche gilt nicht für | Φ + : als Übung für den Leser, wenn | 1 = i | 1 , was ist dann ( | 00 + | 1 ' 1 ') /|α|Ψ|Φ+|1=i|1 ?(|00+|11)/2

Inzwischen ist nur ein maximal verschränkter Zustand im dreidimensionalen symmetrischen Teilraum auf zwei Qubits - dem Teilraum von + 1 Eigenvektoren der SWAP-Operation - und daher prinzipiell nicht mehr zu unterscheiden als etwa | Φ -& agr; | 00 - | 11 .|Φ++1|Φ|00|11

Nachdem wir ein oder zwei Dinge über die Bell-Staaten gelernt haben, wird klar, dass unser Interesse an Insbesondere Φ + ist nur durch eine oberflächliche Symmetrie der Notation und keine wirklich bedeutsamen mathematischen Eigenschaften motiviert. Es ist sicherlich eine willkürlichere Wahl als | Ψ - . Die einzige offensichtliche Motivation für den Vorzug | Φ + sind soziologische Gründe, die mit der Vermeidung von Minuszeichen und imaginären Einheiten zu tun haben. Und der einzige berechtigte Grund, den ich mir vorstellen kann, ist kultureller Natur: Insbesondere, um Studenten oder Informatiker besser unterzubringen.|Φ+|Ψ|Φ+

Wer hat CNOT bestellt?

Sie fragen, warum wir nicht mehr über ( X + Y ) / sprechen . Für mich die interessantere Frage, die Sie auch stellen: Wir reden so viel überH=(X+Z) /(X+Y)/2H=(X+Z)/2YYYY is also more directly related to the Pauli operators, obviously. A serious physicist might consider it curious that we dwell so much on the Hadamard instead.

But there is a bigger elephant in the room — when we talk about CNOT, why are we talking about CNOT, instead of another entangling gate CZ=diag(+1,+1,+1,1) which is symmetric on its tensor factors, or better yet U=exp(iπ(ZZ)/2) which is more closely related to the natural dynamics of many physical systems? Not to mention a unitary such as U=exp(iπ(XX)/2) or other such variants.

The reason, of course, is that we are explicitly interested in computation rather than physics per se. We care about CNOT because how it transforms the standard basis (a basis which is preferred not for mathematical or physical reasons, but for human-centered reasons). The gate U above is slightly mysterious from the point of a computer scientist: it is not obvious on the surface of it what it is for, and worse, it is full of icky complex coefficients. And the gate U is even worse. By contrast, CNOT is a permutation operator, full of 1s and 0s, permuting the standard basis in a way which is obviously relevant to the computer scientist.

Though I'm making a bit of fun here, in the end this is what we're studying quantum computation for. The physicist can have deeper insights into the ecology of the elementary operations, but what the computer scientist cares about at the end of the day is how primitive things can be composed into comprehensible procedures involving classical data. And that means not caring too much about symmetry on the lower logical levels, so long as they can get what they want out of those lower levels.

We talk about CNOT because it is the gate that we want to spend time thinking about. From a physical perspective gates such as U and U as above are in many cases the operations we would think about for realising CNOT, but the CNOT is the thing that we care about.

Deep, and not so deep, reasons to prefer the Hadamard gate

I expect that the priorities of computer scientists motivate a lot of our conventions, such as why we talk about (X+Z)/2, instead of Y(1iY)/2.

The Hadamard operation is already slightly scary to computer scientists who are not already acquainted with quantum information theory. (The way it is used sounds like non-determinism, and it even uses irrational numbers!) But once a computer scientist gets past the initial revulsion, the Hadamard gate does have properties that they can like: at least it only involves real coefficients, it is self-inverse, and you can even describe the eigenbasis of H with just real coefficients.

One way in which the Hadamard often arises is in describing toggling between the standard basis |0,|1 and 'the' conjugate basis |+,| (that is to say, the eigenbasis of the X operator, as opposed to the Y operator) — the so-called 'bit' and the 'phase' bases, which are two conjugate bases that you can express using only real coefficients. Of course, Y also transforms between these bases, but also introduces a non-trivial transformation if you perform it twice. If you want to think of "toggling between two different bases in which you might store information", the Hadamard gate is better. But — this can only be defensible if you think it is important specifically to have

  • a gate H transforming between the standard basis and the very specific basis of |+,|;
  • if you care specifically about H having order 2.

You might protest and say that it is very natural to consider toggling between the 'bit' and 'phase' bases. But where did we get this notion of two specific bases for 'bit' and 'phase', anyway? The only reason why we single out |+,| as 'the' phase basis, as opposed for instance to |+i,|i, is because it can be expressed with only real coefficients in the standard basis. As for preferring an operator with order 2, to mesh with the notion of toggling, this seems to indicate a particular preference for considering things by 'flips' rather than reversible changes of basis. These priorities smack of the interests of computer science.

Unlike the case between |Φ+ versus |Ψ, the computer scientist does have one really good high-level argument for preferring H over Y: the Hadamard gate is the unitary representation of the boolean Fourier transform (that is, it is the quantum Fourier transform on qubits). This is not very important from a physical perspective, but it is very helpful from a computational perspective, and a very large fraction of theoretical results in quantum computation and communication ultimately rest on this observation. But the boolean Fourier transform already bakes in the asymmetries of computer science, in pre-supposing the importance of the standard basis and in using only real coefficients: an operator such as (X+Y)/2 would never be considered on these grounds.

Diagonal argument

If you're a computer scientist, once you have Hadamard and CNOT, all that's left is to get those pesky complex phases sorted as an afterthought. These phases are extremely important, of course. But just the way we talk about relative phases reveals a discomfort with the idea. Even describing the standard basis as the 'bit' basis, for storing information, puts a strong emphasis that whatever 'phase' is, it's not the usual way that you would consider storing information. Phases of all sorts are something to be dealt with after the 'real' business of dealing with magnitudes of amplitudes; after confronting the fact that one can store information in more than one basis. We barely talk at all about even purely imaginary relative phases if we can help it.

One can cope with relative phases pretty easily using diagonal operators. These have the advantage of being sparse (with respect to the standard basis...) and of only affecting the relative phase, which is after all the detail which we're trying to address at this stage. Hence TZ4. And once you've done that, why do more? Sure, we could as easily consider arbitrary X rotations (and because of Euler decomposition, we do play some lip-service to these operations) and arbitrary Y rotations, which would motivate X4 and Y4. But these don't actually add anything of interest for the computer scientist, who considers the job done already.

And not a moment too soon — because computer scientists don't really care about precisely what the primitive operations being used are as soon as they can justify move on to something higher-level.

Summary

I don't think there is likely to be any very interesting physically-motivated reason why we use a particular gate-set. But it is certainly possible to explore the psychologically-motivated reasons why we do. The above is a speculation in this direction, informed by long experience.

Niel de Beaudrap
quelle
It seems you are arguing for two things, namely 1) the convention is an 'accident' and 2) the convention is useful for applications in CS. I'm not sure whether you indeed claim both and how this relates to eachother. Perhaps you can high-light this in your summary.
Discrete lizard
4
@Discretelizard: I am claiming something a bit subtler: the convention is an accident, because the computer scientist is more concerned with expediency for other purposes than with mathematical symmetry. The physicist and the mathematician both care about symmetries more than the computer scientist does, so what we've ended up with something that looks a little arbitrary. The specific arbitrary thing we've ended up with was itself steered by biases from computer science, but superficial biases rather than meaningful ones.
Niel de Beaudrap
7
Indeed, before the arrival of computer scientists, the physicists' preferred maximally entangled state was the singlet state, a.k.a. |Ψ. See e.g. all the 20th century papers about Bell's inequalities.
Frédéric Grosshans