Warum werden CPUs immer kleiner?

19

Es ist bekannt, dass Prozessoren (oder Chips) im Laufe der Zeit immer kleiner werden. Intel und AMD kämpfen um die kleinsten Standards (45, 32, 18, ...). Aber warum ist es so wichtig, die kleinsten Elemente auf der kleinsten Chipfläche zu haben?

Warum nicht eine 90nm 5x5cm CPU machen? Warum 6 Adern in einen Bereich von 216 mm2 pressen? Es wird einfacher sein, die Wärme von einer größeren Fläche abzuleiten, und die Herstellung wird weniger präzise (und damit billigere) Technologie erfordern.

Ich kann mir einige Gründe vorstellen:

  • Weniger Größe bedeutet, dass mehr Chips auf einem einzelnen Wafer hergestellt werden können (aber Wafer sind nicht sehr teuer, oder?)
  • Kleinere Größen sind wichtig für mobile Geräte (aber alltägliche PCs verwenden immer noch Tower-Boxen).
  • Die geringe Größe wird durch die Lichtgeschwindigkeit vorgegeben. Der Chip kann nicht größer sein als die Entfernung, die ein EM-Feld in einem Zyklus zurücklegen kann (das sind jedoch ungefähr einige cm bei 3 GHz).

Warum müssen Chips also immer kleiner werden?

Kromster sagt Unterstützung Monica
quelle
3
mehr ist Recht? :)
kenny
In den meisten Fällen wird die endgültige Packungsgröße, die für den Einbau in ein Mobiltelefon von Bedeutung ist, von der Art der Verpackung und der Anzahl der Stecknadeln bestimmt. Mit anderen Worten, die tatsächliche Chipgröße ist im Allgemeinen viel kleiner als das Gehäuse anzeigen würde, auch für größere Prozesse. Das Verpacken ist ein großer Teil der Herstellungskosten eines IC mit hoher Pinanzahl, weitaus mehr als Sie denken und manchmal mehr als die Herstellung des eigentlichen Chips.
Mark
@Mark - Handyhersteller wollen immer mehr CSP (Chip Scale Packages), die fast so groß sind wie der Chip. Pakete wie TQFP lassen sich auf Smartphones kaum noch rechtfertigen, da sie zu platzsparend sind.
Stevenvh
@stevenvh Ich denke, wir haben das Gleiche gesagt: Die Auswahl an Gehäusen und die Verdichtung mehrerer Chips in einem Gehäuse, um die Anzahl der Pins und den Bedarf an externen Komponenten zu verringern, treiben in erster Linie die Miniaturisierung von ICs für den Einsatz in Mobiltelefonen voran. Die Prozessgröße ist im Allgemeinen nicht der begrenzende Faktor, insbesondere bei Geräten mit hoher Pinanzahl.
Mark
8
Klar, die CPUs werden eigentlich nicht kleiner. Sie bleiben ungefähr gleich groß, enthalten jedoch immer mehr Transistoren, da die Größe jedes Transistors abnimmt.
David Schwartz

Antworten:

34

Es ist wie Schokoriegel. Sie machen sie immer kleiner zum gleichen Preis, um den Gewinn zu steigern.

Im Ernst, es gibt gute Gründe für kleinere Chips. Das erste und wichtigste ist, dass mehr Chips auf einen Wafer passen können. Bei großen Chips hängt der Preis davon ab, welchen Bruchteil eines Wafers er verwendet. Die Kosten für die Bearbeitung eines Wafers sind ziemlich fest, unabhängig davon, wie viele Chips daraus entstehen.

Die Verwendung von weniger teurem Wafer ist jedoch nur ein Teil. Ertrag ist der andere. Alle Wafer haben Unvollkommenheiten. Stellen Sie sich vor, sie seien klein, aber zufällig über den Wafer verteilt, und jeder IC, der auf einen dieser Fehler trifft, ist Müll. Wenn der Wafer von vielen kleinen ICs bedeckt ist, ist nur ein kleiner Teil der Gesamtmenge Müll. Wenn die IC-Größe zunimmt, nimmt der Bruchteil von ihnen, die auf eine Unvollkommenheit treffen, zu. Betrachten Sie als unwirkliches Beispiel, das dennoch auf das Problem hinweist, den Fall, in dem jeder Wafer eine Unvollkommenheit aufweist und von einem IC abgedeckt wird. Die Ausbeute wäre 0. Wenn sie von 100 ICs abgedeckt wäre, wäre die Ausbeute 99%.

Es gibt noch viel mehr zu liefern, und dies vereinfacht das Problem erheblich, aber diese beiden Effekte führen dazu, dass kleinere Chips wirtschaftlicher werden.

Bei wirklich einfachen ICs dominieren die Verpackungs- und Testkosten. In diesen Fällen spielt die Größe der Features keine große Rolle. Dies ist auch ein Grund, warum wir in letzter Zeit eine Explosion kleinerer und billigerer Pakete gesehen haben. Beachten Sie, dass extrem kleine Features von sehr großen ICs wie Hauptprozessoren und GPUs unterstützt werden.

Olin Lathrop
quelle
17
Außerdem ist der Siliziumblock rund, sodass Sie mehr Chips pro Wafer verlieren, wenn die Chips größer werden, d. H. Sie können mehr kleinere quadratische Chips in einen Kreis einpassen.
Martin
2
+1 @Martin, ganz zu schweigen davon, dass es an den Rändern des Wafers viele Geräteausfälle gibt.
Kenny
1
@endolith: Überlegen Sie, wie die Zonenverfeinerung funktioniert. Ein kreisförmiger Querschnitt ist dafür die optimale Form.
Olin Lathrop
1
Die Löcher um den Rand können genau dann mit kleineren Würfeln gefüllt werden, wenn die Struktur (Substratdotierung, Transistortechnologien, Anzahl der Metallisierungsschichten usw.) für die größeren und kleineren Würfel gleich ist. Darüber hinaus werden die Produktionsraten für die beiden Geräte verknüpft und entsprechen möglicherweise nicht der Anforderungsrate für die beiden verschiedenen Teile. Daher ist es selten, wenn Sie mit diesem Trick davonkommen können.
Mike DeSimone
7
Der Wafer muss herstellungsbedingt rund sein. Um einen Einkristall aus Silizium zu erzeugen, wird ein Starterkristall in ein Bad aus geschmolzenem, dotiertem Silizium getaucht und langsam abgezogen, während der Kristall gedreht wird. Die genaue Steuerung der Rotation und der Extraktionsgeschwindigkeit bestimmt sowohl den Durchmesser des Kristalls als auch die Bildung von polykristallinen Defekten. Der Durchmesser und die Länge sind auch durch mechanische Überlegungen begrenzt, dh wie viel Sie ziehen können, bevor es abbricht und zurückfällt. Danach wird es in Waffeln geschnitten und poliert.
Mike DeSimone
21

Wenn die Prozessgröße kleiner wird, sinkt der Stromverbrauch.

Kleinere Transistorprozesse ermöglichen die Verwendung niedrigerer Spannungen in Kombination mit Verbesserungen in der Konstruktionstechnik. Dies bedeutet, dass ein ~ 45-nm-Prozessor weniger als die Hälfte der Leistung verbraucht, die ein 90-nm-Prozessor mit ähnlichen Transistorzahlen verbraucht.

Der Grund dafür ist, dass mit kleiner werdendem Transistor-Gate die Schwellenspannung und die Gate-Kapazität (erforderlicher Ansteuerstrom) geringer werden.

Es sollte beachtet werden, dass, wie Olin betonte, dieses Verbesserungsniveau nicht zu kleineren Prozessgrößen führt, da der Leckstrom sehr wichtig wird.

Einer Ihrer anderen Punkte, die Geschwindigkeit, mit der sich Signale auf dem Chip fortbewegen können:

Bei 3 GHz beträgt die Wellenlänge 10 cm, bei 1/10-Wellenlänge jedoch 1 cm. In diesem Fall müssen Sie zunächst die Übertragungsleitungseffekte für digitale Signale berücksichtigen. Denken Sie außerdem daran, dass bei Intel-Prozessoren einige Teile des Chips mit der doppelten Taktrate ausgeführt werden, sodass 0,5 cm der wichtige Abstand für Übertragungsleitungseffekte ist. ANMERKUNG: In diesem Fall arbeiten sie möglicherweise mit beiden Taktflanken, was bedeutet, dass der Takt nicht mit 6 GHz läuft, aber einige Prozesse verschieben Daten so schnell und müssen die Auswirkungen berücksichtigen.

Außerhalb von Übertragungsleitungseffekten müssen Sie auch die Taktsynchronisation berücksichtigen. Ich weiß nicht genau, wie schnell sich ein Mikroprozessor ausbreitet. Bei ungeschirmtem Kupferdraht entspricht dies 95% der Lichtgeschwindigkeit, bei Koax hingegen 60% der Lichtgeschwindigkeit.

Bei 6 GHz beträgt die Taktperiode nur 167 Pikosekunden, die so hohe / niedrige Zeit ~ 84 Pikosekunden. Im Vakuum kann sich das Licht in 33,3 Picosenden um 1 cm bewegen. Wenn die Ausbreitungsgeschwindigkeit 50% der Lichtgeschwindigkeit betrug, dann ist es ungefähr 66,6 Pikosekunden, um 1 cm zurückzulegen. Dies, zusammen mit den Ausbreitungsverzögerungen der Transistoren und möglicherweise anderer Komponenten, bedeutet, dass die Zeit, die das Signal benötigt, um sich selbst um einen kleinen Chip mit 3 bis 6 GHz zu bewegen, für die Aufrechterhaltung einer ordnungsgemäßen Taktsynchronisation von Bedeutung ist.

Kennzeichen
quelle
4
Die Leistung sinkt mit der Größe des Features auf einen Punkt. Die niedrigeren Schaltspannungen verringern das Verhältnis des Ein- und Ausschaltzustands der FETs. Dies bedeutet, dass ein beträchtlicher Verlust im ausgeschalteten Zustand vorliegt, um die Impedanz im eingeschalteten Zustand niedrig genug zu halten. Infolgedessen macht die Verlustleistung einen erheblichen Teil der Leistung aus, die zum Betrieb einiger moderner Prozessoren erforderlich ist. Die Leistung steigt immer noch mit der Taktrate an, aber die maximale Taktrate ist durch die immer vorhandene erhebliche Leckleistung begrenzt. In modernen Prozessoren gibt es viele interessante Kompromisse, und die Abstände zwischen ihnen ändern sich schnell.
Olin Lathrop
1
Ihr Licht ist zehnmal zu schnell: 3,33 × 10 ^ -12 s × 3 × 10 ^ 8 m / s = 10 ^ -3 m = 1 mm.
Starblue
@Olin Lathrop Einverstanden, in den letzten Generationen ist die Leckage der Hauptbegrenzer. Ich bezog mich hauptsächlich auf den Übergang von 90nm zu 45nm, der eine nahezu lineare Abnahme der Leistung hat. Diese Linearität liegt nicht unter 45 nm, wie Sie gesagt haben.
Mark
5

Der Hauptgrund ist der erste, den Sie erwähnt haben. Waffeln (was Sie als Teller bezeichnen) sind sehr teuer, deshalb möchten Sie das Beste aus ihnen herausholen. Früher hatten Wafer einen Durchmesser von 3 Zoll, heute sind es 12 Zoll, was Ihnen offensichtlich nicht nur 16-mal so viel Platz einräumt, sondern Sie erhalten sogar noch mehr Stümpfe.
Es ist also klar, dass sie diese Technologie auch für CPUs verwenden würden, die in Tower-PCs verwendet werden, auch wenn es nicht so aussieht, als ob es dort notwendig wäre. Und vergessen Sie nicht, dass Laptops auch solche CPUs haben und platzsparend sind.
Auch die Geschwindigkeit spielt eine Rolle. Bei 3-GHz-Signalen werden weniger als 10 cm pro Taktzyklus übertragen. Als Faustregel gilt ab 1/10, dass wir uns um Übertragungsleitungseffekte kümmern müssen. Und das ist weniger als 1 cm.

Bearbeiten Eine
kleinere Feature-Größe bedeutet auch eine geringere Gate-Kapazität, und dies ermöglicht eine höhere Geschwindigkeit. Schnelleres Schalten bedeutet weniger Stromverbrauch, da MOSFETs schneller durch ihren aktiven Bereich laufen. In der Praxis nutzen Hersteller dies, um schneller zu takten, so dass Sie am Ende nicht viel von dieser Leistungsreduzierung sehen werden.

stevenvh
quelle
2
300 000 000 Meter / 3 000 000 000 Hz = 0,1 Meter, das sind 10 cm, richtig?
Kromster sagt Unterstützung Monica
3
Wafer sind billig, 100 $ pro Wafer. Was teuer ist, ist die Belichtung - Stepper können maximal 120 Wafer pro Stunde verarbeiten, und jeder Wafer benötigt bis zu 20 Belichtungen.
BarsMonster
1
@BarsMonster kann eine Wafer nicht durch Explosionen ruinieren? Es tut uns leid! :)
kenny
1
@kenny Eine physikalische Beschädigung des Wafers ist bei modernen Fabriken höchst unwahrscheinlich. Mikroskopische Defekte - sie sind immer da.
BarsMonster
2
@stevenvh: ja, was BarsMonster gesagt hat. Wenn eine Million-Dollar-Sputtermaschine hunderttausend (?) Wafer im Laufe ihrer Lebensdauer verarbeitet, ist es am einfachsten, sie und die anderen Maschinen in der Fabrik als Teil der "Gesamtkosten pro Wafer" zu betrachten. Der Bruchteil der "Gesamtkosten pro Wafer", der durch den Kauf der nicht maskierten reinen Siliziumscheiben anfällt, ist nahezu unbedeutend.
Davidcary
0

Der Hauptgrund, warum CPUs immer kleiner werden, ist einfach, dass beim Rechnen kleiner leistungsfähiger ist :

In erster Näherung umfasst die Berechnung zwei grundlegende Aktionen: Übertragen von Informationen von einem Ort zum anderen und Kombinieren von Informationssträngen, um neue Informationen zu erzeugen. Da wir es gewohnt sind, hier mit Elektronik zu arbeiten, bezeichnen wir die Hardware für diese Aktionen als "Drähte" und "Schalter". Für beide ist kleiner besser:

Drähte: Da die Übertragungsgeschwindigkeit auf einem Draht im Wesentlichen konstant ist, müssen Sie den Draht kürzen , wenn Sie Informationen von einem Ort (z. B. Schalter) zu einem anderen erhalten möchten . (Möglicherweise können Sie eine schnellere Geschwindigkeit erreichen, aber schließlich erreichen Sie die Lichtgeschwindigkeitsgrenze, und an diesem Punkt müssen Sie wieder kürzen.)

Schalter: Ein Schalter arbeitet mit Informationen von einem oder mehreren Eingangsdrähten, die in den Körper des Schalters eintreten und diesen durchdringen. Dadurch wird sein interner Zustand transformiert, um die Informationen auf einem oder mehreren Ausgangsdrähten zu modulieren. Es dauert einfach weniger Zeit, den Körper eines kleineren Schalters zu durchdringen.

PMar
quelle