Zukunft hat einen Namen: GDDR3

11.11.2004
Der neue Grafikstandard GDDR3 adressiert den Highend-Grafikmarkt für Standalone-Grafiksysteme mit einer wesentlichen Performance-Steigerung gegen-über GDDR1. Was sich geändert hat, erklärt Dr. Christoph Bilger.

Durch Prozessverbesserungen konnten die Taktfrequenzen von Commodity-DDR-SDRAMs ständig gesteigert werden. Mit der Einführung von Prozessoren mit 800-MHz-Frontside-Bus und Dual-Speicherkanal-Architektur wurden ungepufferte DDR400-DIMM-Module zum Standard bei leistungsfähigen Desktop-PCs. Die nächste Generation der synchronen DRAMs für die PC-Systemspeicher wird als DDR2 bezeichnet und stellt mit zahlreichen Verbesserungen die natürliche Erweiterung des DDR-Standards dar. Parallel dazu wurde auch die Performance und Architektur der Grafikspeicher ständig verbessert - und mit der Einführung von GDDR3 geht der Trend in Richtung 1 GHz.

Betriebsfrequenzen bis 1 GHz - mit GDDR3

Im Gegensatz zu Systemspeichern müssen Grafikspeicher die Verarbeitung und Darstellung von vielen Bildpunkten durch sehr schnelle Point-to-Point-Operationen unterstützen. Daher ist die Taktfrequenz beziehungsweise die Bandbreite das wesentliche Kriterium. Nach Einführung der DDR-Technologie bei Grafikspeichern durch Infineon wird der Markt derzeit von GDDR1-Grafikspeichern bestimmt, während GDDR2 praktisch keine Bedeutung hat. GDDR1-Speicher werden mit Taktfrequenzen von 300 bis zirka 500 MHz angeboten.

Mit GDDR3 ist nun eine Steigerung auf 500 bis rund 800 MHz und mehr möglich. Bei einem 256-Bit-Speicherbus kann zum Beispiel mit 800-MHz-GDDR3-Speichern eine Speicherbandbreite von 51,2 Gigabyte pro Sekunde erreicht werden.

GDDR3 ähnelt grundsätzlich dem Commodity-DDR2-Standard für Systemspeicher, allerdings optimiert für hohe Taktraten. Wesentliche Unterschiede zwischen GDDR3- und GDDR1-Speicher sind eine von 2,5 Volt auf 1,8 Volt verringerte Betriebsspannung, Signalabschluss auf dem Chip (On-Die-Terminierung), ein dynamisch gesteuerter Impedanz-Ausgangstreiber, 4-Bit-Prefetch und ein unidirektionaler Single-ended-Daten-Strobe. All diese Funktionen resultieren in höherer Geschwindigkeit, verbesserter Signalintegrität und geringerer Leistungsaufnahme. Allein der Übergang bei der Versorgungsspannung von 2,5 V auf 1,8 V ermöglicht eine geringere Leistungsaufnahme bei gleicher Frequenz beziehungsweise eine höhere Frequenz bei gleicher Verlustleistung. Durch diese Neuerungen erreichen GDDR3-Speicher weitaus höhere Taktraten als bisher.

Bei höheren Übertragungsfrequenzen müssen Signalleitungen mit Widerständen abgeschlossen (Terminierung) werden, um Störungen zu eliminieren.

Werdegang der Grafikspeicher

Die ersten Grafikspeicher waren durch spezielle Funktionen für Grafik-Applikationen wie etwa Register gekennzeichnet, die sie von den Standard-Commodity-RAMs unterschieden. Bei den nächsten Grafikspeicher-Generationen wurde auf diese speziellen Merkmale immer mehr verzichtet, sodass Grafikspeicher den Standard-RAMs sehr ähnlich wurden. Allerdings wurde der Fokus verstärkt auf höhere Taktfrequenzen gelegt.

Infineon Technologies stellte 2001 einen 128-Mbit-DDR-SGRAM (Synchronous Graphics RAM)-Baustein für leistungsfähige 3D-Grafik-Applikationen vor, der dem 32-Mbit-DDR-SGRAM von Infineon folgte, der als erster DDR-Grafikspeicher wesentlich zur Verbesserung der Bildqualität in 3D-Grafik-Anwendungen beitrug. Der 128-Mbit-SGRAM war zu 4M x 32 organisiert und somit ideal für Grafikspeicher in 32-, 64-und 128-Bit-Bus-Applikationen.

Der Baustein war auch der erste Grafikspeicher, der in einem JEDEC-kompatiblen Ball-Grid-Array (BGA)-Gehäuse geliefert wurde und Taktfrequenzen von bis zu 300 MHz unterstützte. Im Vergleich zu Grafikspeichern in TSOP- oder TQFP-Gehäusen benötigen Grafikspeicher im BGA-Gehäuse weniger als die Hälfte der Board-Fläche. Darüber hinaus bietet das BGA-Gehäuse auch ein besseres thermisches und elektrisches Verhalten, da die Anschlusspins direkt unter dem Chip liegen (kürzere Verbindungen).

Integrierte und Stand-alone-Grafik

Grafikapplikationen wie die neuesten Computerspiele mit aufwändig gestalteten Szenarien und äußerst real wirkenden Umgebungen beziehungsweise Darstellern definieren die Messlatte bei höchster Prozessorleistung und sehr schnellen Grafikspeichern. Daher wurden spezielle Grafikprozessoren und -speicher entwickelt, die genau auf diese Belange zugeschnitten sind und die CPU sowie den Systemspeicher entlasten. Prinzipiell kann zwischen integrierten und Stand-alone-Grafiksystemen unterschieden werden. Bei der integrierten Grafik befindet sich der Grafikprozessor auf der Hauptplatine des Desktop-PCs oder Notebooks und nutzt den vorhandenen Systemspeicher. Dabei ist der Grafikcontroller natürlich durch die Bandbreite des Systemspeichers limitiert. Die Grafikdaten werden von der Hauptplatine an den Monitor ausgegeben.

Bei einem Stand-alone-Grafiksystem befindet sich der Grafikcontroller zusammen mit einem dedizierten Grafikspeicher, dem direkten Monitorausgang und zusätzlicher Logik auf einem separaten Board, also einer Grafikkarte, die man auch nachträglich kaufen kann, um seinen PC nachzurüsten. Das Stand-alone-Grafiksystem ist über einen schnellen Bus (AGP, Accelerated Graphics Port) mit dem Motherboard verbunden. Der AGP-Bus bietet eine 32-Bit-Schnittstelle mit 533 MHz und ermöglicht so Datenraten von 2 GB/s. Mit dem neuen PCI-Express-Interface-Standard werden sogar Datenraten von bis zu 8 GB/s möglich. Bei der Stand-alone-Architektur ist das Grafiksystem unabhängig vom Systemspeicher und bietet eine höhere Bandbreite beim Zugriff auf die speziellen Grafikspeicher.

Die Leistungssegmente der Grafikspeicher werden im Wesentlichen durch die Größe des Framebuffers und die Datenbandbreite definiert. Die Marktforscher von iSupply unterscheiden in Bezug auf die Leistungsfähigkeit und damit natürlich auch auf den Preis zum Beispiel zwischen Enthusiast/Performance, Mainstream und Value. Im Framebuffer werden alle Informationen (wie beispielsweise Texturen oder Objektkoordinaten) zwischengespeichert, die nötig sind, um in Echtzeit eine bewegte dreidimensionale Szenerie zu berechnen.

Größe und Geschwindigkeit des Framebuffers sind entscheidend für die Auflösung, Farbanzahl und ruckfreie Darstellung eines Grafiksystems. Während Value-Systeme typischerweise 64 MB Framebuffer haben, weisen Highend-Grafiksysteme heute 256 MB auf. Bei der Speicherbandbreite ist der Unterschied noch deutlicher. Value-Systeme arbeiten heute mit einer Bandbreite zwischen Controller und Framebuffer von 3,2 GB/s (64 Bit Busbreite; 200 MHz Speichertakt), wohingegen Highend-Grafiksysteme die zehnfache Bandbreite nutzen (32 GB/s mit 256 Bit Busbreite und 500 MHz Speichertakt).

Daraus wird ersichtlich, dass Grafiksysteme abhängig von der Performance unterschiedliche Speichertypen erfordern. Im Highend-Bereich (Enthusiast und oberer Mainstream) sind für Grafik optimierte große Speicher mit breitem Interface (x 32 Bit organisiert) und hoher Betriebsfrequenz (> 500 MHz) erforderlich, während der Value-Bereich auf möglichst geringe Kosten ausgelegt ist. Daher kommen hier bevorzugt kleinere und weniger schnelle Commodity-Speicher mit weniger breitem Interface (x 16 organisiert) zum Einsatz.

Markt für integrierte und Stand-alone-Grafiksysteme

Nach Untersuchungen des Marktforschungsunternehmens Mercury Research teilen sich Systeme mit integrierter und Stand-alone-Grafik den Markt mit gewissen Schwankungen annähernd gleichmäßig auf. Dieser Trend besteht schon seit langem und soll sich auch in den kommenden Jahren kaum ändern. So wurden nach Angaben von Mercury Research vom ersten Quartal 2004 im Jahr 2003 weltweit etwa 81 Millionen Desktop-PCs mit Stand-alone-Grafik ausgeliefert, während etwa 98 Millionen PCs über integrierte Grafik verfügten. Bei den Notebooks standen im gleichen Zeitraum rund 22 Millionen Stand-alone-Grafiksysteme knapp 17 Millionen ausgelieferte Geräten mit integrierter Grafik gegenüber.

Grafikspeicher, die in Stand-alone-Systemen - ob nun Desktop-PC oder Notebook - zum Einsatz kommen, werden von Herstellern wie beispielsweise ATI, Nvidia oder Matrox bedient und können, wie erwähnt, je nach Anforderungen an die Leistungsfähigkeit gegliedert werden. Dabei ist zu beachten, dass der Grafik-Controller und der Speicher die Fertigungskosten für eine Grafikkarte ganz wesentlich bestimmen und daher entscheidend für die Produktsegmentierung sind. Bei den Stand-alone-Grafiksystemen für Desktop-PCs entfallen nach iSupply (Stand 2004) etwa acht Prozent auf den Enthusiasts/Performance-Bereich, 48 Prozent auf Mainstream-Anwender und 44 Prozent auf Value-Kunden. Eine ähnliche Verteilung ergibt sich auch bei den mobilen Computern. Der neue Grafikstandard GDDR3 adressiert hier den Enthusiasts/Performance- und den oberen Mainstream-Bereich.

Leistungshungrige Grafikanwendungen wie anspruchsvolle Spiele mit verblüffend realen Darstellungen werden die Taktraten für Grafikspeicher weiter in die Höhe treiben.

Die nächsten Jahre werden GDDR3-Komponenten mit Taktraten bis zu 800 MHz den Markt für Highend-Systeme und den oberen Mainstream-Bereich bestimmen. Mit der nächsten Generation - GDDR4 - wird dieser Trend fortgesetzt, um unter anderem mit einer Optimierung des I/O-Timings die Taktfrequenzen auf 1 GHz und mehr zu erhöhen. Infineon ist bestens positioniert, um sowohl diese anspruchsvollen Grafikapplikationen mit leistungsfähigen GDDR3-Komponenten bedienen als auch schnelle Commodity-DDR-RAMs für kostenkritische Grafikanwendungen bereitstellen zu können.

Steckbrief

Dr. Christoph Bilger

Dr. Christoph Bilger ist Produktmanager Graphic DRAM bei der Infineon Technologies AG.

Zur Startseite