Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

15.11.2006

Mit mehr Kernen rechnet es sich besser

Alte Prozessoren mit nur einer Recheneinheit haben ausgedient. Neue CPUs besitzen intern mehrere Rechenkerne, daduch sind sie schneller und verbrauchen gleichzeitig weniger Strom. Warum parallelverarbeitung besser ist, lesen Sie hier.

Von Hans-Jürgen Humbert

Die landläufige Meinung, ein Prozessor rechne umso schneller, je höher er getaktet wird, gilt heute nur noch eingeschränkt. Ältere Prozessoren arbeiten alle Rechenschritte nacheinander ab. Je höher die Taktfrequenz, desto schneller werden die einzelnen Rechenoperationen abgearbeitet. Kein Wunder, dass es vor einigen Jahren noch regelrechte MHz-Rennen zwischen den Herstellern veranstaltet wurde. Doch jede Steigerung der Taktfrequenz bringt auch technische Probleme mit sich. Je höher der Takt, desto größer die Stromaufnahme der CPU. Und je höher der Strom, desto mehr Verlustwärme muss abgeführt werden. Mit aufwändig gestalteten Kühlkörpern und schnell drehenden Ventilatoren versuchte man dem Wärmeproblem Herr zu werden.

BTX als Rettung

Intel machte sich sogar für eine Änderung des Motherboarddesigns stark. Mit dem Formfaktor BTX sollten alle Wärmeproduzierenden in einer Reihe auf dem Board angeordnet werden. Ein einziger, aber großer Lüfter kann jetzt einen kühlenden Luftstrom über das Board schicken und die gesamte Abwärme aus dem Gehäuse befördern. So weit die Idee - auch in der Praxis funktionierte dieses Verfahren recht gut. Einzig Motherboard- und Gehäuseproduzenten spielten auf Zeit. Keiner wollte als erster mit dem alten ATX-Standard brechen. Und nun wird BTX nicht mehr benötigt, denn die CPU-Hersteller haben einen anderen Weg gefunden, die Rechenleistung zu steigern und trotzdem die Verlustleistung zu senken.

Parallel statt seriell

Ihr Trick besteht darin, die geforderte Rechenleistung auf zwei CPUs aufzuteilen. Den Anfang machte vor einigen Jahren Intel mit dem so genannten Hyperthreading-Verfahren. Bei dieser Technologie arbeiteten zwei ALUs (Arithmetic Logic Units) auf einem Chip. Diese müssen sich aber die In-put/Output-Einheiten teilen. Das brachte schon einmal einen großen Geschwindigkeitsgewinn. Neue Prozessoren besitzen gleich zwei komplette CPUs auf einem Chip, einzig um den schnellen Cache müssen sie sich noch streiten. Mit der richtigen Software sind nun weitere Geschwindigkeitssteigerungen möglich. Wohlgemerkt: Zwei Prozessoren bedeuten nicht doppelte Geschwindigkeit. Grund: Für die Verwaltung der einzelnen Rechenschritte (Threads) muss ein Teil der Rechenleistung abgezweigt werden.

Neben dem größten Vorteil der Parallelverarbeitung, der geringeren Leistungsaufnahme, bei gleichzeitig höherer Rechenleistung, kann auch die Taktfrequenz sinken. Und das bringt einen weiteren Vorteil. Es reicht nämlich nicht aus, wenn nur die CPU schnell rechnen kann, sie muss ihre Ergebnisse auch ablegen können. Und die heutigen Speichertechnologien können in Punkto Geschwindigkeit längst nicht mit den CPUs mithalten. Nicht umsonst besitzen moderne Prozessoren große interne Cachspeicher, die die Daten Zwischenpuffern können.

Bei zwei Rechenkernen kann die Taktfrequenz niedrig gehalten werden, die Verlustleistung sinkt - es entsteht weniger Abwärme und der Unterschied zwischen Speichergeschwindig-keit und CPU-Leistung ist geringer. Dadurch kann das System die integrierten Ressourcen besser nutzen.

Nach Zweikern kommt Vierkern

Sowohl AMD als auch Intel bieten schon lange CPUs mit zwei Rechenkernen an. AMD nennt seine Produkte Dual Core CPUs und bei Intel heißen sie Core Duo.

Nun geht Intel aber noch einen Schritt weiter und brachte am 2. November einen Prozessor mit vier Rechenkernen auf den Markt. Der neue Core 2 Extreme Quad-Core Prozessor QX6700 sei als Desktop-Prozessor mit vier integrierten CPUs insbesondere für leistungshungrige Multimedia-Applikationen geeignet. Er sei bis zu 80 Prozent schneller als der aktuelle Core 2 Duo Extreme Prozessor X6800, betont das Unternehmen..

Als erster Desktop-Prozessor mit Quad-Core-Technik kann er seine Leistung insbesondere bei Applikationen ausspielen, die gezielt auf Multi-Threading setzen - zum Beispiel kommende PC-Spiele. Aber auch aktuelle Spiele sollen von seiner hohen Performance profitieren. Der Core 2 Extreme Quad-Core Prozessor QX6700 verfügt über eine Taktfrequenz von 2,66 GHz, der FSB ist mit 1.066 MHz getaktet. Er kann auf den Chipsätzen der aktuellen Intel 975X Express Familie eingesetzt werden. Ein Quad-Core Prozessor für den Massenmarkt soll im ersten Quartal 2007 unter dem Markennamen Intel Core 2 Quad auf den Markt kommen. Er soll insbesondere Anwender ansprechen, die rechenintensive Programme mit Multi-Threading einsetzen. Zum Beispiel Multimedia-Anwendungen, Spiele und andere Unterhaltungsangebote.

Warum Cache?

Der Unterschied zwischen der Rechengeschwindigkeit einer CPU und der Fähigkeit eines Speichers die Daten aufnehmen oder wieder abgeben zu können ist gewaltig. Der Grund liegt im internen Aufbau einer Speicherzelle. Alle dynamischen Speicher arbeiten nach demselben Prinzip. Ein Kondensator wird geladen oder entladen. Das entspricht entweder einen "1" oder einer "0". Über einen einzigen Transistor kann eine solche Zelle bedient werden. Das spart Platz auf dem Chip und nur so lassen sich die heute üblichen großen Kapazitäten realisieren. Nachteilig bei diesem Verfahren: Der Kondensator entlädt sich, technisch bedingt, recht schnell. Deshalb muss ein dynamischer Speicher ständig im Millisekundenabstand "refresht", das heißt neu beschrieben werden.

Weiterhin benötigt der Kondensator eine gewisse Zeit um sich aufzuladen oder um sich zu entladen. Das sind zwar nur Mikrosekunden, für die CPU ist das aber eine halbe Ewigkeit.

Schnellerer Speicher lässt sich technisch ohne Kondensatoren mit mehreren Transistoren realisieren. Dazu bilden mindestens zwei Transistoren einen so genannten Flipflop. Das ist ein sehr schneller Halbleiterspeicher, der dann mit der Taktfrequenz der CPU beschrieben oder gelesen werden kann. Da auf dem CPU-Die mit jedem Quadratmillimeter Fläche gegeizt werden muss, sind diese Speicher in der Regel auch recht klein. Mehr als wenige kByte sind nicht drin. Dieser als Level-1-Cache bezeichnete Speicher läuft immer mit der vollen Taktfrequenz der CPU. Im zur Seite steht ein weiterer Cache, Level-2 genannt, der um einiges größer ist, aber auch ein wenig langsamer. Und schließlich steht der Level-3-Cache parat um noch größere Programm und Datenteile aufzunehmen.

Mit Hilfe dieses genialen Tricks können Prozessoren heute effizienter mit den Daten umgehen, und so auch schneller rechnen, ohne auf den langsamen Hauptspeicher warten zu müssen.

Wer das nicht glaubt, kann sich sehr einfach selbst davon überzeugen. Rufen Sie beim Starten des PCs das Bios auf und schalten die internen Caches der CPU ab (auf Disable stellen). Danach schleicht selbst ein schneller Rechner nur noch müde vor sich hin. Beim nächsten Start stellen Sie im Bios die "Schalter" wieder auf "Enable" und der Rechner ist nun genauso schnell wie vorher.

Kommunikation mit außen

Für die Kommunikation mit der Peripherie stehen dem Prozessor zwei Hilfschips, die so genannte Northbridge und die Southbridge zur Seite. Über die Northbridge wird der Datentransfer von und zum Speicher, sowie zur Grafikkarte abgewickelt. Diese Verbindung wird als Frontsidebus bezeichnet. Er muss sehr schnell sein, da hier ein hoher Datendurchsatz gefordert ist. Die restliche Peripherie, wie Schnittstellen, Tastatur, Maus und Sound steuert die Southbridge. Diese Verbindungen benötigen keine Hochgeschwindigkeitsbausteine, da der Datendurchsatz doch eher gemächlich vonstatten geht.

Auf Boards für AMD-CPUs fehlt die Northbridge. Aus Gründen einer höheren Geschwindigkeit hat AMD den Memory Controller in die CPU verlagert. Deshalb nehmen AMD-CPUs auch ein wenig mehr Strom als Intel-Prozessoren auf. Für eine reelle Rechnung müsste eigentlich auch der Stromverbrauch der Northbridge in die Verlustleistungsbetrachtung einbezogen werden. Und ein normaler Northbridgebaustein beansprucht immerhin 13 Watt für sich.