Wer liegt dieses mal vorne? AMD oder Intel? Diese Frage stellt sich schon seit einiger zeit nicht mehr. Trotz der Probleme bei den Sandy-Bridge-CPUs kann sich Intel mit seinen Top-Modellen im großen CPU-Vergleichstest vor AMD behaupten. So sind der Core i/-980X Extreme Edition zusammen mit dem Core i7-2600K Benchmark-Spitzenreiter. In Bezug auf Server-CPUs mit zwei Sockeln können Intels Xeon-5600 CPUs punkten. Obwohl bei den Spitzen-CPUs etwas ins Hintertreffen geraten, müssen sich auch AMDs Prozessoren nicht verstecken. So kann der Opteron 12-Core-Prozessor überzeugen. Besitzt man ein System mit hoher Skalierbarkeit, sind Intels CPUs der Xeon-7500er-Reihe eine Überlegung wert. Aber auch andere Firmen haben aufgeholt. So bieten IBM und Oracle inzwischen interessante Modelle an.
Wie aber misst man die Performance eines Prozessors für einen CPU-Vergleichstest? Im Wesentlichen liefern hier Fließkomma- und Ganzzahlenberechnungen die wichtigsten Werte, um die reine Performance eines Prozessors zu messen. Im Folgenden kam SPECs renomierte Benchmark-Suite CPU2006 als plattformübergreifendes Tool zum Vergleich der Performance der einzelnen CPUs zum Einsatz. So veröffentlichen alle größeren Prozessoren-Hersteller die CPU2006-Werte ihrer Prozessoren auf SPEC.org. Auch Systemanbieter wie Dell, HP, Oracle und IBM veröffentlichen die Werte ihrer Maschinen.
Lesen Sie auf den folgenden Seiten, wie sich die Prozessoren der verschiedenen Anbieter in den einzelnen Performance-Tests geschlagen haben.
CPU2006-Benchmark - Strenge Regeln
CPU2006 ermittelt die Performance der Prozessoren - im Zusammenspiel mit dem Speicher. Die Leistungsfähigkeit der Grafikkarte, der Netzwerkanbindung oder des Storage-Subsystems spielen bei der Benchmark-Suite keine Rolle.
SPECs CPU2006 verwendet Ganzzahlen- und Fließkommaprogramme und wird mit den Sourcecodes geliefert. Es handelt sich hierbei nicht um Lowlevel-Benchmarks, sondern um Software, die realitätsnahe Aufgabenstellungen bearbeitet. CPU2000 unterscheidet zwischen zwölf Integer-Programmen, die in C und C++ geschrieben sind, sowie 17 Floating-Point-Anwendungen, erstellt mit C, C++ und Fortran.
Vor jedem Testlauf ist bei CPU2006 Programm für Programm zu kompilieren. Für jede CPU-Architektur lässt sich dadurch die optimale Entwicklungsumgebung - bestehend aus Compilern, Mathematik-Bibliotheken sowie dem Betriebssystem - verwenden.
SPEC unterscheidet bei CPU2006 zwischen dem Base- und Peak-Rating. Beim Base-Rating müssen alle CPU2000-Programme mit den gleichen Compiler-Flags erstellt werden. Das Peak-Rating von CPU2006 erlaubt unterschiedliche Compiler-Einstellungen und Optimierungen bei jedem einzelnen Programm. Mit dem Peak-Rating wird die maximale Leistungsfähigkeit einer CPU ermittelt.
Bei den CPU2006-Benchmarks gibt es sehr strenge Regeln: Die verwendeten Compiler, Bibliotheken, Switches und das Betriebssystem müssen mit dem Ergebnis veröffentlicht werden. Damit lassen sich die Ergebnisse auch von unabhängigen Stellen einfach nachprüfen, Betrug würde schnell auffallen.
Die CPU2006-Benchmark-Suite ermöglicht vier Performance-Messungen:
-
SPECint_2006: Ermittelt die Integer-Performance des Prozessors. Der Test arbeitet singlethreaded.
-
SPECfp_2006: Ermittelt die Floating-Point-Performance des Prozessors. Der Test arbeitet singlethreaded.
-
SPECint_rate_2006: Ermittelt die Integer-Performance bei parallel arbeitenden Programmen. Die Anzahl der parallelen Kopien lässt sich einstellen. Damit lässt sich der Ganzzahlendurchsatz bei Multi-Core-/Multi-CPU-Systemen bestimmen.
-
SPECfp_rate_2006: Ermittelt die Floating-Point-Performance bei parallel arbeitenden Programmen. Die Anzahl der parallelen Kopien lässt sich einstellen. Damit lässt sich der Fließkommadurchsatz bei Multi-Core-/Multi-CPU-Systemen bestimmen.
Bei allen Benchmark-Diagrammen verwenden wir die Peak-Wertung, um die maximale Leistungsfähigkeit der CPUs zu zeigen.
Integer-Performance: Singlethread
Der SPECint_2006-Benchmark von CPU2006 arbeitet singlethreaded und nutzt die Vorteile von Technologien wie Hyper-Threading und Multi-Core-Architekturen nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: Singlethread
Der SPECfp_2006-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und Multi-Core-Architekturen nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Integer-Performance: Multithread
Bei den Integer-Berechnungen von SPECint_rate_2006 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der CPU-Kerne eines Prozessors.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: Multithread
Bei den Floating-Point-Berechnungen von SPECfp_rate_2006 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der CPU-Kerne eines Prozessors.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Integer-Performance: Zwei Sockel
Bei 2-Sockel-Systemen ermittelt SPECint_rate_2006 den maximalen Gesamtdurchsatz der beiden Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne von beiden Prozessoren. Bei zwei Quad-Core-CPUs sind somit acht Kopien parallel im Einsatz.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: Zwei Sockel
Bei 2-Sockel-Systemen ermittelt SPECfp_rate_2006 den maximalen Gesamtdurchsatz der beiden Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne von beiden Prozessoren.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Integer-Performance: Vier Sockel
Bei 4-Sockel-Systemen ermittelt SPECint_rate_2006 den maximalen Gesamtdurchsatz der vier Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne aller vier Prozessoren. Bei vier Quad-Core-CPUs sind beispielsweise 16 Kopien gleichzeitig im Einsatz.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: Vier Sockel
Bei 4-Sockel-Systemen ermittelt SPECfp_rate_2006 den maximalen Gesamtdurchsatz der vier Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne aller vier Prozessoren.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Integer-Performance: Acht Sockel
Bei 8-Sockel-Systemen ermittelt SPECint_rate_2006 den maximalen Gesamtdurchsatz der acht Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne aller acht Prozessoren.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: Acht Sockel
Bei 8-Sockel-Systemen ermittelt SPECfp_rate_2006 den maximalen Gesamtdurchsatz der acht Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne aller acht Prozessoren.
Auf SPEC.org sind aktuell keine 8-Sockel-Systeme mit Intels x86-Prozessoren gelistet.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Integer-Performance: 16 Sockel
Bei 16-Sockel-Systemen ermittelt SPECint_rate_2006 den maximalen Gesamtdurchsatz der 16 Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne aller 16 Prozessoren.
Auf SPEC.org sind aktuell keine 16-Sockel-Systeme mit AMDs x86-Prozessoren gelistet.
-
Blaue Balken: Intel-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: 16 Sockel
Bei 16-Sockel-Systemen ermittelt SPECfp_rate_2006 den maximalen Gesamtdurchsatz der acht Prozessoren. Dabei arbeiten wieder multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Gesamtanzahl der CPU-Kerne aller 16 Prozessoren.
Auf SPEC.org sind aktuell keine 16-Sockel-Systeme mit AMDs oder Intels x86-Prozessoren gelistet.
-
Rote Balken: Alternative CPU-Architekturen
Integer-Performance: Top-Systeme
Im Diagramm zeigen wir die schnellsten auf SPEC.org gelisteten Systeme auf Basis von SPECint_rate_2006. Dabei berücksichtigen wir unterschiedliche Architekturen und CPU-Generationen. Bei den CPUs finden Sie die Anzahl der verwendeten Prozessoren in den Systemen.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Floating-Point-Performance: Top-Systeme
Im Diagramm zeigen wir die schnellsten auf SPEC.org gelisteten Systeme auf Basis von SPECfp_rate_2006. Dabei berücksichtigen wir unterschiedliche Architekturen und CPU-Generationen. Bei den CPUs finden Sie die Anzahl der verwendeten Prozessoren in den Systemen.
-
Blaue Balken: Intel-x86-Prozessoren
-
Grüne Balken: AMD-x86-Prozessoren
-
Rote Balken: Alternative CPU-Architekturen
Fazit
Die reine Rechenleistung betreffend spielt IBMs Power7 in einer eigenen Liga. Sowohl die Integer- als auch Floating-Point-Performance übertrifft die gesamte Konkurrenz meist um ein Vielfaches. Neben acht Kernen, vierfachem Multithreading pro Core, Turbo Modus, zwei integrierten DDR3-Speicher-Controllern für acht Channels und Taktfrequenzen bis 4,14 GHz verfügt der 45-nm-Prozessor auch über einen riesigen L3-Cache von bis zu 32 MByte. Egal ob zwei, vier oder acht Power7 im Server sind, die Konkurrenzsysteme sind chancenlos.
Im x86-Segement bei Systemen mit einem Sockel agieren dagegen Intels Westmere-basierender Core i7 und die Xeon-5600-Serie in relativ konkurrenzlos. Von Intels Core i7-2600K mit neuer Sandy-Bridge-Architektur liegen leider noch keine offiziellen SPEC-Ergebnisse vor - langsamer ist die Architektur mit AVX-Erweiterung sicherlich nicht. Der Power7 bietet zwar auch im Single-Thread-Modus die höchste Performance, jedoch sind 1-Sockel-Szenarien mit der IBM-CPU wenig praxisrelevant. AMDs Opteron mit zwölf Kernen bietet der Xeon-5600-Serie in der 2-Sockel-Konfiguration aber mehr als nur Paroli - die AMD-basierenden Systeme sind schneller.
Bei x86-Systemen mit vier Sockeln fällt das Rennen zwischen dem Xeon X7560 mit Octa-Core und Opteron 6180 SE mit 12-Kern-Technologie ebenfalls zugunsten von AMD aus. Während sich die Xeon-7500-Systeme zusätzlich durch ihre RAS-Features auf RISC-Niveau auszeichnen, punkten Opteron-6100-Server meist durch günstigere Preise. Systeme mit Prozessoren wie dem Power7, SPARC T3 sowie die meist langsameren SPARC64 VII+ liegen dagegen in einer ganz anderen Preisliga als Xeon- und Opteron-Server.
Ginge es also nach der puren Performance des einzelnen Prozessors, so hätten ein SPARC64 oder Itanium 9350 keine Daseinsberechtigung. Doch diese CPUs - wie auch der Power7 kommen vor allem in Systemen mit vier, acht, 16, 32 oder mehr Prozessoren zum Einsatz. Hier zählen neben der Skalierbarkeit vor allem auch die ausgeklügelten RAS-Features der CPUs für den sicheren Betrieb der Systeme. An Performance mangelt es durch die CPU-Anzahl dann ebenfalls nicht. Das Metier der x86-CPUs bleiben dagegen Systeme mit einem, zwei oder vier Prozessoren. Hier muss neben der Performance vor allem der Preis und die Energieeffizienz stimmen. Gefährlich wird den SPARCs und Co. aber, wie bereits erwähnt, die Xeon-7500-Plattform. Hier fischt Intel im Terrain der RISC-Maschinen. (cvi)
Dieser Artikel basiert auf einem Beitrag der ChannelPartner-Schwesterpublikation TecChannel.