Energiespar-CPUs für Server im Vergleich

Test - Xeon L5630 vs. Opteron 4162 EE

05.07.2011 von Christian Vilsbeck
Intels Xeon-5600-Serie für Server mit zwei Sockeln überzeugt mit hoher Performance, besonders die Topmodelle. Doch wenn es um geringen Energiebedarf und hohe Effizienz geht, sind AMDs Opteron-4100-CPUs eine lohnende Alternative. Wir testen, ob Intels Stromsparmodell Xeon L5630 mit 40 Watt TDP gegen AMDs 32-Watt-Hexa-Core-Prozessor punktet.

Wer für die beliebten 2-Sockel-Server möglichst viel Rechenleistung benötigt, wählt entweder einen Xeon X5690 mit sechs Kernen und 3,46 GHz Taktfrequenz oder AMDs Opteron 6180 SE mit 12 Kernen und 2,5 GHz. Die Topmodelle sind in der Performance oft auf einem Niveau. Die Entscheidung ob AMD oder Intel, hängt viel mehr von den Server-Angeboten oder der bereits installierten Basis ab.

Sind allerdings eine geringe Energieaufnahme und eine möglichste hohe Effizienz gefragt, dann kommen die Low-Voltage-CPUs ins Spiel. Hier haben sowohl AMD als auch Intel entsprechende Prozessoren im Angebot. So überzeugte der von unserer Schwesterpublikation TecChannel bereits getestete Opteron 4162 EE mit Hexa-Core-Technologie und 1,7 GHz Taktfrequenz bei nur 32 Watt ACP mit dem bisher besten Effizienzwert in unserem Vergleichsfeld von 2-Sockel-Systemen.

Von Intel gibt es mit den Xeon-L5600-Modellen die entsprechenden Konkurrenten mit 40 und 60 Watt TDP im Angebot. Unser gewähltes Testmodell, der Xeon L5630 mit Quad-Core und 2,13 GHz Taktfrequenz ist dabei die schnellste Variante mit 40-Watt-Einstufung. Intels Low-Voltage-Xeons mit Hexa-Core sind bereits wieder mit 60 Watt TDP eingestuft.

Im TecChannel-Testlabor überprüfen wir die Energieeffizienz des Xeon L5630 in der 2-Sockel-Konfiguration. Außerdem messen wir den Vorteil von Low-Voltage-DIMMs im Vergleich zu normalen 1,5-V-Speicherriegeln. Die Performance der Prozessoren bei Integer- und Floating-Point-Anwendungen, Java-Applikationen sowie bei Verschlüsselung, Rendering und Simulation steht ebenfalls auf dem Prüfstand.

Xeon-5600-CPUs: Unterschiede nicht nur bei den Kernen

Alle Xeon-5600-Prozessoren sind im 32-nm-Verfahren gefertigt und arbeiten mit Intels Westmere-Architektur. Innerhalb der Serie stuft Intel die CPUs in die drei Kategorien "Advanced", "Standard" und "Low Voltage" ein.

Speicherkonfiguration Registered DIMMs: Bis zu drei Module sind beim xeon 5600 pro Speicher-Channel möglich, allerdings reduziert sich dann die Geschwindigkeit.
Foto: Intel

Zu den Advanced-Modellen zählen die Hexa-Core-Prozessoren Xeon X5650 bis X5690 mit Grundtaktfrequenzen von 2,66 bis 3,46 GHz. Zusätzlich gibt es fünf Quad-Core-Varianten Xeon X5647 mit 2,93 GHz bis hin zum Xeon X5687 mit 3,6 GHz Grundtaktfrequenz. Die Advanced-Modelle sind mit TDP-Werten von 95 und 130 Watt spezifiziert. Allen Modellen gemein ist ein 12 MByte fassender L3-Cache, Hyper-Threading sowie die QuickPath-Geschwindigkeit von 6,4 GT/s.

Bei den acht Standard-Modellen Xeon E5603 bis E5649 reicht die Grundtaktfrequenz von 1,60 bis 2,66 GHz. Die E56xx-Modelle gibt es mit vier oder sechs Kernen, mit und ohne Hyper-Threading, QuickPath arbeitet mit 4,8 oder 5,86 GT/s und der L3-Cache ist 4, 8 oder 12 MByte groß. Auch die Turbo-Technologie besitzen nicht alle Modelle. Nur die TDP-Einstufung von 80 Watt ist für alle E-Modelle identisch.

Speicherkonfiguration Registered LV-DIMMs: Alle Xeon-5600-Prozessoren unterstützen alternativ auch Stromsparmodule mit 1,35 V Betriebsspannung.
Foto: Intel

Bei den fünf Low-Voltage-Varianten Xeon L5609 bis L5640 wird ebenfalls zwischen Quad- und Hexa-Core-Modellen unterschieden. Zwar besitzen alle Stromspar-CPUs einen 12 MByte fassenden Cache, Turbo und Hyper-Threading gibt es wieder nicht bei allen. Und während die Quad-Core-Xeons mit 40 Watt TDP spezifiziert sind, stuft Intel die sechskernigen LV-Xeons mit 60 Watt ein.

Unterschied gibt es innerhalb der Xeon-5600-Familie auch bei den unterstützten Speichergeschwindigkeiten. DDR3-800 und DDR3-1066 können alle Xeons ansteuern, die schnelleren DDR3-1333-Module sind einigen L56xx- und E56xx-CPUs dagegen vorenthalten. Low-Voltage-DIMMs können dafür alle Xeon-5600-Prozessoren alternativ verwenden. Der im Prozessor integrierte Speicher-Controller des Xeon 5600 unterstützt dabei jeweils drei DDR3-Speicher-Channels. Pro Channel sind drei gepufferte oder zwei ungepufferte DIMMs mit oder ohne ECC möglich. Der Controller kann dabei zwei DIMMs pro Channel mit voller Geschwindigkeit ansteuern, beim dritten Riegel wird die Speichergeschwindigkeit reduziert. Welche DIMM-Konfigurationen genau unterstützt werden, sehen Sie auch im Xeon-5600-Datenblatt ab Seite 58.

Xeon-5600-Modelle im Überblick

In der Tabelle finden Sie alle aktuellen Xeon-5600-Prozessoren mit vier und sechs Kernen im Überblick. Die Preisliste zu den Prozessoren finden Sie direkt bei Intel.:

Alle Xeon-5600-Modelle im Überblick

Prozessor

Grundtaktfrequenz [GHz]

QPI [GT/s]

L3-Cache

Kerne

DIMM-Support

Turbo / HT

AES-NI / TXT

TDP [Watt]

Xeon X5690

3,46

6,4

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

130

Xeon X5687

3,60

6,4

12 MByte

4

DDR3-800/1066/1333

ja / ja

ja / ja

130

Xeon X5680

3,33

6,4

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

130

Xeon X5677

3,46

6,4

12 MByte

4

DDR3-800/1066/1333

ja / ja

ja / ja

130

Xeon X5675

3,06

6,4

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

95

Xeon X5672

3,20

6,4

12 MByte

4

DDR3-800/1066/1333

ja / ja

ja / ja

95

Xeon X5670

2,93

6,4

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

95

Xeon X5667

3,06

6,4

12 MByte

4

DDR3-800/1066/1333

ja / ja

ja / ja

95

Xeon X5660

2,80

6,4

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

95

Xeon X5650

2,66

6,4

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

95

Xeon X5647

2,93

5,86

12 MByte

4

DDR3-800/1066/1333

ja / ja

ja / ja

130

Xeon E5649

2,53

5,86

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

80

Xeon E5645

2,40

5,86

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

80

Xeon E5640

2,66

5,86

12 MByte

4

DDR3-800/1066

ja / ja

ja / ja

80

Xeon E5630

2,53

5,86

12 MByte

4

DDR3-800/1066

ja / ja

ja / ja

80

Xeon E5620

2,40

5,86

12 MByte

4

DDR3-800/1066

ja / ja

ja / ja

80

Xeon E5607

2,26

4,86

8 MByte

4

DDR3-800/1066

nein / nein

ja / ja

80

Xeon E5606

2,13

4,86

8 MByte

4

DDR3-800/1066

nein / nein

ja / ja

80

Xeon E5603

1,60

4,86

8 MByte

4

DDR3-800/1066

nein / nein

ja / ja

80

Xeon L5640

2,26

5,86

12 MByte

6

DDR3-800/1066/1333

ja / ja

ja / ja

60

Xeon L5630

2,13

5,86

12 MByte

4

DDR3-800/1066

ja / ja

ja / ja

40

Xeon L5609

1,86

4,8

12 MByte

4

DDR3-800/1066

nein / nein

ja / ja

40

Analyse: Rechenleistung

Intels Xeon L5360 mit 2,13 GHz Taktfrequenz und vier Kernen hat den Stromsparkonkurrenten AMD Opteron 4162 EE (1,7 GHz / Hexa-Core) in der Rechenleistung überwiegend im Griff. Bei den typischen speicherintensiven Server-Workloads arbeitet Intels Quad-Core-CPU typischerweise zirka 20 bis 24 Prozent schneller. Auf einem Performance-Niveau zum Xeon L5630 ist hier schon eher der Opteron 4170 HE. Der sechskernige Opteron arbeitet mit 2,1 GHz Taktfrequenz bei einer ACP-Einstufung von 50 Watt (Opteron 4162 EE = 32 Watt).

Ein guter Leistungsvergleich der AMD-K10- und Intel-Westmere-Architektur zeigt sich beim Opteron 4122 mit dem Xeon L5630. Beide CPUs besitzen bei vier Kernen und 2,2 GHz (Opteron) beziehungsweise 2,13 GHz Taktfrequenz (Xeon) nahezu identische Grunddaten. Der Xeon L5630 zeigt bei speicherintensiven Workloads jetzt eine zirka 35 bis 42 Prozent höhere Rechenleistung.

Es gibt aber auch Szenarios, bei denen AMD-Prozessoren stets eine sehr gute Performance zeigen. Hierzu zählt die RSA-Verschlüsselung, die wir unter Linux 64 Bit mit openSSL überprüfen. Spezielle, für die CPU-Architekturen optimierte Mathematik-Bibliotheken kommen beim mit gcc kompilierten openSSL-Benchmark nicht zum Einsatz. AMDs Opteron 4162 EE setzt sich jetzt mit 14 und 24 Prozent (Encryption und Decryption) höherem Durchsatz vor den Xeon L5630. Der Intel-Prozessor setzt bei openSSL 0.9.8b allerdings seinen AES-Befehlssatz nicht ein. Mit speziell kompilierten Versionen steigt der Verschlüsselungsdurchsatz um den Faktor 6,6 - das Ergebnis ermittelten wir beim Test des Xeon X5680.

Analyse: Energieeffizienz

Während Intels Xeon-L5630-Duett in der reinen Rechenleistung meist weit vor dem Opteron-4262-EE-Päärchen liegt, sieht es in der Energieeffizienz schon wieder anders aus. Der 2-Sockel-Server Asus RS700-E6/RS4 benötigt mit den zwei Xeon L5630 im Leerlauf 88 Watt. Die zwei Opteron 4162 EE nehmen zusammen mit dem 1U-Server Tyan YR190B8228 (halbe Rackbreite) nur 70 Watt auf. Neben der etwas schlankeren Hardware des AMD-Server gilt es zu beachten, dass pro Opteron 4162 EE zwei Speichermodule (Dual-Channel-Controller) verbaut sind, jeder Xeon L5630 aber drei DIMMs ansteuert (Triple-Channel-Controller). Die zwei DIMMs weniger beim Opteron-System machen sich im Leerlauf mit zirka 5 Watt bemerkbar. Mit zwei Opteron 4122 (75 Watt ACP) steigt im Tyan-Server der Energiebedarf im Leerlauf aber bereits auf 93 Watt.

Unter Volllast bei einem Java-Workload benötigen die zwei Xeon L5630 mit dem Asus-Server 179 Watt. Zum Vergleich: Mit zwei Xeon X5680 (130 Watt TDP) bestückt, zieht das System 399 Watt aus der Steckdose. Extrem sparsam mit nur 129 Watt zeigt sich wieder der Tyan-Server mit den zwei Opteron 4162 EE (32 Watt ACP). Wird der Server mit zwei Opteron 4170 HE (50 Watt ACP) ausgestattet, so steigt die Energieaufnahme mit 174 Watt auf das Niveau des Xeon-L5630-Systems.

Werden die Energiewerte mit der Performance verknüpft, so ergibt sich die Energieeffizienz. SPECpower_ssj2008 ermittelt dabei für den Xeon-L5630-Server einen Effizienzwert von 1287 ssj_ops/watt. Mit diesem Wert arbeiten die Low-Voltage-Xeons so effizient wie die deutlich schnelleren Hexa-Core-CPUs Xeon X5680, die aber auch deutlich mehr Energie benötigen. AMDs Opteron 4162 EE bleibt jedoch in der Effizienzwertung weiter deutlich in Führung. Mit einem SPECpower_ssj2008-Wert von 1484 ssj_ops/watt arbeiten die Stromspar-Opterons im Tyan-Server 15 Prozent effizienter als die Xeon L5630 mit Asus-System. Extrem schlecht schneiden dagegen die Opteron 4122 (75 Watt ACP) ab. Im identischen Tyan-Server bietet das Opteron-4122-Päärchen nur einen Effizienzwert von 863 ssj_ops/watt. Mit dem Opteron-4162-EE-Päärchen bietet der Tyan-Server damit eine 72 Prozent höhere Effizienz.

Bei den sehr guten Effizienzwerten des Tyan-Servers YR190B8228 (bis auf die Kombination mit den Opteron-4122-CPUs) muss noch erwähnt werden, dass das System ein dem geringen Energiebedarf angepasstes Netzteil besitzt. Das verwendete YM-2451C von 3Y Power Technology ist auf maximal 450 Watt ausgelegt. Im Opteron-6100-Server ist ein 1200-Watt-Netzteil verbaut, im Xeon-L5630-Server arbeitet ein 770-Watt-Netzteil, beim Xeon X5680 und L5520 ist noch ein redundant ausgelegtes zweites Netzteil verbaut (macht im Leerlauf und unter Last zusätzliche zirka 35 Watt aus). Der Opteron-4100-Server verschafft sich hierdurch natürlich einen Vorteil in der Energieeffizienz.

Analyse: Vorteil von LV-DIMMs und reduziertem HT-Speed

Die Energiewerte beim Xeon L5630 und den Opteron-4100-Modellen wurden mit Low-Voltage-DDR3-1333-DIMMs ermittelt. Tauscht man beim Xeon-L5630-Server die sechs 4-GByte-LV-DIMMs (1,35 V) gegen normale Registered DIMMs (1,5 V) aus, so sinkt die Energieeffizienz von 1287 auf 1153 ssj_ops/watt um 10,4 Prozent. Beim Opteron 4162 EE reduziert sich die Energieeffizienz beim Tausch der Module um 11,5 Prozent auf 1314 ssj_ops/watt.

Während der Asus-Server mit den zwei Xeon L5630 im Leerlauf mit beiden DIMM-Varianten mit 88 beziehungsweise 91 Watt ähnlich viel Energie benötigt, ist die Differenz unter Volllast deutlich: 179 Watt mit LV-DIMMs und 202 Watt mit normalen DIMMs.

Stromsparspeicher: Oben im Bild ist das LV-DIMM, unten sehen Sie ein normales Registered DIMM. Das LV-DIMM wird mit 1,35 statt 1,5 V Spannung betrieben.

Beim Tyan-Server mit den zwei Opteron 4162 EE zeigt sich ein ähnlicher Effekt: Im Leerlauf braucht das System mit beiden DIMM-Varianten bei 70 beziehungsweise 71 Watt ähnlich viel Energie. Unter Volllast machen sich LV-DIMMs mit 129 statt 146 Watt schon deutlicher bemerkbar. Beim Xeon-Server ist der Unterschied größer, weil statt vier insgesamt sechs DIMMs (pro CPU drei Module) verbaut sind.

Fazit

Ob in einem 2-Sockel-Server für Xeon-5600-Prozessoren das Stromsparmodell Xeon L5630 oder die Topversion Xeon X5680 verbaut wird, bleibt aus Sicht der Effizienz relativ egal. Sowohl die 2,13-GHz-Quad-Core-Xeons als auch die 3,33-GHz-Hexa-Core-Xeons ermöglichen im identischen Server eine annähernd identische Performance pro Watt. Es entscheidet der Workload sowie die im Rechenzentrum zur Verfügung stehende Energie, ob möglichst viel Performance wichtig ist, oder Stromsparen angesagt ist.

Die Performance-Unterschiede zwischen dem Xeon L5630 mit 2,13 GHz und Quad-Core sowie dem Xeon X5680 mit 3,33 GHz und Hexa-Core sind sehr deutlich. In fast allen Workloads ist das X5680-Päärchen zirka doppelt so schnell wie die Stromspar-CPUs. Unter Rechenlast benötigt der 2-Sockel-Intel-Server mit den Xeon X5680 aber auch zirka doppelt so viel Energie.

Arbeiten die Server aber meist nur im Teillastbereich und höchste Rechenleistung ist nebensächlich, so sind die Xeon-L5630-Prozessoren vorzuziehen. Gegenüber den Vorgängern, den Xeon-L5520-CPUs, hat sich die Energieeffizienz auch deutlich erhöht. Durch die etwas geringere Taktfrequenz ist die Performance des Xeon L5630 aber auch etwas geringer als beim Xeon L5520.

Beim Thema Effizienz empfiehlt sich aber auch ein Blick auf das Opteron-4162-EE-System. In unserem Vergleichsfeld bieten die 32-Watt-Hexa-Core-Prozessoren die beste Energieeffizienz. Zusammen mit der Tyan-YR190B8228-Plattform lassen sich sehr stromsparende Rack-Server realisieren. Dann ist es oft nebensächlich, dass die Xeons 20 bis 24 Prozent schneller sind. (cvi)

Testsysteme im Detail

Intels Xeon L5520 und X5570 "Nehalem-EP" sowie den Xeon L5630 und X5680 "Westmere-EP" testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel ein 4 GByte Registered DIMM vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Für den Xeon L5630 verwendeten wir wahlweise auch 4 GByte fassende LV-DDR3-DIMMs. Insgesamt besitzt das System damit 24 GByte Arbeitsspeicher - 12 GByte pro CPU mit drei Channels.

Xeon-5500/5600-Plattform: Der Zwei-Sockel-Server Asus RS700-E6/RS4 dient als Testplattform für die Xeon-5500- und 5600-Prozessoren.

AMDs Opteron 4122, 4162 EE und 4170 HE testen wir in dem 1U-Rackserver Tyan YR190B8228. Der Servereinschub mit halber Rackbreite setzt auf AMDs SR5650-Chipsatz. Jedem Prozessor stehen vier Registered DDR3-1333-DIMMs (zwei pro Channel) zur Verfügung. Die insgesamt 8 DIMM-Steckplätze ermöglichen mit 4-GByte-Riegeln 32 GByte Arbeitsspeicher. Für die Messungen der Energieeffizienz verwenden wir zusätzlich LV-DDR3-1333-DIMMs - hier kommt ein Riegel pro Channel zum Einsatz.

Opteron-4100-Plattform: Der 1U-Server Tyan YR190B8228 benötigt nur eine halbe Rack-Breite.

AMDs Opteron 6174 "Magny-Cours" testen wir in einem 2-Sockel-Referenzsystem von AMD. Das Tower-System verwendet das AMD-Referenz-Mainboard Dinar2 mit AMD SR5690-Chipsatz. Jeder Socket-G34-CPU stehen acht DIMM-Steckplätze zur Verfügung (zwei Speicherriegel pro Channel). Beide Opteron 6174 können im Testsystem auf jeweils vier 4-GByte-Registered-DIMMs zurückgreifen. Dem System stehen somit insgesamt 32 GByte RAM zur Verfügung.

AMDs Opteron 2435 testen wir in einem 4-Sockel-Server Tyan Transport GT26. Der 1U-Rack-Server verwendet als Mainboard ein Tyan S4987 mit NVIDIA MCP55-Chipsatz. Das System eignet sich für den Betrieb mit zwei oder vier Prozessoren. Jedem Prozessor stehen zwei gepufferte 4-GByte-DIMMs in einer Dual-Channel-Konfiguration zur Verfügung. Insgesamt verfügt der Tyan-Server in der 2-Sockel-Konfiguration über 16 GByte Arbeitsspeicher.

Um insbesondere für die Energiemessungen gleiche Vorraussetzungen für den AMD- und Intel-Server zu ermöglichen, arbeiten in den Systemen an der SAS/SATA-Backplane jeweils zwei SATA-RAID-Edition-Festplatten von Samsung. Lässt der Server nur 2,5-Zoll-Laufwerke zu, so verwenden wir die Seagate Constellation. Somit lassen sich bestmögliche Vergleiche zwischen den Prozessoren ziehen.

Als Betriebssystem setzen wir Windows Server 2008/R2 Enterprise x64 ein. Tests unter Linux erfolgen mit CentOS 5.4 in der 64-Bit-Version.

Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation TecChannel.