Test und Analyse: Der Athlon 64 mit Windows XP 64 Bit - Teil 2

15.01.2004
Fortsetzung von Ausgabe 1/2 2004, Seite 27

Fortsetzung von Ausgabe 1/2 2004, Seite 27

WOW64: SPEC CPU2000 Floating Point

Die Benchmark-Suite SPEC CPU2000 verwendet Ganzzahlen- und Fließkomma-Programme und wird mit den Sourcecodes geliefert. Es handelt sich hier nicht um Lowlevel-Benchmarks, sondern um Software, die realitätsnahe Aufgabenstellungen bearbeitet. Ausführliche Details zu SPEC CPU2000 finden Sie in unserem Test: Athlon 64/FX vs. Pentium 4.

Für den Test der Floating-Point-Performance des Athlon 64 FX-51 im 32-Bit-Betrieb unter beiden Windows-Versionen kompilieren wir die SPEC-Benchmarks praxisnah für das Base-Rating. Dazu verwenden wir Intel C++ 7.1 und MS Visual Studio für alle Integer-Tests.

Mit ungewöhnlich hoher Performance arbeitet die 32-Bit-Anwendung 197.art unter Windows 64 Bit im WOW64-Betrieb. Die Bilderkennungs-Software ist hier 17 Prozent schneller als bei unserem Testlauf mit Windows XP Professional 32 Bit.

WOW64: Raytracing

Beim Raytracing-Leistungstest fordert CINEBENCH 2000 besonders die FPU des Prozessors. Der auf Cinema 4D XL basierende Benchmark verwendet eine Szene, die stark von Anti-Aliasing, Schatten, Transparenzen und Spiegelungen Gebrauch macht. Die Leistungsfähigkeit der Grafikkarte und des Speichers spielen hier kaum eine Rolle.

WOW64: Simulation

Auf dem aktuellen Cinema 4D R8 von Maxon basiert der Raytracing-Test von CINEBENCH 2003. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte ebenfalls eine untergeordnete Rolle.

Die Benchmark-Suite Science Mark 2.0 bietet unterschiedliche Berechnungen aus dem mathematischen und physikalischen Bereich. Über die Simulation der Molecular Dynamics untersucht man das thermodynamische Verhalten von Materialien. Science Mark erlaubt die Simulation von fünf Edelgasen in drei verschiedenen kristallgrafischen Konfigurationen mit einer variablen Anzahl von Atomen bei einer wählbaren Temperatur.

Die Berechnungen der Simulation basieren auf komplexen mathematischen Formeln und fordern die CPUs sehr stark.

Mit der Primordia-Simulation (Lateinisch: Uranfang, Atom) werden die atomaren Umlaufbahnen jedes Elektrons für beliebige Elemente des Periodensystems berechnet. Für die Kalkulation verwendet Science Mark eine eingeschränkte Hartee-Fock-Methode. Als Ergebnis wird die Gesamtenergie der Elektronen eines Atoms ausgegeben.

Um die Leistungsfähigkeit der Prozessoren bei den komplexen Berechnungen einzuordnen, gibt Science Mark die benötigte Simulationszeit an.

WOW64: SSE-Performance

Eine detaillierte Analyse der SSE-Performance erlaubt die Benchmark-Suite Science Mark 2.0. Hier werden Matrizen mit einer Größe von bis zu 1536 x 1536 berechnet.

Die Matrizenmultiplikation mit einfacher Genauigkeit ermittelt dabei die MFLOPS des Prozessors. Die Multiplikation nutzt die128-Bit-SSE-Register des Athlon 64 FX-51. Science Mark ist für den Betrieb mit 32-Bit-Windows-Versionen ausgelegt.

Eine dezidierte Analyse der SSE2-Performance bietet Science Mark ebenfalls an. Jetzt werden die bis zu 1536 x 1536 großen Matrizen mit doppelter Genauigkeit berechnet. Die Matrixmultiplikation ermittelt wieder die MFLOPS des Athlon 64 FX-51.

WOW64: Direct3D

Wie schnell Direct3D-Anwendungen für Windows-32-Bit unter der AMD64-Windows-Version laufen, ermitteln wir mit 3DMark2001 Pro SE. Die aktuellere 3DMark03-Benchmark-Suite ließ sich wegen der fehlenden 64-Bit-Version von DirectX 9 unter Windows XP 64 Bit Edition leider noch nicht installieren.

64 Bit: Packer

Beim Komprimieren von Dateien müssen große Datenmengen verarbeitet werden. Die doppelte Registerbreite von 64 Bit und die erhöhte Anzahl allgemeiner Register des Athlon 64 FX-51 im 64-Bit-Mode sind bei Kompressionsalgorithmen von großem Vorteil.

Das zum Test verwendete Packer-Programm Mini-GZIP basiert auf der Version 1.1.4 der ZLIB-Kompressions-Bibliothek. AMD optimierte bei der Anwendung die Algorithmen für den 64-Bit-Betrieb mit AMD64-Prozessoren. Eine 32-Bit-Variante von Mini-GZIP dient zum Performance-Vergleich mit der 64-Bit-Ausführung - AMD stellte uns beide Versionen zur Verfügung.

Zusätzlich nutzen wir Winzip 9.0 Beta 5480 (32-Bit-Version) zur Verifikation der Ergebnisse. In allen Fällen diente eine 23,64 MByte große Textdatei für die Komprimiertests. Die Mini-GZIP-Programme packen die Datei auf eine Größe von 9497 KByte (Kompressions-Level 9). WinZip haben wir so eingestellt, dass die txt-Datei auf die fast identische Größe (mit 9467 KByte etwas besser) komprimiert wird.

Das WinZip als 32-Bit-Version schneller ist als die 64-Bit-Variante von Mini-GZIP, wirft jedoch die Frage nach der Optimierung von Mini-GZIP-32-Bit auf. Zwar verwendet WinZip andere Kompressions-Algorithmen als Mini-GZIP, die Komprimierrate ist jedoch identisch.

Mini-GZIP 32 Bit schneidet im Vergleich zu WinZip 9.0 32 Bit sehr schlecht ab. Die Vermutung, dass der Code keine Optimierung enthält, stellt sich bei näherer Untersuchung als wahr heraus. Etwas "Spielerei" am Sourcecode von Mini-GZIP 32 Bit beweist es.

Bereits ein Re-Compile mit Microsoft Visual Studio sowie das Setzen einiger Compiler-Switches steigert die Performance von Mini-GZIP 32 Bit um zirka die Hälfte.

Die 64-Bit-Version von Mini-GZIP wird von einer AMD64-optimierten Assembler-Routine unterstützt. Mit der "handgestrickten" 64-Bit-Optimierung ist der Athlon 64 FX-51 aber trotzdem nicht schneller als das 32-Bit-WinZip.

64 Bit: Kryptographie

Das symmetrische Kryptographieverfahren AES (Advanced Encryption Standard) basiert auf einer frei verfügbaren symmetrischen 128-Bit-Blockchiffre. Beim Verschlüsseln werden die Daten der Register beispielsweise mit Shift- oder XOR-Operationen verknüpft. Bei 64-Bit-Registern kann pro Taktzyklus die doppelte Datenmenge verschlüsselt werden. Dadurch sollte im 64-Bit-Mode der Durchsatz in MByte/s steigen.

Nach unseren Erfahrungen mit AMDs Optimierung der 32-/64-Bit-Varianten von Mini-GZIP stellt sich allerdings auch hier die Frage nach der Aussagekraft des 32-Bit-AES-Benchmarks. Der Sourcecode steht uns hier nicht zur Verfügung. Laut AMD ist das 32-Bit-AES-Tool AESPERF61 für den Athlon 64 und Athlon 64 FX optimiert.

Eine von AMD bereitgestellte "unoptimierte" 32-Bit-AES-Variante AESPERF603 verwendet Default-Libraries. Dieses Tool erreicht nur einen Datendurchsatz von 51 MByte/s statt der 77 MByte/s der optimierten Anwendung.

64 Bit: DivX-Encoding

Die DivX-Encoder-Benchmarks von AMD sind in der 32- und 64-Bit-Version für die Athlon-64-Prozessoren optimiert. Die Tools lesen eine Video-Datei im Interlaced-YUV-Format ein und enkodieren daraus einen DivX-konformen Bitstream. Als Ergebnis übergibt der Benchmark die durchschnittlich enkodierten Frames pro Sekunde. Die benötigte Zeit für das Schreiben der DivX-Video-Datei ist dabei allerdings nicht enthalten.

Fazit

Windows XP 64 Bit Edition für AMD64-Prozessoren (Webcode: a1022) konnte in einem Punkt auf Anhieb überzeugen: Vorhandene 32-Bit-Applikationen laufen ohne Performance-Einbußen gegenüber einem 32-Bit-Windows-XP - teilweise sogar schneller. Der einzige Ausreißer unter DirectX lässt sich durch den frühen Entwicklungsstand des 64-Bit-DirectX-APIs erklären. Auch die OpenGL-Implementation bedarf noch Optimierung.

Die Ergebnisse des Athlon 64 FX-51 mit den bislang erhältlichen 64-Bit-Programmen sind jedoch noch nicht sehr aussagekräftig. Das Beispiel des hochoptimierten 64-Bit-Packers und des beigelegten 32-Bit-Packers mit nicht optimiertem Code zeigt, dass von Herstellern gelieferte Benchmarks stets mit Vorsicht zu genießen sind. Je nach verwendetem Compiler sowie dessen Einstellungen kann man Programme beliebig bremsen. Finale Analysen über die 64-Bit-Performance können wir erst mit Benchmark-Tools von Drittanbietern machen.

Ein definitiver Vorteil des 64-Bit-Betriebs ist der große Adressraum. Allerdings wird dieser zurzeit vorwiegend im Enterprise-Computing und bei aufwendigen Simulationen benötigt. Dem Gros der Desktop-PCs genügt der 32 Bit breite Adressraum mit 4 GByte - beziehungsweise 2 GByte für Anwendungen - wohl noch einige Jahre. Solange wird Microsoft mit dem Launch von Windows XP 64 Bit Edition für AMD64-Prozessoren aber nicht warten. In der ersten Jahreshälfte 2004 soll es die finale Version laut Hersteller geben, eine Beta-Version ist für MSDN-Subscribers bereits erhältlich.

Testkonfiguration

Die Beta-Version von Microsofts Windows XP 64 Bit Edition stand uns als Build 3790. dnsrv.030707-1810 mit installiertem Service Pack 1 v.1033 zur Verfügung. Zum Vergleich für die Performance-Tests dient Windows XP Professional SP1a.

Bei der Hardware kommen folgende Komponenten zum Einsatz:

CPU: AMD Athlon 64 FX-51

Mainboard: ASUS SK8N, NVIDIA nForce3, BIOS: 1002 B007

Speicher: 2x Corsair 2x CMX 512-3200LL CL 2,5

Grafikkarte: MSI 5900 Ultra, Treiber: 45.23

SCSI: Adaptec AHA-2940UW Pro

Laufwerk: Seagate ST336705LW SCSI

Sound: Aureal Vortex 2

Mehr dazu finden Sie unter www.tecchannel.de.

tecCHANNEL-Compact "Linux-Server Komplettpaket"

tecChannel.de ist die Nummer eins der Online-Fachmedien in Deutschland (IVW 5/03). Auf www.tecChannel.de finden Sie mehr als 1000 Beiträge und über 12.000 News zu allen Themen der IT. Das kostenlose Online-Programm wird ergänzt durch das noch umfangreichere kostenpflichtige tecCHANNEL-Premium und die tecCHANNEL-Compact-Buchreihe.

Das neue tecCHANNEL-Compact "Linux-Server Komplettpaket" bietet Ihnen beispielsweise alle notwendigen Grundlagen und die Anleitung zum "SuSE Linux Office Server" auf der Buch-CD. Für weniger als 10 Euro erhalten Sie eine bewährte und stabile Server-Lösung - auch für Windows-Clients - für Ihr Intranet mit File-/Printserver, Online-Zugang, Firewall-/Spam-Schutz und Ihren Internet-Auftritt. Im Handel kostet das tecCHANNEL-Compact mit CD 9,90 Euro, bei Direktbestellung unter www.tecchannel.de/shop nur 8,90 Euro.

Glossar

AGP: Acclerated Graphics Port: Der AGP ist ein von Intel entwickelter Steckplatz für 3D-Grafikkarten basierend auf dem PCI-Bus. Über den AGP kann eine Grafikkarte direkt auf den Hauptspeicher des Systems zugreifen und dadurch Texturen benutzen, die im lokalen Speicher der Karte keinen Platz mehr finden.

CPU: Central Processing Unit: Zentraleinheit. Der Prozessor als Ganzes.

DDR-SDRAM: Double Data Rate SDRAM: Verdoppelt die Bandbreite durch Nutzung beider Taktflanken für die Datenübertragung.

DLLs: Dynamic Link Library. In einer DLL lassen sich Routinen zusammenfassen, die von mehreren Programmen benötigt werden. Das spart Platz, weil die Routine nur einmal vorhanden ist und nicht in jedem Programm. Zudem wird die Versions-Verwaltung vereinfacht, weil bei Fehlern nur eine DLL ausgetauscht werden muss, statt aller Programme.

Dongle: Zum Schutz vor Raubkopien, speziell codierter Baustein, ohne den bestimmte Software nicht funktioniert.

FPU: Floating Point Unit: Fließkommaeinheit. Funktionsblock im Prozessor, der auf die Bearbeitung von Fließkommazahlen optimiert ist.

OpenGL: Open Graphics Language: Von SGI entwickelte hardwareunabhängige 3D-Grafikschnittstelle mit vorgefertigten Funktionen für Rendering, Texturen und andere Visualisierungseffekte.

SSE: Streaming SIMD Extensions. Intels Marketingbezeichnung für einen erweiterten 3D- und Multimedia-Befehlssatz. SIMD steht für Single Instruction Multiple Data.

SSE2: Streaming SIMD Extensions 2. Intels Bezeichnung für einen erweiterten 3D- und Multimedia-Befehlssatz. SIMD steht für Single Instruction Multiple Data. SSE2 ist die zweite Version, die im Pentium 4 debütierte.

Threads: Ein Thread besteht aus einer Abfolge von Befehlen sowie dem Zustand der Sequenz. Dieser wird durch Counter, Call/Return-Stack sowie Thread-eigener Daten repräsentiert. Ein Task besteht immer aus einem oder mehreren Threads.

Zur Startseite