Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

12.02.1988 - 

Die großen Number-Cruncher haben Konkurrenz bekommen:

Minisupercomputer immer stärker im Kommen

Zwischen den Einsatzbereichen von Superrechnern der Cray-Klasse und dem High-End des Supermini-Sektors klafft eine Lücke, die eine neue Rechnerklasse bestrebt ist auszufüllen: die "Minisupercomputer". Einen Überblick über den Markt dieser Number-Cruncher, über Stärken und Schwächen der einzelnen Systeme gibt CW-Mitarbeiter Hans Berger im folgenden Beitrag.

Seit gut zwei Jahren drängen in immer stärkerem Maße Hersteller auf den Markt, die "Minisupercomputer" mit Spitzenleistungen von bis zu 40 Megaflops (Millionen Fließkomma-Operationen pro Sekunde) anbieten. Offensichtlich verspricht dieser Bereich der technisch-wissenschaftlichen Datenverarbeitung eine gute Rendite. Das zeigt sich ja auch daran, daß sich IBM mit seinem Vektorzusatz einen Teil des Kuchens abschneiden will.

Zu hohe Leistungsversprechen täuschen den Kunden

Minisupercomputer sind nun Minicomputer mit fast der Leistung eines Supercomputers - so werben jedenfalls manche Hersteller. Auch von neuen Modellen mit der Leistung einer Cray X/MP wird schon offen gesprochen. Für ein Zehntel des Preises erhält der Kunde ein Viertel der Leistung einer Cray 1, eines typischen Supercomputers. Da wird in der Werbung nur so mit den Megaflops geklotzt. In manchen Prospekten wird dann auch einfach die Arithmetikleistung und die Datenübertragungsleistung zwischen Haupt- und Registerspeicher zusammengezählt und als Megaflops verkauft. Auch erwähnt man gerne nur die arithmetische Leistung bei 32-Bit-Zahlen (also REAL*4 in der IBM-Welt), die aber sehr oft bei technischen Berechnungen nicht ausreicht. Bei einer Genauigkeit von maximal sieben Stellen wirken sich Rundungsfehler dann schon stärker aus. Geht man dann auf die 64-Bit-Genauigkeit über, halbieren sich allerdings gleich die Leistungsangaben: Aus einer Viertel-Cray wird eine Achtel-Maschine. Wenn man dann noch einige andere wesentliche Einflüsse berücksichtigt, schmelzen diese Daten wie Schnee an der Sonne. Die 60 Megaflops reduzieren sich dann auf 4. Sicherlich reagiert da der technisch-wissenschaftliche Markt allergisch, wenn dann die tatsächlich erreichten Werte von den Prospektwerten erheblich abweichen. Einige technische Daten werden in der Grafik zusammengestellt.

Bei den großen Brüdern, den Supercomputern, weiß man ja inzwischen, daß man die versprochenen 250 Megaflops bei der Cray X/MP oder die 570 Megaflops bei den alten VP200 nie erreicht. Schafft man mehr als 50 Megaflops in einem realen Anwenderprogramm, so spricht man in der Fachwelt von "Supervectorspeed", also Superleistung.

Wie lassen sich die Minisupercomputer nun tatsächlich einordnen? Zunächst einmal der grundsätzliche Ansatz. Alle Hersteller - auf die unten noch detaillierter eingegangen wird - liegen in der Leistung zwischen den Superminicomputern, wie beispielsweise einer großen VAX mit einer Leistung von unter 1 Megaflop, und den echten Supercomputern von rund 240 Megaflops bis zu einem Gigaflop bei den japanischen Herstellern.

Die normalen skalaren Universalrechner, wie beispielsweise eine IBM 3090 oder eine 7890F, schaffen rund 8 Megaflops und sind erheblich teurer als diese kleinen Number-Cruncher. Vergleicht man nämlich einmal die Preise, so muß man etwa 10 Millionen Mark für einen Prozessor eines Supercomputers bezahlen; eine IBM 3090 mit Vektoreinheit kann man wohl schon für 5 Millionen Mark erhalten. In diese Leistungs- und Preislücke stoßen nun die Minisuper hinein. Für etwas mehr als eine Million kann man einen solchen Rechner kaufen, der bei diesem Preis zwar noch knapp ausgestattet, aber immerhin recht leistungsfähig ist. Wenn man nun bedenkt, daß man für eine große VAX auch schon an die 400 000 Mark hinlegen muß, dann kommt so mancher Leiter eines technisch-wissenschaftlichen Rechenzentrums ins Grübeln.

Ihre hohe Leistung ziehen die Minisupercomputer aus der neuen Chip- und Speichertechnologie, dem Pipeline-Prinzip, das heißt, schnelle und überlappte arithmetische Operationen auf gleichartigen Zahlenkolonnen, und aus ihrer Architektur, die oft auf den Grundprinzipien der Architektur von Cray- 1 und Cray X/ MP beruht. Aufgrund de Kombination von architektonischen und technologischen Verfeinerungen wirken sie ausgewogener im Verhältnis der Skalar- zur Vektorleistung, verglichen mit den reinen Supercomputern.

So ist bei den Minisupern die Vektorverarbeitung etwa um den Faktor 5 bis 20 schneller als die Skalarverarbeitung. Bei den Supercomputern reicht dieser Faktor von etwa 30 bei der Cray X/MP bis 250 beim VP400 EX von Fujitsu. Die Skalarleistung beeinflußt nämlich wesentlich die Gesamtleistung eines Vektorrechners.

Ist ein Programm nicht hoch vektorisiert, wird also weniger als 90 Prozent der Rechenzeit in der Vektoreinheit verbracht, dann erreicht man gerade etwas mehr als die skalare Geschwindigkeit. Ist der Unterschied zwischen der Rechenleistung bei Skalar- und Vektorverarbeitung nicht so dramatisch, kann man auch bei niedrigen Vektorisierungsgraden noch gute Leistungen erzielen.

Wer mischt mit bei den Minisupercomputern?

Da sich der Anbietermarkt fast täglich ändert und neue Hersteller hinzukommen, sollen hier nur die wesentlichsten in alphabetischer Reihenfolge genannt werden. Es sind dies Alliant mit der FX-Serie, Convex mit der C1-XL- und XP-Serie, Floating Point Systems mit der M64-Serie, Gould mit der New Processor Line (NP), Multiflow Trace, vertrieben von GEI in Aachen, und Scientific Computer Systems - ein Hersteller aus San Diego, der außer dem Namen nichts mit dem deutschen Softwarehaus SCS (Scientific Control Systems) zu tun hat - mit seinem Rechner SCS 40.

Der Kunde kann aus einem breiten Leistungsspektrum von Minisupercomputern auswählen. Oft werden sogar Rechnersysteme mit mehreren Prozessoren angeboten, die vor Ort dann aufgerüstet werden können. In der Architektur unterscheiden sich die Rechner wesentlich: Das geht von "attached" Prozessoren, die also einen Vorrechner benötigen, über die konventionellen Cray-Architekturen bis hin zu echten Parallelrechnersystemen.

Architektur, Leistungsdaten und Eigenschaften

Alliant FX/8

Dieser Rechner ist ein echter Parallelcomputer und kann mit bis zu acht Prozessoren oder Rechenelementen geordert werden. Jeder Prozessor schafft skalar etwa 0,5 und vektoriell rund 12 Megaflops, unabhängig von der Rechengenauigkeit. Bei der Maximalkonfiguration mit acht Prozessoren sind das also 4 beziehungsweise 96 Megaflops. Der Compiler untersucht ein vorliegendes Programm auf parallelisierbare Elemente und verteilt diese auf die angegebenen Prozessoren. Neben dieser Parallelisierung wird das Programm natürlich noch vektorisiert. Von der Architektur her ist die FX/8 ein sehr modernes Rechnersystem. Der Hersteller plant übrigens jährlich eine Verdoppelung der Prozessorzahl, so daß man in fünf Jahren mit einem Rechnersystem mit 512 Prozessoren rechnen kann. Die Taktzeit beträgt 170 Nanosekunden; der Hauptspeicher ist auf 512 MB ausbaubar. Da auch die Palette der Anwendungssoftware immer breiter wird und das System zur VAX-Welt kompatibel ist, ist in diesem Marktbereich mit einer großen Akzeptanz zu rechnen.

Convex C1-Serie

Die Convex ist wohl der bekannteste Minisupercomputer mit einer Cray-ähnlichen Architektur und wurde im Oktober 1984 angekündigt. Ausgehend von einem Einprozessor-System können bis zu vier Prozessoren in einem System arbeiten; bis zu 32 Rechnersysteme lassen sich lose koppeln. Durch transparenten Dateizugriff, Jobaufteilung und Lastausgleich können auch mehrere gekoppelte Systeme optimal genutzt werden. Die Convex-Rechner zielen vornehmlich auf den VAX-Markt.

Die skalare Leistung liegt bei 1, die vektorielle bei 40 (32-Bit-Arithmetik) beziehungsweise 20 (64 Bit) Megaflops. Die Taktzeit beträgt 100 Nanosekunden, bis auf 1 Gigabyte läßt sich der Speicher ausbauen. Als Betriebssystem wurde Unix gewählt, der Fortran-Compiler wird zu den leistungsfähigsten bezüglich der Autovektorisierung gezählt. Aufgrund der Ähnlichkeit zur Cray steht eine breite Palette von Anwendersoftware auf Fortran-Ebene zur Verfügung.

Die XP-Serie unterscheidet sich von der XL-Serie durch die modernere Technologie (CMOS VLSI mit 20 000 Gattern) und durch einen eigenen Prozessor für die Skalarverarbeitung.

Floating Point Systems M64-Serie

Ausgehend von den alten FPS-120- und FPS-164-Rechnern, die man eigentlich als die ältesten Minisupercomputer bezeichnen kann, wurden die sehr leistungsfähigen Maschinen entwickelt. Das zur Zeit kleinste System, M64/20, schafft 6, der M64/ 60 bis zu 38 Megaflops. Von den beiden anderen Herstellern unterscheiden sich die FPS-Rechner dadurch daß sie einen Front-End-Rechner beispielsweise eine VAX oder eine IBM, benötigen. Sie dienen dann als sehr schneller Arithmetikzusatz und lösen große Vektor- oder Matrixprobleme separat vom Vorrechner. Die Ansteuerung erfolgt dann durch Unterprogrammaufrufe. Da eine sehr schnelle und umfangreiche Unterprogrammbibliothek zur Verfügung steht, brauchen sich die Anwender um viele Problemlösungen keine Gedanken zu machen.

Die Taktzeit beträgt (beim Spitzenmodell M64/60) 53 Nanosekunden, der Hauptspeicher ist bis 72 MB ausbaubar, wobei hier aber berücksichtigt werden muß, daß ja im wesentlichen der Hauptspeicher des Vorrechners genutzt wird.

Gould-NP1- Serie

Erst vor etwa einem halben Jahr hat auch Gould seinen Hut in den Ring geworfen und bietet nun die Rechnerfamilie New Processor Line (NPL) an. Schon aus dem Stand heraus bietet Gould recht beachtliche Leistungen. Skalar sollen maximal 2, vektoriell bei 64 Bit Rechengenauigkeit 20 Megaflops erreicht werden. Die Taktzeit beträgt 52 Nanosekunden; der Hauptspeicher ist auf 256 MB aufrüstbar. In diesem System können bis zu acht Zentraleinheiten eng gekoppelt werden. Hier ist interessant, daß in den Prozessor ein Arithmetikbeschleuniger integriert werden kann, mit dem einmal die skalare Verarbeitungsgeschwindigkeit, insbesondere aber auch die vektorielle, auf 40 Megaflops gesteigert werden kann. Da Gould bisher gerade im Prozeßrechnerbereich bekannt war, dürfte dieses System auf den Markt der Echtzeitverarbeitung mit hohen Rechenanforderungen zielen.

Multiflow Trace

Bei diesem Rechnersystem wurde einmal ein ganz anderer Ansatz verwirklicht: Es wurde zu einem existierenden Compiler (ungefähr 1978 an der Yale-Universität entwickelt) die passende Hardware gebaut. Aufgrund dieser Vorgehensweise werden Parallelitäten in Anwenderprogrammen schon auf der Ebene eines einzelnen Befehls erkannt; man muß also nicht im herkömmlichen Sinne handvektorisieren oder Programmteile umstrukturieren. So werden auch Operationen, die nicht direkt etwas mit dem Programmcode zu tun haben, wie beispielsweise Adreßberechnungen, parallel zur Ausführung anderer Operationen ausgeführt. Vom Ansatz her sicherlich eine sehr interessante Architektur.

Auch hier wieder die technischen Daten: Die skalare Leistung beträgt 3, die vektorielle etwas mehr als 60 Megaflops. Diese Leistung wird durch die Verbindung von vier Arithmetikpaaren (Integer- und Fließkommaeinheit) mit je etwa 15 Megaflops erreicht. Der Hauptspeicher kann auf 512 MB ausgebaut werden. Die Taktzeit beträgt 130 Nanosekunden, sie wird aber für gewisse Operationen halbiert, so daß man schon in 65 Nanosekunden eine ganzzahlige Addition durchführen kann.

SCS-40 von Scientific Computer Systems

Dieser Rechner wurde eigentlich aus zwei Wurzeln entwickelt. Einmal wurden die Architektur und die Ideen der Superminicomputer, auf der anderen Seite die Elemente des Supercomputers Cray-X/MP eingebracht. Es wird die X/MP auf Assembler/Maschinencode-Ebene durch Microcode emuliert. Jedes binäre Cray-Programm ist also auf einer SCS-40 lauffähig. Als Betriebssysteme sind das CTSS (Cray Time Sharing System) - als amerikanische Spezialentwicklung hier in Deutschland weitgehend unbekannt - und das übliche COS (Cray Operating System) - leider aber nur in älteren Versionen - verfügbar. Von der Leistung her ist dieses ein interessantes System, bei einer Taktzeit von 45 Nanosekunden werden 2 skalare und 44 vektorielle Megaflops erreicht. Ein inzwischen wesentlicher Schwachpunkt ist die Größe des Hauptspeichers: Maximal sind 32 MB möglich, verglichen mit 1 GB bei Convex also nur ein Zweiunddreißigstel. Hier wird SCS sicherlich einiges tun müssen, um den Anschluß zu halten.

Die Crayettes werden - wie oben schon gesagt - oft mit einer sehr hohen Leistung angeboten. Rein theoretisch läßt sich der Durchsatz gut vergleichen, betrachtet man den Vektorisierungsgrad dabei als Parameter. Dabei spielt die Leistung des Compilers keine Rolle. Bei einem Vektorisierungsgrad von 0 Prozent hat man genau die Skalarleistung, bei 100 Prozent die maximale Vektorleistung. Man kann die Grafik leicht nachvollziehen:

Bei genauer Untersuchung dieser Darstellung ergibt sich, daß die wirklichen Supercomputer ab etwa 90 Prozent Vektorisierungsgrad mit den Minisupercomputern gleich zu bewerten sind, bezogen auf das Preis/ Leistungs-Verhältnis. Doch spielt gerade bei diesen Rechnern der Zeitgewinn ein große Rolle. Wenn ein Programm 30 Stunden auf einer Crayette rechnet, aber nur drei Stunden auf einem Supercomputer, so kann diesem Zeitgewinn in der Forschung eine ausschlaggebende Bedeutung zukommen.

Aus diesem Gesichtspunkt heraus läßt sich schon der Einsatzbereich der Minisupercomputer ableiten. In den Abteilungen oder Instituten mit größerem, vektorisierbaren Rechenbedarf oder aber als Vor- und Entwicklungsrechner bei einem Supercomputer sind sie gut einzusetzen. Der Anwender kann dann vor Ort seinen Bedarf befriedigen.

Man muß aber auch bedenken, daß eine skalare IBM 3090 bei Vektorisierungsgraden bis zu 70 Prozent mithalten kann, aber in vielen Industriebetrieben ohnehin vorhanden ist, oder auch Maschinen ähnlicher Leistungsklasse im Hochschulbereich.

Leider wird in diesen Diskussionen oft vergessen, daß auch Minisupercomputer eine gewisse Systemunterstützung, Betriebssystempflege und auch Anwenderunterstützung benötigen. Auch die Anwendersoftware kostet Geld, so daß man sich unter betriebswirtschaftlichen Gesichtspunkten genau überlegen muß, ob eine solche Anschaffung sinnvoll ist.

Eines bleibt aber festzustellen: Mit dem Erscheinen der Minisupercomputer auf dem Markt wurde die Position der Großen geschwächt. Auch Crays oder Fujitsus sind heute erheblich günstiger zu haben als noch vor zwei Jahren. Die Preise mußten rutschen, denn bei einem Faktor 20 im Preis, aber nur 10 in der Leistung überdenkt mancher Chef seine Entscheidung.

Die Großen holen zum Gegenschlag aus

Inzwischen sammeln auch die bekannten Supercomputerhersteller ihre Bataillone und bieten kleinere Systeme zum günstigen Preis an. So offerierte gerade ETA/CDC die sogenannte Piper, die ETA 10-P mit etwa 190 Megaflops(bei 64-Bit-Arithmetik), 32 MB Arbeits- und 64 MB Zentralspeicher, 1,2 GB Plattenspeicher und Magnetband, Betriebssystem, Fortran- und C-Compilern sowie Netzwerkanschlüssen für rund 2,5 Millionen Mark. Eine VP-30-EX von Fujitsu in ähnlicher Ausstattung mit gleicher Leistung dürfte nicht viel teurer sein. Auch Cray bietet eine Cray X/MP-EM (Engineering Model) an, die zwar nicht aufrüstbar aber um einiges im Preis unter den üblichen Cray-Maschinen liegt.

Da lohnt es sich schon, Überlegungen anzustellen, ob man sich für 1,5 bis 2 Millionen Mark einen Minisupercomputer oder gleich einen bekannten Supercomputer in Sparversion kauft.

Umgekehrt ist natürlich auch damit zu rechnen, daß die "Kleinen" leistungsfähiger werden. Aus dem Haus Convex hört man heute schon von einem sehr leistungsfähigen Nachfolgemodell der XP-Serie. Sicherlich haben auch die anderen Hersteller starke Modelle in der Entwicklung oder sogar schon fertig. Auch nach unten müssen sich die Crayettes abschotten - dort wachsen leistungsfähige Workstations nach.

Der Markt noch vor etwa acht Jahren als exotisch angesehen - boomt, ein Super- oder Minisupercomputer gehört heute halt in jedes bessere Haus. Was für den Privatmann sein eigener Mikro, ist für das Institut der eigene Superrechner.

Wenn man zurückschauend sieht daß die Minisupercomputer heute eine Skalarleistung aufweisen, wie sie vor zehn bis fünfzehn Jahren die Jumbos unter den Rechnern hatten, kann man nur noch staunend vor der aktuellen Entwicklung stehen. In einem Jahr wird sicherlich an dieser Stelle noch Erstaunlicheres zu berichten sein.