Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

11.04.1986 - 

Parallelrechner in hyperkubischer Topologie auf Transputer-Basis:

FPS-Superrechner für neue Anwendungen

MÜNCHEN (ch) - Mit der T-Serie stellte Floating Point Systems jetzt eine modulare Rechnerfamilie vor, die laut Hersteller in den komplexeren Varianten hinsichtlich Rechenleistung und Geschwindigkeit selbst leistungsfähige Supercomputer in den Schatten stellen soll.

So bringt es, immer nach Darstellung des Produzenten, das Spitzenmodell T/40 000 mit 16 Gigabyte lokalem Hauptspeicher und einer Plattenspeicherkapazität von bis zu vier Terabyte auf eine arithmetische Rechenleistung von 262 Gigaflops.

Das Konzept beruht auf einer Kombination von Parallelarchitektur in hyperkubischer Topologie mit Vektorarithmetik und der speziell für die parallele Datenverarbeitung entwickelten höheren Programmiersprache Occam. Diese wurde von Floating Point Systems mit Erweiterungen versehen, die insbesondere eine Bibliothek mathematischer Routinen beinhalten. Weiter besorgt Occam in der T-Serie die Vektorisierung der Daten, überlappende Berechnungs- und Kommunikationsvorgänge und die Vermeidung von Deadlocks, was besonders in der Programmentwicklungsphase von Bedeutung sein wird.

Hardwarebasis der Rechenleistung ist ein "Knoten", der mit dem Transputer T414 des britischen Herstellers Inmos als Zentraleinheit bestückt ist (siehe auch Seite 53). Jeweils acht dieser Knoten bilden ein "Modul". Jeder Knoten kommuniziert über bis zu 14 serielle Leitungen mit anderen Knoten; daraus ergibt sich ein Limit von 16 384 Knoten im Netzwerk. Der Ausbau des Systems erfolgt jeweils durch Verdoppelung der Hardware und damit auch der Rechenleistung.

Zwar besteht die kleinste angebotene Einheit aus acht Prozessorelementen, doch ist jedes dieser Elemente im Prinzip bereits ein kompletter Rechner, der, mit einer Transputer-CPU und einem 64-Bit-Vektorprozessor bestückt, einen Durchsatz von 16 Megaflops erreicht. Um den Datenverkehr zwischen Zentraleinheit, Arbeitsspeicher und Vektorprozessor zu beschleunigen, ließen sich die Entwickler einen Kniff einfallen: Während die CPU über den normalen 32-Bit-Datenbus mit dem Hauptspeicher, einem Dual-Port-Video-RAM von Texas Instruments verkehrt, liest über den zweiten Port der Vektorprozessor seine Daten aus. Letzterer greift dabei dergestalt auf den Speicher zu, daß er immer zwei Vektoren gleichzeitig lädt. Auf diese Weise kommt eine Transferrate von 3 Gigabyte pro Sekunde zustande.

Die Speicherkapazität beläuft sich auf ein Megabyte Arbeitsspeicher und ein Gigabyte Plattenspeicher für jeden Knoten. Für die Kommunikation stehen über einen Link-Adapter insgesamt 16 Leitungen zur Verfügung, von denen allerdings zwei für Zwecke des Betriebssystems reserviert sind.

Als kleinste betriebsfähige Einheit bietet Floating Point Systems das Modell T/10 rnit acht Knoten und Betriebssystem mit eigener zusätzlicher Festplatte an. Auf dieser Platte wird zur Erleichterung der Fehlersuche in regelmäßigen Abständen der Inhalt des Arbeitsspeichers abgebildet. Die Rechenleistung beträgt 128 Megaflops. Ein solcher Computer soll ab Ende April zu einem Preis von 500 000 US-Dollar lieferbar sein.

Hinsichtlich der Rechenleistung mit einer Cray-2 konkurrieren kann laut FPS die Ausführung T/100. Sie besteht aus acht Modulen oder 64 Knoten und führt 1,02 Gigsflops je Sekunde durch, kostet aber mit rund 10 Millionen Mark nur einen Bruchteil des konventionellen Superrechners.

Eine allzu große Gefahr für gängige Superrechner sieht Wilfried Biela, Geschäftsführer der deutschen Floating Point Systems, in seinem Produkt allerdings nicht. Da diese auf umfangreiche Fortran-Anwenderprogrammbibliotheken zurückgreifen können und die neuen Maschinen in Occam zu programmieren sind, wird seiner Ansicht nach ein Verdrängungswettbewerb nicht eintreten. Statt dessen sieht er das Betätigungsfeld für die Parallelmaschinen in neuen Anwendungen, für die die bisherige Rechenleistung nicht ausreichte, zum Beispiel in der Astrophysik, Wettervorhersage, 3-D-Strukturanalyse und Windkanalsimulation, aber auch in der Bildanimation, in sehr großen Datenbanken oder in der künstlichen Intelligenz.