Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

16.10.1992 - 

DSM mit MIMD-Rechner

Münchner Unternehmen mischt mit im Markt der Supercomputer

Die Digital Service München (DSM) und Parsytec aus Aachen treten das Rennen um die Giga- und Teraflop-Rechner an. DSM will sich ferner aktiv an den geplanten europäischen Supercomputer-Initiativen beteiligen. Nachdem Suprenum und iP-Systems ja schon im vergangenen Jahr ihre Parallelrechner-Produktion eingestellt haben, mischen nun also nur noch diese zwei deutschen Unternehmen mit im Markt der Supercomputer.

DSM bietet schon seit einigen Jahren Supercomputer auf der Basis massiv-paralleler Rechnersysteme an. Als Rechenknoten werden die Intel-RISC-860-Prozessoren verwendet, die schon seit längerer Zeit verfügbar und lieferbar sind. Sie haben sich als sehr stabil und leistungsfähig erwiesen.

DSM Computer Systeme ist ein Unternehmensbereich der DSM Digital Service GmbH in München. Schon seit 1981 beschäftigt sich das Unternehmen mit Digitaltechnik und entwickelte ab 1984 eigene Rechnersysteme. Sehr früh erkannte man die Bedeutung der Parallelverarbeitung und begann 1989 mit dem Entwurf eines MIMD-Parallelrechnerkonzeptes.

MIMD-Modell: flexibel und zukunftsträchtig

Beim MIMD-Konzept arbeiten die Prozessoren unabhängig voneinander an verschiedenen Aufgaben beziehungsweise können unterschiedliche Befehle ausfahren. Es hat sich heute als das flexibelste und zukunftsträchtigste Architekturmodell herausgestellt, denn fast alle Parallelrechner-Hersteller bieten Systeme auf MIMD-Basis an. Auch die Neuankündigungen von Cray sowie vor kurzem von Fujitsu/Siemens-Nixdorf und anderen zielen in diese Richtung. Aber erst mit der Verfügbarkeit des Intel-RISC-Prozessors 860 konnte DSM parallele Supercomputer in größeren Stückzahlen preisgünstig produzieren und vermerkten.

Die Produktpalette der "Infinity-8000"-Serie reicht vom Vier- bis zum 4096-Prozessormodell. Damit wird ein Spitzenleistungsspektrum von 320 (240) Mflops bis 328 (246) Gflops abgedeckt (in Klammern die Werte für 64-Bit-Arithmetik). Geplant ist ein 8192-Prozessor-System, das dann maximal (bei 32-Bit-Arithmetik) 650 Gflops beziehungsweise fast 500 Gflops (bei 64-Bit-Arithmetik) erreichen soll. Die Systeme können übrigens beim Kunden aufgerüstet werden.

Dem Anwender steht neben dieser enormen Rechenleistung auch ein großer Hauptspeicher zur Verfügung. Pro Prozessor können derzeit bis zu 512 MB Speicher angeboten werden, das bedeutet, bei einem Vierprozessorsystem schon 2 GB. Der Zugriff auf die Daten und Befehle im Speicher, sonst oft ein Engpaß, wird durch einen Daten- und Befehls-Cache erheblich beschleunigt.

Um die Rechenprozessoren von der Kommunikationsarbeit zu entlasten, die ja bei Parallelrechner-Systemen unbedingt erforderlich ist, wird zusätzlich ein Transputer als Kommunikationsprozessor auf dem Board verwendet. Neben den direkten Verbindungen mit den vier Nachbarprozessoren (als Dualport-Kopplung) können auch Diagonalverbindungen, also serielle Link-Verbindungen, geschaltet werden. Mit Hilfe dieser Kommunikationsmöglichkeiten lassen sich auch komplexe Parallelrechner-Architekturen, etwa Hypercubes, aufbauen. So ist dann beispielsweise bei einer 16-Knoten-Hypercube-Architektur auch eine Kommunikation zwischen den Eckknoten schnell realisierbar.

DSM hat eine Subknotenstruktur entwickelt, die aus einem vierfachen Knotenelement mit 16 Kommunikationskanälen besteht. Damit läßt sich theoretisch ein 16-dimensionaler Würfel aus 65 636 Prozessoren verbinden.

Die Auswahl und die Prozessorausstattung des Parallelrechner-Systems wird von der geplanten Anwendung massiv beeinflußt. Parallelrechner sind eben heute noch keine Universalrechner, auf denen beliebige Programme optimal bearbeitet werden. Hier bietet DSM einen Service: In Absprache mit dem Kunden kann das Rechnersystem hardwaremäßig speziell auf das, Anwendungsspektrum zugeschnitten werden. So lassen sich Prozessoren oder Gruppen davon gezielt mit Kommunikationsleitungen verbinden.

Die Übertragungsleistung der Kanäle ist variabel. Die Prozessoren können mit unterschiedlichem Speicher versehen werden. Kleine Anwendungen und interaktive Vorgänge verarbeitet man dann auf den kleineren, große Rechenprobleme parallel dazu auf den besser ausgestatteten Prozessoren. Auch ist geplant, im Bedarfsfall die Prozessoren bis auf einen GB Hauptspeicher oder noch weiter aufzurüsten.

In der Öffentlichkeit weitgehend unbekannt

So hat nahezu jedes der bisher ausgelieferten Parallelrechner-Systeme individuelle Merkmale und wurde nicht nach dem Katalog gekauft. Nach Aussage von Manuel Vieira, Geschäftsführer von DSM, wurden bisher mehr als 25 größere Parallelrechner - ab 32 Knoten - an Kunden ausgeliefert, zum größten Teil im Forschungsbereich. Ein Vierprozessorsystem inklusive Plattenspeicher gibt es bei den Münchnern schon ab etwa 60 000 Mark, einen 512-Prozessorrechner für etwas mehr als vier Millionen Mark.

Die Tatsache, daß DSM ein erfolgreicher deutscher Supercomputer-Hersteller ist, hat die Öffentlichkeit nicht so recht registriert, Alliant mit nur 28 860-Prozessoren ist bis jetzt bekannter als DSM mit seinem 4096-er System.

Als Vorrechner oder Host sind unterschiedliche Workstations als Plattformen einsetzbart, die Unix als Betriebssystem nutzen, in Kürze auch OS/2 -Rechner. Über spezielle Links lassen sich jetzt schon Sun-, Macintosh- oder sogar Transputersysteme anbinden. Eine entsprechende Kopplungssoftware steht zur Verfügung. Im Prinzip reicht für den Anschluß eine Transputer- oder Linkadapter-Karte im Host-Rechner. Auf dem Parallelrechner selbst sind auch Multiuser- und Multitasking-Betrieb möglich.

Auch auf der Softwareseite hat DSM einiges zu bieten. Für diverse Programmiersprachen stehen Compiler zur Verfügung: Der "Gnu-C"-Compiler, ein leistungsfähiger vektorisierender C- und ein vektorisierender "Fortran"-Compiler von der Portland Group. Diese Compiler nutzen die Architektur des Prozessors effektiv aus. In vier Monaten soll "C + + " ausgeliefert werden. Auch für Assembler-Fans ist gesorgt.

Die Programmierung von Infinity-Parallelrechnern wird durch das "Linda"-Konzept der Yale Universität unterstützt. Es wurde von DSM erweitert und kommt als "Parallex" zum Einsatz. Die Daten, die zwischen Prozessoren auszutauschen sind, werden in einem sogenannten Tuple-Space gehalten.

Der Zugriff erfolgt über drei Linda-Grundbefehle (RD, IN, OUT). Die abgelegten Tuple sind nur über ihren Inhalt adressiert, so daß die Programme des Infinity-Rechners unabhängig von der Anzahl der Knoten und der Architektur geschrieben werden können. Die Topologie des Parallelrechners muß den Anwender daher nicht interessieren. Er kann das fertige Programm problemlos skalieren und auf Systeme mit einer größeren Prozessorzahl übertragen.

In der Parallex-Bibliothek findet man neben den Grundbefehlen für den Zugriff auf den Tuple-Space auch Routinen für das Verteilen des Programms auf die Knoten. Auch Analysewerkzeuge für die Zeitmessung zur Leistungsbestimmung sind vorhanden.

Die Bibliothek stellt auch eine Möglichkeit bereit, direkt mit den Knoten zu kommunizieren. So kann für bestimmte Algorithmen beispielsweise eine Hypercube-Architektur angewendet werden. Zusätzlich gibt es die Möglichkeit, virtuelle Kanäle oder alternativ Punkt-zu-Punkt-Verbindungen zu nutzen.

Diese Linda-Vorgehensweise hat den Vorteil, daß Kunden mit einer kleinen Anlage einsteigen können und ohne zusätzliche, Softwareportierungskosten den Rechner erweitern können.

Bei vorhandenen sequentiellen Programmen muß sich der Anwender die Parallelisierungsstrategie überlegen. Wie derzeit bei allen Paralleirechnern liegen die Kommunikationsaufrufe, das Verteilen der Daten, die parallele Berechnung, die Synchronisation und das Aufsammeln in der Hand des Programmierers. Er kann auch effektivere Kommunikationsverfahren einsetzen, die die Verbindungstopologie des vorliegenden Rechners effektiver ausnutzen. Für diesen Zweck bietet sich die DSM-eigene Kommunikationsbibliothek "Parlib" an. Erfahrungen von Kunden zeigen, daß sich Programme für eine spezielle Anwendung pro Knoten um 90 Prozent beschleunigen ließen.

Individuelle Parallelrechner

Die Parlib-Kommunikationsbibliothek wird derzeit erweitert. An mathematischen Bibliotheken lassen sich "Imsl" und eine Bibliothek mit vektorisierten, sehr schnellen Unterprogrammen unterstützen.

Die Parallelrechner von DSM zeichnen sich im Vergleich zu anderen Systemen durch ein günstiges Preis-Leistungs-Verhältnis aus. Als deutscher Hersteller in München ist man darauf eingestellt, auf spezielle Kundenwünsche und Vorschläge einzugehen und individuelle Parallelrechner auszuliefern. Die Unterstützung durch die Hard- und Software-Entwickler aus München ist jederzeit sichergestellt.

*Uwe Jehnsen ist freier Journalist in München.