Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

12.04.1979

Zentrale Verarbeitung

Der Einsatz eines MP direkt als Zentralprozessor liegt besonders nahe Minicomputern, allgemeinen DVA mittlerer Ausbaufähigkeit. Mikroprozessoren erreichen heute schon die Geschwindigkeit derartiger Anlagen, so daß einige Minicomputer-Hersteller bereits Alternativen zu ihren eigenen Produkte anbieten. Beispiele und der Mikroprozessor LSI-11 von Digital Equipment Corp., der software-kompatibel zum bekanntesten Minicomputer überhaupt, der PDP 11, ist, sowie der MP ÁNova von Data General Corp., kompatibel zur Nova-Serie. Die Software-Kompatibilität macht dabei die in der Vergangenheit entwickelte umfangreiche Programmbibliothek dieser Hersteller und ihrer Kunden nutzbar.

Will man in den nächst höheren Leistungsbereich vorstoßen, den gegenwärtig die großen Computer-Familien zum Beispiel von CDC, Honeywell Bull, IBM, Univac oder Siemens überdecken, so kommt ein direkter Ersatz des Zentralprozessors durch einen MP gegenwärtig noch nicht in Frage. Das liegt nicht 90 sehr an der reinen Maschinenzykluszeit (für MOS-MP liegt diese zwar noch im Mikrosekundenbereich, erreicht aber bei Bipolar-MP durchaus auch 100 ns) als vielmehr an der geringeren Komplexität, die dazu zwingt, viele Funktionen, die in großen Rechnern parallel abgewickelt werden, im MP sequentiell abzuarbeiten. Beispiele sind die in Großrechnern übliche Parallelberarbeitung der verschiedenen Befehlsphasen ("pipelining") oder die Übersetzung virtueller in reelle Adressen parallel zur Bearbeitung von Operanden. Hier mag zwar schon die nächste MP-Generation weitere Fortschritte bringen. Es gibt jedoch auch Versuche, bereits mit MP herkömmlicher Komplexität zentrale Verarbeitungsprozessoren zu ersetzen. Nach der obigen Bemerkung kommt dann aus Leistungsgründen nur verstärkte Parallelarbeit mehrerer MP in Frage, es wird also notwendig, Multi- oder gar Polyprozessor-Konfigurationen aufzubauen (wobei das letztere Wort eine noch größere Anzahl von Elementen andeute soll als das erste).

Hier kann man nun zwei große Entwicklungslinien erkennen, nämlich zum einen den Weg hin zum Feldrechner ("array processor"), der mit einem Befehlsstrom gleichzeitig auf viele Datensätze wirkt, zum anderen die Auflösung der herkömmlichen Vielfachlast, etwa in einem Teilnehmersystem, in eine Anzahl unabhängiger, parallel bearbeitbarer Aufgaben (viele Befehlsströme). Beide Wege befinden sich gegenwärtig im Forschungs- und auch schon im Versuchsstadium und sollen nun ein wenig ausführlicher vorgestellt werden.

Feldrechner

Bekanntester Vertreter der Feldrechner ist der an der Universität von Illinois in Zusammenarbeit mit Burroughs, später mit Honeywell, entwickelte Rechner ILLIAC IV /2/. Ursprünglich mit vier Quadranten zu je 64 sogenannten "processing elements", bestehend aus Prozessor und Datenspeicher, geplant, wurde bisher nur ein Quadrant verwirklicht. Abgesehen von Präprozessoren, die für eine Aufbereitung und Vorverarbeitung der Eingabedaten sorgen, damit die 64 Verarbeitungseinheiten überhaupt sinnvoll beschäftigt werden können, ist ein als "control unit" bezeichneter Führungsrechner vorhanden, der für die Bearbeitung des in seinem eigenen Speicher befindlichen einzigen Programms zuständig ist. Er führt die darin enthaltenen Befehle aber nicht selbst aus, sondern delegiert sie an alle oder einen ausgewählten Teil der 64 Prozessoren, die sie dann auf die in ihrem privaten Speicher liegenden Daten anwenden. Hauptanwendungsgebiet der Feldrechner ist das interaktive Lösen von Differentialgleichungen, welches häufigen Datenaustausch der nach einem Iterationsschritt erzielten Ergebnisse an die Nachbarelemente erfordert. Dazu ist in der ILLIAC IV ein torusartiges Verbindungsnetz zwischen den 64 Elementen realisiert, das jeden Prozessor mit seinen vier Nachbarn verbindet.

Die ILLIAC IV wurde 1966 entworfen als noch keine MP in Sicht waren. Aus heutiger Sicht, sagt Slotnick, einer der Entwickler, er würde jetzt wohl an ein Multimikroprozessorsystem denken. Ein derartiges System wird im Forschungslabor der Firma Siemens seit 1975 untersucht. In diesem SMS 201 genannten System übernimmt wie in der lLLIAC ein Führungsrechner den Anstoß von einer Reihe von Verarbeitungsprozessoren. Jedoch besitzt das System keine starre geometrische Verbindungsstruktur, sondern einen einfachen Bus.

Ebenfalls im Gegensatz zu ILLIAC findet der Anstoß der Verarbeitungsprozessoren durch den Führungsprozessor nicht Befehl für Befehl, sondern auf der Ebene der Unterroutine statt. Wenn alle Unterroutinen beendet sind, erfolgt durch den Führungsprozessor ein Ergebnisaustausch über einen gemeinsam zugänglichen Speicherbereich, danach ein erneuter Anstoß derselben oder anderer Routinen, zum Beispiel zur Berechnung des nächsten Interationsschritts.

Das Verfahren wurde zunächst in einem ersten Versuchsaufbau SMS 101 mit 8 MP 8080 und einem weiteren MP als Führungsrechner (Intellec 8 - das ist der 8080 als Mikrocomputer) getestet, unter anderem mit dem angepaßten Problem von vier gekoppelten Pendeln, das auf vier Differentialgleichungen zweiter Ordnung oder acht Gleichungen erster Ordnung führt, von denen jede einem MP zugewiesen wurde. In diesem Programm war der Anteil der autonomen Phase 91 Prozent, der Ergebnisübernahme 7 Prozent und der Anstoßphase rund 2 Prozent. Die Gesamtauslastung unter Berücksichtigung der unterschiedlichen Laufzeit der Unterroutinen in der MP lag bei 80 Prozent. Insgesamt ergab sich eine Leistung, die der des Minicomputers Nova 1200 entsprach.

Nachdem sich in diesem Versuchsaufbau das Prinzip des 3-Phasen-Schwemas bewährt hatte, konnte mit dem SMS 201 unter anderem bereits das wesentlich komplexere Problem der Wettervorhersage angegangen werden, bei dem ein System partieller Differentialgleichungen an vielen Stützpunkten gleichzeitig gelöst werden muß.

Dazu wurde den 128 MP je ein bestimmtes geographisches Gebiet zugewiesen, für das sie - ausgehend von einem gegebenen Anfangszustand - zunächst unabhängig voneinander die in einem kleinen Zeitraum sich entwickelnde Wetterlage berechnen. In der, Ergebnisaustauschphase erhalten sie dann vom Führungsrechner (Nova Eclipse) die Ergebnisse der Nachbargebiete mitgeteilt, aus denen sie durch Interpolation mit den eigenen Werten später die Anfangswerte für den nächsten selbständigen Verarbeitungsschritt gewinnen. Anstelle der eigentlich ständig vorhandenen Wechselwirkung aller Gebiete wird also mit einer periodisch ein- und ausgeschalteten kurzzeitigen Wechselwirkung gerechnet. Diese Näherung (die übrigens auch in Großanlagen zur Wettervorhersage verwendet wird) ist bei genügend klein gewählten Zeitschritten aber zulässig. Das Ergebnis dieser hundertfachen Parallelarbeit ist beachtlich: Selbst mit dem einfachen und relativ langsamen MP 8080 dauert eine 24-Stunden-Prognose für die gesamte Nordhalbkugel nur etwas mehr als eine Stunde (die von Großcomputern benötigte Rechenzeit ist von gleicher Größenordnung). Durch Verwendung von schnelleren MP und Zusatzhardware für arithmetische Operationen ließe sich die Rechenzeit auf wenige Minuten reduzieren.

Inzwischen wurden weitere Probleme zur Bearbeitung auf dem SMS 201 aufbereitet, bei denen ähnlich eindrucksvolle Leistungen erzielt wurden. Wesentliche Voraussetzung für die parallele Bearbeitung von Prozessen ist dabei immer, daß diese - wenigstens stückweise - unabhängig sind. Dies war zur Beispiel im Fall des Wettervorhersageproblems dadurch gegeben, daß sich die Daten nach geographischen Gesichtspunkten aufteilen ließen.

Ein ähnliches Projekt, wie es das SMS darstellt, nur mit dem Bipolar-MP Intel 3002 als Verarbeitungsprozessor und dem Minicomputer Nova 800 als Führungsrechner, wird von der amerikanischen Firma Grumman Aerospace Corp. verfolgt. Von dieser Firma waren erstmals auch MP-Anzahlen zu hören, die heute noch phantastisch anmuten: Dort werden selbst Systeme mit 10 000 MP in Betracht gezogen.

Universalrechner

Feldrechner haben ihre Stärke bei der Lösung von Aufgaben, die gleichartige

Verarbeitung verschiedener Daten verlangen und die daher parallel abgearbeitet werden können; sie versagen, wenn die Probleme nennenswerte Anteile sequentieller Verarbeitung aufweisen. Doch auch hier gibt es Überlegungen, ein System vieler MP einzusetzen.

Zumindest eine Betriebsart von Universalrechnern weist eine Last mit ähnlichen Eigenschaften auf, wie sie in Feldrechnern vorliegt, nämlich der Teilnehmerbetrieb. Dabei laufen für eine größere Anzahl von Teilnehmern jeweils unabhängige Prozesse, die durchaus zur parallelen Bearbeitung geeignet sind. Daß alle Teilnehmer dennoch an einem Rechenzentrum hängen, hat ja vor allem ökonomische Gründe: Die vom Rechenzentrum angebotenen Dienstleistungen (Bereitstellung von Verarbeitungskapazität und Hochleistungs-Peripheriegeräten wie Laserdrucker oder Belegleser, aber auch von komplexen Programmpaketen und Dienstprogrammen wie optimierenden Compilern und ähnlichem) sind teuer, werden aber von den einzelnen Anwendern immer nur teilweise genutzt, sind also besonders wirtschaftlich, wenn sie vielen Anwendern zur Vefügung stehen. Da nun der einzelne Anwender von allen Betriebsmitteln, insbesondere auch dem Prozessor, immer nur ein kleines Stückchen erhält, eignen sich als Verarbeitungssystem für Teilnehmerbetrieb auch Multimikroprozessorsysteme.

Das in Bild 4 gezeigte System stellt zum Beispiel eine dreistufige Baumstruktur von Knoten dar, die jeder einen Arbeitsprozessor mit privatem Speicher (von zum Beispiel 256 Byte, bei Verwendung von 64 Kbit-Speicherbausteinen auf einer einzigen Baugruppe unterzubringen!) und einen Verbindungsprozessor enthalten. Die Benutzerprozesse werden von den Arbeitsprozessoren der untersten Ebene bearbeitet. Einige von diesen bedienen die Ein/Ausgabegeräte, sie spielen die Rolle von E/A-Prozessoren. In den höheren Ebenen laufen Betriebssystemprozesse, insbesondere die Zuteilung der Betriebsmittel.

Daß derartige Systeme bisher nur an Universitäten untersucht wurden (unter anderem Cm* an der Carnegie-Mellon-Universität) und trotz ihrer grundsätzlichen Eignung für den Teilnehmerbetrieb über das Versuchsstadium nicht hinausgekommen sind, insbesondere aber von den großen Computerherstellern nicht als Produkte angeboten werden, liegt an der relativ geringeren Bedeutung, die heute dem Teilnehmer- gegenüber dem Teilhaberbetrieb beigemessen wird. Teilhaberbetrieb bedeutet, daß mehrere Benutzer denselben Datenraum bearbeiten (zum Beispiel eine Datenbank), die Daten also nicht auf verschiedene private Arbeitsspeicher aufgeteilt werden dürfen, sondern in einem gemeinsamen Arbeitsspeicher liegen müssen. Viele kleinere Prozessoren an einem gemeinsamen Speicher aber würden sich gegenseitig so behindern, daß schließlich doch eine geringere Gesamtleistung herauskäme als mit einem großen Prozessor. Für den Teilhaberbetrieb erscheint daher ein Multimikroprozessorsystem nicht geeignet.

Zusammenfassend kann man feststellen, daß in kleineren Datenverarbeitungsanlagen ein Mikroprozessor als Zentralprozessor eine wirtschaftliche Lösung darstellt, während bei hohen Leistungsanforderungen der Einsatz eines Multimikroprozessorsystems vorläufig auf Spezialanwendungen wie Feldrechner oder ähnliches beschränkt ist.