Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

Anwender misstrauen Windows-Lösungen von der Stange

Anbieter für fehlertolerante Systeme tun sich schwer

02.02.2001
MÜNCHEN (ba) - Fehlertoleranz soll der Wintel-Allianz beim Sturm auf die Highend-Segmente des Server-Marktes als schlagkräftige Waffe dienen. Doch nach Ansicht von Analysten werden es Anbieter wie Stratus und Marathon schwer haben, ihre laut Eigendefinition ausfallsicheren Windows-basierten Intel-Server an den Mann zu bringen. Um Kunden von fehlertoleranten Rechnern mit dem Microsoft-Label zu überzeugen, ist noch viel Vertrauensarbeit nötig.

Je abhängiger die Unternehmen von ihrer IT werden, umso wichtiger wird das Thema Ausfallsicherheit. Dies bekam vor kurzem Softwareriese Microsoft schmerzhaft zu spüren. Die Häme war groß, als vor zwei Wochen die Web-Server der Redmonder für mehrere Stunden ausfielen. Zwar beteuerten die Verantwortlichen, die Systemarchitektur sei fehlertolerant angelegt mit allen notwendigen Redundanzen. Experten spekulierten jedoch über Fehler der Gates-Company.

Die Panne kommt für Microsoft zu einem besonders ungünstigen Zeitpunkt. So versucht man mit dem neuen Betriebssystem Windows 2000 verstärkt das Enterprise-Segment zu adressieren. Aber genau dort legen die DV-Manager größten Wert auf die Stabilität der Systeme. Ausfallzeiten werden längst nicht so schnell verziehen wie im Desktop-Bereich.

Das Geschäft mit fehlertoleranten Systemen spielte sich bislang in einem Nischenmarkt ab. Anbieter wie Compaq mit den von Tandem übernommenen "Non-Stop-Himalaya"-Servern bedienen mit ihren hochkomplexen und teuren Speziallösungen ganz dedizierte Anwendungsbereiche wie zum Beispiel die Abwicklung von Börsentransaktionen. Allerdings versuchen seit einiger Zeit Firmen wie Stratus und Marathon, das Thema Ausfallsicherheit auch im Rahmen von Wintel-Architekturen hoffähig zu machen.

Das in Maynard, Massachusetts, ansässige Unternehmen Stratus will ab dem zweiten Quartal dieses Jahres mit den Modellen "5200" und "6500" seiner "ft-Server"-Reihe Windows-basierte ausfallsichere Systeme herausbringen (ft steht für fault-tolerant). Die Rechner arbeiten mit Pentium-III-Xeon-CPUs von Intel, die auf 550 Megahertz (5200) beziehungsweise 700 Megahertz (6200) getaktet sind. Als Betriebssystem will Stratus alle verfügbaren Windows-2000-Varianten anbieten.

Die Fehlertoleranz der Systeme beruht auf einer speziellen Prozessorkonfiguration, erklärt Michael Lindner, Geschäftsführer für Deutschland. So bestehe jede logische CPU aus vier physikalischen Chips, die jeweils paarweise miteinander verknüpft sind. In dieser Vierer-Konstellation wird das Betriebssystem mit den dazugehörigen Applikationen viermal taktzyklussynchron zum Laufen gebracht. Das bedeutet, jedes Programm läuft auf allen vier Prozessoren absolut parallel.

Nach jedem Rechenschritt vergleichen die CPU-Paare ihre Ergebnisse. Stimmt das Ergebnis überein, wird die Verarbeitung fortgesetzt. Liefern zwei Prozessoren unterschiedliche Ergebnisse, wird das Chippaar aus dem System herausgenommen. Die Applikationen laufen jedoch auf dem verbleibenden CPU-Paar unterbrechungsfrei weiter, erläutert Lindner.

Mit Hilfe einer integrierten Fehlererkennung analysiere das System die Ursachen der Panne und schicke eine Meldung über das Remote Service Network (RSN) an die Stratus-Zentrale. Dort kümmerten sich Servicemitarbeiter um die Ersatzteile, den Transport zum Kunden sowie den Einbau.

Die Technik hat Stratus von den Systemen seiner "Continuum"-Reihe übernommen. Diese Rechner basieren auf PA-Risc-CPUs von Hewlett-Packard und arbeiten mit den Betriebssystemen HP-UX und dem Stratus-Produkt Virtual Operating System (VOS). Der Unterschied zu den Windows-basierten Rechnern ist der Preis. Während die Kosten für ein VOS-System bei etwa 500 000 Dollar beginnen, sollen die ft-Server schon ab etwa 23 000 Dollar zu haben sein.

Geldgeschäfte unter Windows sind zu riskantAbgrenzungsprobleme zwischen den Geräten der Continuum- und der ft-Reihe sieht Lindner nicht. VOS-Rechner seien vor allem im Zusammenhang mit transaktionskritischen Zahlungssystemen im Einsatz. Anbieter dieser Services wie zum Beispiel die Firma Telecash hafteten für die vollständige Abwicklung. Deshalb würden sie kaum von den bewährten VOS-Systemen auf eine Windows-Architektur umsteigen. Als Einsatzgebiete für die ft-Geräte sieht Lindner Applikationen wie E-Mail- oder Web-Hosting-Dienste sowie Anwendungen aus den Bereichen E-Commerce, Costumer-Relationship-Management (CRM) und Enterprise-Resource-Planning (ERP).

Stratus garantiert eine Verfügbarkeit von 99,999 Prozent. Das bedeutet eine jährliche Ausfallzeit von fünf Minuten und 26 Sekunden. Diese Garantie bezieht sich auf das Gesamtsystem und schließt damit Windows ein. Stratus arbeitet nach eigenen Angaben eng mit Microsoft zusammen, um den Ansprüchen gerecht zu werden. Ein wichtiger Aspekt seien dabei so genannte gehärtete Treiber. Laut Microsoft würden 40 Prozent aller Blue Screens durch Treiberfehler verursacht. Mit Hilfe der Stratus-Technologie ließe sich sicherstellen, dass Treiber nur auf fest definierte Speicherbereiche zugreifen und sich somit nicht in die Quere kommen.

Was die Kombination von Fehlertoleranz und Windows betrifft, gibt es in der Branche allerdings noch viel Misstrauen. Nach Ansicht von Markus Korn, verantwortlich für die "Netserver"-Reihe bei HP-Deutschland, ist das Thema echte Hochverfügbarkeit eine recht neue Welt für die Wintel-Fraktion: "Von Fault-tolerant-Computing wollen wir da noch gar nicht reden." Dennoch versucht HP, mit Produkten, die auf der Marathon-Technik basieren, ebenfalls dieses Marktsegment zu bedienen.

Die Marathon-Architektur verwendet einen ähnlichen Ansatz wie die Stratus-Technik. So basieren die Systeme des Herstellers aus Boxborough, Massachusetts, auf Standardkomponenten wie Intel-Prozessoren und Windows-Betriebssystem. Marathon baut keine eigenen Server, sondern entwickelt seine fehlertolerante Architektur, die ebenfalls eine Verfügbarkeit von 99,999 Prozent verspricht, auf der Basis von Rechnern anderer Hersteller. Aktuell im Programm sind Compaq, IBM, Hewlett-Packard und Siemens. Die Maschinen des Direktanbieters Dell stecken gerade in der Testphase.

Eine Marathon-Konfiguration besteht aus vier Servern, von denen je zwei Systeme zu einem "Tuple" gekoppelt sind. In einem Tuple kümmert sich eine Maschine um die Datenverarbeitung (Compute Element), der andere Server besorgt den Datentransport (I/O-Element). Ein fehlertolerantes Marathon-System setzt sich aus zwei Tuples zusammen. Alle Systeme sind über spezielle Marathon Interface Cards (MICs) miteinander verbunden. Fällt ein Tuple aus, übernimmt der andere Teil des Systems sofort alle Aufgaben, ohne dass ein Anwender eine Unterbrechung bemerkt.

Wie bei Stratus laufen auch hier Betriebssystem und Applikationen auf den beiden Verarbeitungs-Servern taktzyklussynchron. Die dafür notwendige Marathon-Software residiert auf den abgekoppelten I/O-Systemen. Diese Anwendung kümmert sich ferner um die Fehlererkennung und -isolation sowie um die Spiegelung der Massenspeicher und stellt verschiedene Funktionen für die Systemverwaltung zur Verfügung.

Ein wichtiger Vorteil der Marathon-Lösung ist die Möglichkeit, das System Desaster-tolerant aufzustellen, erklärt Gerd Thumm, verantwortlicher Manager für die Marathon-Angebote des Systemhauses Sysdat. So könnten die Tuples, die über Glasfaserleitungen miteinander verbunden sind, bis zu 1,5 Kilometer voneinander entfernt positioniert werden. Katastrophenschutz sei mittlerweile ein Feature, dass mittlerweile fast alle Benutzer von fehlertoleranten Systemen erwarteten.

Ein weiterer Pluspunkt, der für Marathon spricht, ist die Unterstützung von Servern verschiedener Hersteller, erklärt Thumm. Während Stratus seine ft-Server in wenigen Standardkonfigurationen anbiete, könnten die Marathon-Angebote speziell auf die Anforderungen der Kunden hin konfiguriert werden.

Die Preise für die Marathon-Systeme beginnen laut dem Sysdat-Manager bei etwa 100 000 Mark. Allerdings komme es ganz auf die Konfiguration der Rechner an. Außerdem müssten oft noch andere DV-Komponenten wie zum Beispiel das Netz auf eine fehlertolerante Umgebung hin angepasst werden.

Während sich Stratus und Marathon um den Markt für fehlertolerante Windows-Server streiten, geben sich die renommierten Server-Hersteller sehr zurückhaltend. Dies mag unter anderem an dem kleinen Markt liegen. So laufen heute weltweit zirka 1400 Marathon-Konfigurationen, mit 150 Systemen mehr als zehn Prozent davon in Deutschland. Stratus hat bis heute etwa 4000 fehlertolerante Rechner weltweit verkauft. Dabei handelt es sich um VOS- und HP-UX-basierte Systeme. Die Windows-Rechner sollen erst noch kommen.

Laut Herbert Wenk, Pressesprecher bei Compaq, sind ausfallsichere Windows-Systeme für die Texaner noch kein Thema. Zwar hat sich Compaq zusammen mit Intel und der Deutschen Bank mit 115 Millionen Dollar an Stratus beteiligt (siehe CW 3/01, Seite 1), doch scheint es vorerst noch keine konkreten Pläne zu geben, die Technik in Compaq-Produkten einzusetzen.

Lindner von Stratus setzt dagegen große Hoffnungen in die hochkarätigen Investoren. So könne der Markt für ausfallsichere Windows-Rechner nur vorankommen, wenn sich auch die Großen der Branche dieses Thema auf die Fahnen schrieben. Der Geschäftsführer rechnet damit, dass innerhalb der nächsten 18 bis 24 Monate ein Compaq-Server mit Stratus-Technik auf den Markt kommen wird. Mit der Investition hätten sich die Texaner das Recht gesichert, eine Lizenz von Stratus zu kaufen.

Nach Ansicht von HP-Manager Korn sind Hochverfügbarkeit und Ausfallsicherheit ein interessantes Geschäftsfeld, da sich viele Services rund um das Thema bündeln lassen. "Allerdings ist Hochverfügbarkeit ein dehnbarer Begriff", relativiert der Manager. "Der Kunde entscheidet mit seiner Applikation über die richtige Lösung." Die Wintel-Welt werde es am Anfang schwer haben, sich in diesem Geschäftsfeld durchzusetzen. Eine viel versprechende Zielgruppe seien junge Startups. Diese hätten laut Korn hohe Anforderungen an die Verfügbarkeit der IT, aber in aller Regel nicht das Geld für ausfallsichere Systeme à la Tandem. Es gelte jedoch, die richtige Balance zwischen Performance, Verfügbarkeit und Budget zu finden.

Software spielt wichtige Rolle bei AusfallsicherheitFür Henrik Klagges, unabhängiger Berater aus München, sind die Windows-Produkte von Stratus und Marathon günstige Lösungen, wenn man softwareseitig nichts ändern möchte. Allerdings könne man Ausfallsicherheit nicht allein mit Hardware garantieren. Auch die Software müsse mitspielen. Marathon und Stratus machten eine Applikation über die Hardware pseudoausfallsicher, ohne am Binärcode etwas zu ändern. Doch wenn die Software nicht mitmacht, ist die ganze Ausfallsicherheit dahin.

Einen Ausfall seiner unter NT laufenden Marathon-Systeme hat Jean Philippe Rickenbach, CIO der "Neuen Züricher Zeitung" während der beiden letzten Jahre noch nicht erlebt. Nachdem der DV-Manager zu Beginn des Internet-Zeitalters in seiner Zeitung dem Thema Ausfallsicherheit wenig Aufmerksamkeit geschenkt hat, belehrten ihn stundenlange Ausfälle des E-Mail-Systems schon in den ersten Wochen eines Besseren. Für Marathon sprachen laut Rickenbach die schnelle Implementierung sowie die einfache Verwaltung des Systems.

"Das Vertrauen der Kunden ist in diesem Bereich der Schlüssel zu dem gesamten Geschäft", resümiert HP-Manager Korn. Vielleicht liegen hier noch die Hauptprobleme der Anbieter. Denn auf Anfrage antwortete die Marathon-Europazentrale lediglich: "Unsere Produkte sind die besten, da gibt es keine Diskussion." Weitere Argumente hielten die Produkt-Manager offenbar für nicht notwendig. Ob sich die Anwender so überzeugen lassen, darf man getrost in Frage stellen.

Vergleich zum ClusterDie Produkte von Marathon und Stratus sind aktiv redundante Systeme. Das bedeutet, die Ersatzrechner arbeiten parallel die gleichen Aufgaben ab wie das Primärsystem. Fällt dieses aus, übernimmt das Alternativsystem alle Aufgaben. Dieses Verfahren bezeichnet man auch als "Compute through" oder "Constant Computing".

Dagegen bilden Cluster passiv redundante Systeme. In diesem Modell stehen die Ersatzsysteme nicht direkt mit der aktuellen Informationsverarbeitung in Verbindung. Sie müssen nach Ausfall des Primärrechners erst aktiviert werden, um dessen Aufgaben übernehmen zu können. Das kann zwar automatisch passieren, dennoch ist damit immer eine gewisse Unterbrechung verbunden. Einen Vorteil haben Cluster jedoch: Sie lassen sich unter dem Gesichtspunkt Leistung höher skalieren. Dafür benötigen sie jedoch speziell an die Cluster-Architektur angepasste Software.

Eine Frage der CPUUm Anwendungen taktzyklussynchron ablaufen zu lassen, muss der Prozessor mitspielen. Bei der Herstellung müssen deterministische Auswahlverfahren zum Einsatz kommen. Das heißt, das Ergebnis jeder Berechnung im Chip muss eindeutig vorhersagbar sein. Nur so lassen sich die Resultate vergleichen und Fehler feststellen. Hewlett-Packards PA-Risc-CPUs erfüllen diesen Anspruch.

Intel setzt dagegen stochastische Verfahren ein. Sobald die Ergebnisse innerhalb eines bestimmten Rahmens liegen, ist der Chip in Ordnung. Das reicht jedoch nicht für Vergleiche im Sinne der Ausfallsicherheit, da hier sehr oft unterschiedliche Ergebnisse herauskommen würden. Dieses Problem muss wie zum Beispiel bei Marathon mit speziellen Schnittstellen-Karten und auf Softwarebasis gelöst werden. Michael Lindner von Stratus hofft jedoch, dass der kalifornische Chipriese mit der Investition in sein Unternehmen deterministische Technologien übernehmen wird. Damit ließen sich mit Standardchips von Intel kostengünstige ausfallsicherere Rechner bauen. Lindner geht davon aus, in den nächsten Jahren Produkte unter 10 000 Dollar anbieten zu können.

Abb.1: Marathon-Architektur

Kernstück der Marathon-Lösung sind die Marathon Interface-Cards (MICs). Sie verbinden die vier Server-Elemente. Quelle: Sysdat

Abb.2: Stratus-Architektur

Die Stratus-Lösung lässt sich mit Dual-Module-Redundancy (DMR) einfach, und mit Triple-Module-Redundancy (TMR) doppelt absichern. Quelle: Stratus