Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

15.09.2000 - 

Content-Management/Neue Produkte setzen auf die Trumpfkarte XML

Die Extensible Markup Language hält Einzug in Content-Management-Systeme

Mit XML kann die Aufbereitung, Verifikation und Formatierung von Inhalten automatisiert werden. Darauf basierende Content-Management-Systeme reduzieren die Arbeit für die Erstellung der Inhalte. Eva-Katharina Kunst* stellt die Metasprache vor.

Die Anbieter von Content-Management-Systemen, die etwas auf sich halten, haben es zunehmend im Programm: die "Extensible Markup Language" (XML). XML wird nicht nur unterstützt, sondern gar als Basistechnologie beworben. Marketing-Strategen nutzen den Hype und versprechen die "vereinfachte Wiederverwendung beziehungsweise Weiternutzung von Inhalten", wie es in einem White Paper von Microsoft heißt. Ein ganzes Bündel vorteilhafter Eigenschaften wird hervorgehoben: XMLs Flexibilität und Skalierbarkeit, erweiterte Suchmöglichkeiten, die strukturelle Verifikation der Inhalte und die Möglichkeit, Inhalte automatisch in unterschiedliche Ausgabeformate zu formatieren.

Gewichtige Gründe also. Gerade beim Web-Publishing, bei dem Inhalte nicht nur dynamisch zusammengestellt, sondern auch von unterschiedlichen Autoren bereitgestellt werden, finden derartige Argumente Gehör.

Aus technologischer Sicht kann XML tatsächlich viel von dem halten, was die Werbefachleute versprechen. XML ist nämlich nicht nur ein populäres Datenformat, sondern eine Metasprache zur Definition von Dokumenttypen. Die Grundidee der Markup Language ist ebenso einfach wie genial: Jedes Dokument wird in Inhalt, Struktur und Layout zerlegt. Der Inhalt kann in beliebig viele physikalische Einheiten unterteilt und semantisch aufbereitet werden. Dabei gelten nicht nur die Absatzformate - wie es bei Word der Fall ist - als semantische Elemente. Vielmehr werden nach Belieben einzelne Textpassagen oder Worte semantisch klassifiziert, sei es beispielsweise als "Name des Autors", "Link" oder "Copyright". Diese Einteilung ermöglicht später eine gezielte Suche in der wachsenden Flut der Inhalte. Eine zentrale Rolle fällt der so genannten "Document Type Definition" (DTD) zu: Sie ist eine formale Grammatik, die einen spezifischen Dokumenttyp definiert. Dazu beschreibt die DTD die Regeln und Kriterien, nach denen die semantischen Elemente ausgewertet und in einer strukturierten Abfolge eingegeben werden sollen. Jedes Dokument stellt die Instanz einer bestimmten DTD dar.

Die Visualisierung des Dokumentes wird über Stylesheets gesteuert, welche die Formatierungsrichtlinien enthalten. Für jedes gewünschte Ausgabeformat, zum Beispiel HTML, RTF oder Postscript, gibt es ein eigenes Stylesheet, mit dem sich die Ausgabe penibel an die eigenen Wünsche anpassen lässt.

Mitarbeiter, die XML einsetzen, können sich auf ihre Kernkompetenzen konzentrieren: Der Autor kümmert sich nur noch um die Inhalte, der Producer befasst sich mit der Technologie und der Zusammenstellung des Contents, und der Designer erstellt die Stylesheets für das Layout. Dieses Vorgehen überführt Corporate Identity aus der Wunschvorstellung in die Wirklichkeit. Die im Vergleich zu HTML weitaus größeren Möglichkeiten von XML haben die Hersteller von Content-Management-Systemen aufhorchen lassen. Auch die Fähigkeit von XML, heterogene Netz-Strukturen zu überwinden und ein weit gefächertes Anwendungsspektrum zu erschließen, prädestiniert es für den Einsatz im Content Management.

Ein Blick auf die Palette XML-basierender Content-Management-Systeme offenbart ihre wesentliche Komponente: In einer Datenbank werden so verschiedene Inhalte wie Texte, Bilder, Video und Sound als XML-Objekte gespeichert und verwaltet. Doch das reicht nicht aus: Darüber hinaus werden Editoren für Inhalte, DTDs und Stylesheets benötigt.

Semantische Akzente bleiben auf der StreckeManche Anbieter offerieren Module, die andere Formate - wie MS Word oder Adobes FrameMaker - benutzen, um die Inhalte in gewohnter Manier zu erstellen und dann als XML in die Datenbank einzustellen. Doch sollte man sich nicht täuschen lassen: Nur die Elemente des ursprünglichen Quellformats, die eindeutig zuordenbare Informationen enthalten, können extrahiert und in XML konvertiert werden. Auch dem vollmundigen Versprechen mancher Anbieter, XML als Datenablageformat anzubieten, ist mit Vorsicht zu begegnen: Zumeist bleibt dem Anwender keine andere Wahl, als eine einzige, vorgeschriebene DTD zu verwenden. Die semantische Akzentuierung bleibt hierbei auf der Strecke.

Das Angebot vorgefertigter DTDs ist reichhaltig. Einen eigenen Entwurf vorzunehmen, ist zwar eher Spezialistenarbeit, doch gibt es erste Hersteller, die ein Modellierungs-Tool für DTDs offerieren. Im Paket enthalten sind überdies XML-Editoren, Stylesheet-Tools und Funktionalität, um XML-Dokumente zu indizieren und zu durchsuchen. Ausgabeformate wie beispielsweise HTML, Postscript, PDF oder Interleaf werden unterstützt. Ein enthaltenes Web-Interface erleichtert es darüber hinaus, die Daten direkt ins Internet zu stellen.

Gerne ungesagt bleibt, dass XML von den heutigen Browsern nur unzureichend bis gar nicht unterstützt wird. Bei Web-Inhalten muss der Server dann selbst die Ausgabekonvertierung der XML-Inhalte in HTML vornehmen, wenn ein XML-Dokument vom Browser angefordert wird.

Doch auch wer die gesamte Technik beherrscht, kann sich eines wartungsfreundlichen Content-Management-Systems nicht sicher sein. Die Qualität des gesamten Systems hängt entscheidend von der Wahl geeigneter DTDs ab, die dem Framework Leben einhauchen und die Arbeit des Anwenders auf die Erstellung der Inhalte beschränken. Nur wer sich Zeit nimmt, seine Inhalte und Abläufe zu analysieren, kann die hohen Kosten in der Anfangsphase später im kompensieren.*Eva-Katharina Kunst ist freie Fachautorin in Kempen.

ANGEKLICKTStärken und Schwächen der Extensible Markup Language (XML)

Stärken:

-Flexibel, offen, universell einsetzbar

-Plattform-, Hersteller- und Medien-unabhängiges Datenformat

-Suchmöglichkeit in tief strukturierten Inhalten

-Zentrale Steuerungs- und Änderungsmöglichkeiten; einfaches Erstellen und Managen von Web-Inhalten

-Verschiedene Ausgabeformate, wie zum Beispiel HTML, PDF

Mögliche Schwächen:

-Mangelnde Web-Browser-Unterstützung

-Fehlen übergreifender und akzeptierter Standards für DTDs

-Einheitliche Sprache für Stylesheets noch nicht etabliert.