Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

14.11.2005

Wege zur Informationslogistik

Martina Tomaschowski 
Je nach Anwendung und Problem empfehlen sich verschiedene Suchverfahren, die ihrerseits unterschiedlichen Aufwand erfordern.
Die verwendete Suchtechnik sollte sich am Anwendungsfall und der geforderten Ergebnisqualität orientieren.
Die verwendete Suchtechnik sollte sich am Anwendungsfall und der geforderten Ergebnisqualität orientieren.

Viele Unternehmen sehen im intelligenten Verwalten und Nutzbarmachen von Informationen den Schlüssel zum langfristigen Erfolg. Der Einsatz der Informationslogistik ermöglicht Produktivitätsgewinne durch Automatisierung und die Übertragung des Just-in-Time-Prinzips aus der Warenlogistik auf die Informations- und Kommunikationsversorgung. Denn nicht jede Kundenanfrage muss einzigartig beantwortet und nicht jedes Angebot neu erstellt werden.

Fazit

Die beste Suchtechnik für alle Fälle gibt es nicht. Es sind immer die konkreten Rand- und Rahmenbedingungen des jeweiligen Unternehmens, die bestimmen, mit welchem Ansatz das Problem gelöst werden sollte. Oft ist eine Kombination verschiedener Suchverfahren sinnvoll.

Mehr zum Thema

www.computerwoche.de/go/

524097: Wissen ist ein Management-Problem;

526407: Nur geteiltes Wissen ist Macht.

Die zentrale Rolle spielt der gezielte Zugriff auf Informationen ("Information Access"), der die richtigen Daten im korrekten Kontext zum passenden Zeitpunkt am gewünschten Ort verfügbar macht. Die Einsatzmöglichkeiten reichen vom Auffinden der Informationen in heterogenen Beständen über die Lösung von Selbsthilfe- und Assistenzanfragen im Web, das automatisierte Klassifizieren, Weiterleiten und Ordnen von eingehenden Briefen oder E-Mails, das automatisierte Erstellen, Überwachen, Verlinken und Anreichern von Texten bis zur Extraktion von Daten, Fakten, Wissen und Beziehungen.

Je nach Beschaffenheit der zu durchsuchenden Informationen und den Anforderungen an die Ergebnisqualität stehen verschiedene Suchverfahren zur Auswahl. Dabei hat jeder Ansatz seine Stärken und Schwächen. Allgemein kann man festhalten, dass von der Volltextsuche über assoziative und strukturierte Suche hin zu Entscheidungsbäumen die Ergebnisqualität stetig zunimmt, dafür aber auch der Modellierungsaufwand (Pflege sowie Wartung) und die Themenzentrierung steigen.

Klassiker Volltextsuche

Die Recherche in großen Datenmengen, zum Beispiel in Texten mit Giga- oder Terabyte-Format, ist das typische Anwendungsfeld für die klassische Volltextsuche. Gelegenheitsnutzer sind mit deren Ergebnissen aber meist unzufrieden, da prinzipbedingt nur die Dokumente gefunden werden, die exakt die Wörter/Teilwörter der Suchanfrage enthalten. Gegebenfalls werden noch grammatikalische Grundformen und Komposita berücksichtigt, verwendete Synonyme und verwandte Begriffe jedoch nicht. Die Folge ist eine zu große oder eine zu kleine Treffermenge. Suchexperten hingegen kennen ihre Daten und können gezielte Anfragen formulieren. Hinsichtlich hoher Suchperformanz und Skalierbarkeit bei extrem großen Datenmengen sowie geringem Implementierungsaufwand ist Volltextsuche allerdings unschlagbar.

Die assoziative Suche eignet sich besonders zur natürlichsprachlichen Suche in großen Mengen unstrukturierter Inhalte. Sie erfordert keinerlei Vorwissen über den Inhalt, bietet eine intuitive Interaktion mit dem Benutzer und die schnelle Ermittlung von relevanten Ergebnissen. Dokumente aus den verschiedensten Themen, Abteilungen und Standorten eines Unternehmens können zum Beispiel automatisch zusammengeführt und über einen einzigen Punkt, den Single Point of Access, in einem Intranet recherchiert werden. Begriffe werden durch die Analyse der Dokumente und über mathematische Auswertungsverfahren miteinander in Beziehung gesetzt, nach bestimmten Kriterien klassifiziert, kategorisiert und strukturiert. Im Unterschied zur strukturierten Suche werden keine Wissensmodelle benötigt, und der Modellierungsaufwand bleibt gering.

Während Volltextsuche nur den Text berücksichtigt und die assoziative Suche mathematisch ermittelte Beziehungen zwischen Begriffen heranzieht, schöpft die strukturierte Suche ihre Qualitäten aus einem expliziten und intellektuell erstellten Wissensmodell - Ontologie - und fallbasierendem Schließen (Case-Based-Reasoning). Sie kann Erfahrungen bei der Lösung von Problemen wiederverwenden. Natürlichsprachliche oder dialoggesteuerte Anfragen auf große Mengen unstrukturierter, aber auch strukturierter Inhalte aus festgelegten Themengebieten werden intelligent beantwortet. So eignet sich diese Basistechnik zum Beispiel für die Produktsuche im Online-Shop, bei der es besonders wichtig ist, unterschiedliche Varianten anzubieten und dem Käufer Alternativen aufzuzeigen.

Die geführte Suche mit Entscheidungsbäumen ist eng an die strukturierte Suche angelehnt und wird insbesondere zur Problemdiagnose im Call-Center, Self-Service, in Werkstätten oder im Field-Service eingesetzt. Während Nachfragedialoge der strukturierten Suche lediglich die Fragen vorgeben, bestimmt die geführte Suche mit ihren Entscheidungsbäumen deren Abarbeitungsreihenfolge.

Kein Verfahren für alle Probleme

Supportmitarbeiter haben es mit typischen, immer wiederkehrenden Fragen zu tun, die am besten anhand von Entscheidungsbäumen abgearbeitet werden. Dabei kann für den Einstieg in die Suche und die Auswahl der betreffenden Entscheidungsbäume eine Volltextsuche nützlich sein. Im Kontext von Patentrecherchen kommt es stark auf Präzision und auf mächtige Operatoren an. Hier ist die klassische Volltextsuche für die Auswertung des vorliegenden Korpus sinnvoll, wobei strukturierte Ansätze auf Basis einer bestehenden Patentklassifikation unterstützend eingesetzt werden können.

In Organisationen und Unternehmen, die eine Flut an eingehenden Informationen zu bearbeiten haben, hilft beim Aussortieren irrelevanter Informationen die Rohdatenverdichtung. Zum Einsatz kommt eine Kombination von Klassifikation, Konzept- und Feature-Extraktion. Die automatische Klassifikation trennt irrelevante Datensätze und klassifiziert die verbleibenden relevanten nach den Aufgabengebieten der Sachbearbeiter. Anschließend wird jeder Datensatz einer Informationsextraktion unterzogen, um den so genannten semantischen Fingerabdruck zu erzeugen. Dabei werden sowohl die in der Ontologie hinterlegten Konzepte als auch Textmuster erkannt, markiert und per Referenz mit der Ontologie verknüpft. Zusätzlich werden relevante Schlüsselwörter, die dort bisher nicht enthalten sind, aber innerhalb des Datensatzes wichtig erscheinen, erkannt und markiert. Müssen zudem die eingegangenen Informationen in einen Gesamtkontext gestellt, also Daten, Informationen und Wissen miteinander verknüpft werden, ist der nächste Bearbeitungsschritt die Ähnlichkeitsanalyse. Sachbearbeiter erhalten so gezielt ihre Informationen, die eine schnellere Bearbeitung zulassen. (ws) u