Motivation für Dokumentenmanagementsysteme
Die Verwaltung großer Bestände von elektronischen Dokumenten stellt zunehmend eine Herausforderung für immer mehr Unternehmen dar. Dabei geht es inzwischen weniger um die Anschaffung von ausreichend Speicherplatz, denn Festplattenspeicher wird immer preisgünstiger, sondern mehr um die Bereitstellung geeigneter Werkzeuge zum gezielten Auffinden der benötigten Dokumente. Die Dateiattribute eines klassischen Dateiservers wie Dateiname, Datum oder Größe reichen bei großen Datenbeständen nicht mehr für eine effiziente Suche aus. Weitere Metadaten wie z.B. Autor, Dokumentenart oder Erstellungsdatum erleichtern die Suche nach einem bestimmten Dokument sehr. Besonders die Möglichkeit der Suche nach Inhalten der Dokumente erleichtert das Auffinden enorm.
Volltextsuche
Moderne Dokumentenmanagementsysteme (DMS) bieten die Möglichkeit der Volltextindizierung des gesamten in ihnen enthaltenen Textes. Ein leistungsfähiges Suchmodul über die kompletten Textinhalte der Dokumente hinweg eröffnet Möglichkeiten der Detailsuche, die mit klassichen Dateiablage schlicht nicht möglich sind.
Texterkennung (OCR)
Voraussetzung für die Volltextsuche innerhalb der
archivierten Dokumente ist die Umwandlung der gedruckten Texte zu
maschienenlesbaren Textzeichen, also digitalen Texten. Die Texterkennung
selbst stellt noch immer eine besondere Herausforderung für die
Verarbeitungssysteme dar. Die Verschiedenartigkeit von Schriftart,
Zeichengröße und Satz erschweren die Erfassung von ganzen Worten. Die
Unzulänglichkeiten der optischen Erfassung der Dokumente (Unschärfen,
Drehungen, Verzerrungen) müssen mit hohem Rechenaufwand ausgeglichen
werden.
Idealerweise bringt ein gutes Dokumentenmanagementsystem ein
leistungsfähiges Texterkennungsmodul gleich mit. In bestimmten
Situation kann es aber auch sinnvoll sein ein vorgelagertes
Texterkennungsmodul zu benutzen und dann die bereits texterkannten
Dokumente dem Volltextindes des DMS zuzuführen. Dies kann z.B. sinnvoll
sein, wenn Texterkennung und Archivierung im DMS ortsverschieden
stattfinden, z.B. wenn ein Unternehmen mit zentralem Datenbestand
Dokumente aus vielen Filialen zugeliefert bekommt.