Das Projekt

Im Rahmen des DFG-Programmes „Retrospektive Digitalisierung von Bibliotheksbeständen“ wurde das Projekt „Mittelhochdeutsche Wörterbücher auf CD-ROM und im Internet“ vom 1. September 1997 bis zum 31. August 2000 an der Universität Trier gefördert und von der Akademiekommission für deutsche Philologie wissenschaftlich betreut. Ziel dieses Projektes war es, die drei wichtigsten, eng aufeinander bezogenen lexikographischen Hilfsmittel für das Studium älterer deutscher Texte, nämlich das Mittelhochdeutsche Wörterbuch von Benecke/Müller/Zarncke (BMZ), das Mittelhochdeutsche Handwörterbuch von Lexer (Lexer) und das Findebuch zum mittelhochdeutschen Wortschatz (Findebuch) zu digitalisieren und in einen Verbund zu bringen, für vielfältige Suchmöglichkeiten zu präparieren und durch geeignete Schnittstellen zugänglich zu machen. Das Ergebnis wurde in enger Zusammenarbeit mit dem Verlag S. Hirzel (Stuttgart) in einer Version auf CD-ROM und in einer weiteren im Internet publiziert.

Die maschinenlesbaren Wörterbücher sind in der internationalen Standardbeschreibungssprache SGML (Standard Generalized Markup Language) kodiert. Als DTD (Document Type Definition) wurden die von der TEI vorgeschlagenen Richtlinien zur Codierung von Wörterbüchern eingesetzt. Die SGML/TEI-konforme Version dient als Basis für die verschiedenen Publikationsformen. Für die Bereitstellung im Internet wurden die SGML-Dokumente nach HTML (Hyper Text Markup Language) konvertiert, sodass sie mit üblichen Browsern angezeigt werden können. Es erfolgte einerseits eine typographische Aufbereitung, indem die SMGL-Markierungen in entsprechende Style-Angaben und HTML-Anweisungen umgesetzt wurden. Andererseits wurden die Verweisstrukturen innerhalb des Wörterbuchverbundes in Hyperlinks abgebildet, sodass ein Internet-Browser die Navigation durch den Verbund bewerkstelligen kann. In ähnlicher Weise wurden die Daten für die CD-ROM Version aus den SGML-Dokumenten erzeugt. Für beide Plattformen wurde eine Suchmaschine aufgebaut, die ebenfalls aus den SGML-Daten gespeist wird. Diese Suchmaschine wird sowohl über den Internet-Browser als auch über die grafische Oberfläche der CD-ROM angesprochen und erlaubt dem Benutzer einen gezielten Zugriff auf den kompletten Wörterbuchinhalt. Die Suchmöglichkeiten umfassen neben einer herkömmlichen Volltextrecherche auch detaillierte Abfragen einzelner Wortartikelkategorien (nur auf der CD-ROM), wie z.B. Suche nach grammatischen Angaben, nach Belegzitaten, einzelnen Siglen sowie nach Textsorten zusammengefaßten Siglengruppen.

Im Vordergrund der Projektarbeiten stand die Entwicklung der grafischen Oberfläche für die CD-ROM-Version und der Aufbau einer geeigneten Suchmaschine. Die CD-ROM Software ist dabei plattformunabhängig konzipiert, sodass sowohl eine Windows95/98/NT-Version als auch eine Variante für LiNUX-Betriebssysteme zur Verfügung steht.