Texte
  Wissenschaft
  Bildung
  Medien
  Geld
Termine
Dramolette
Skurriles
Links
Leben
Kontakt

Die Zeit 36/2002

Simsen für den Stamokap

Wie kommt ein Wort ins Wörterbuch? Die Computerlinguistik unterstützt die Lexikografen

Von Annette Leßmöllmann

Ein undankbares Geschäft, ein Wörterbuch zu verfassen. Ständig dieses nörgelnde Kritikervolk, das alles besser weiß, "Aber, aber!" schreit und stets Lücken findet. Lästig. Aber Kritik muss sein. Ein Wörterbuch wird nun einmal an dem gemessen, was fehlt. Im Idealfall steht es geduldig auf dem Schreibtisch, bis der Benutzer nach "Graecum" sucht oder nach "Mukoviszidose" oder "Computerlinguistik". Und dann spricht das Wörterbuch: Sieh her, ich weiß es! So soll es sein, der Benutzer muss sich jedes Mal freuen, dass er 14,95 Euro investiert hat.

Der neue Wahrig, die Wörterbuch-Traditionsmarke, kennt das Wort "Computerlinguistik" nicht. Das wäre eigentlich zu verschmerzen, insofern aber dann doch peinlich, als das Haus Bertelsmann, das den Wahrig herausgibt, in seiner Pressemappe just stolz darauf hinweist, dass das Werk mit Methoden der Computerlinguistik erstellt worden sei. Wer da nun denkt: Das Wort sagt mir erst einmal nichts, aber ich kann ja nachsehen, wenn ich das Buch gekauft habe, hat Pech.

Doch darf man vom neuen Wahrig wirklich das Wort "Computerlinguistik" verlangen? Schließlich ist er nur ein Rechtschreibwörterbuch und hat eine begrenzte Anzahl Einträge, damit er sein handliches Format behält. Wer es ausführlicher will, solle sich eben das Wörterbuch der deutschen Sprache zulegen, sagt Beate Varnhorn, die Leiterin der Wahrig-Redaktion in Gütersloh, und sie hat Recht.

Doch was hat es dann mit der Computerlinguistik auf sich? Das Haus Bertelsmann ist ganz neue Wege gegangen, denn es hat ein digitalisiertes Korpus zurate gezogen. Korpus? Nun, das Wort kennt der neue Wahrig: ein Sammelwerk. In diesem Fall ein Sammelwerk von Texten aus Zeitungsartikeln hochwertiger Printprodukte - zu denen die Süddeutsche, der Standard und andere zählen (allerdings nicht die ZEIT). Das Korpus umfasst Artikel vom Jahr 2001 an und hat 500 Millionen Wörter. Aus diesen filtert ein Computerprogramm neue Wörter heraus, die dem Lexikografen dann als mögliche Kandidaten für das Wörterbuch vorgelegt werden. Das Programm liefert ihm, als Entscheidungshilfe, auch Angaben, wie oft das Wort im Korpus auftauchte, wann es zum ersten Mal erschien und ob es eventuell schon wieder verschwunden ist.

"Leitkultur" zum Beispiel hat es nicht in den Wahrig geschafft. "Das Wort war eine Eintagsfliege", sagt Varnhorn dezidiert. Anders als "schwächeln", das hat sich durchgesetzt, von den Sportseiten bis auf die Titelseite, so viel Ausdauer muss honoriert werden: Im Wahrig steht's. Und noch viel mehr steht dort: Nicht nur "SMS", sondern auch das "Simsen" für das Schicken derselben. Außerdem "allergieauslösend" und "Mukoviszidose", "Nasdaq" und "Nemax", "Stammzelle" und "Verlinkung". Die Suche nach neuen Wörtern per Korpus ersetzt die traditionelle Arbeit des Lexikografen aber nicht.

Die besteht immer noch darin, dass sich Scharen von Freunden des geschriebenen Wortes im Auftrag der Lexikonredaktion auf Texte stürzen und per Hand die Wörter herauspicken, die ihnen erwähnenswert erscheinen. "Dadurch wird natürlich alles subjektiv gefiltert; jeder entscheidet nach eigenen Kriterien, was er wichtig findet", sagt Beate Varnhorn. Nach dieser Materialsuche kommt dann der Lexikograf und wählt nach "eigenen Kriterien" aus, was letztendlich ins Wörterbuch kommt.

Wer früher "Cheerio" sagte, soll heute "Cheers" rufen

Über diese "eigenen Kriterien" wird nicht gerne gesprochen. Der Grund: Der Lexikograf hat keine wirklich harten Kriterien für seine Arbeit. Welches Wort ist veraltet und sollte besser aus dem Bestand genommen werden? Welches Wort ist eine Eintagsfliege - will der eine oder andere Nutzer vielleicht doch wissen, wie "Leitkultur" geschrieben wird, auch wenn Friedrich Merz das Wort nicht mehr im Munde führt? Ist "simsen" vielleicht nur Jugendsprache und deswegen eigentlich kein Kandidat für ein allgemeines Wörterbuch?

Böse Fragen, die einem den Schlaf rauben können. Da ist so ein Korpus schon nett, denn wenn 25 Feuilletonredakteure vom "Simsen" schrieben, dann kann der Lexikograf das Wort getrost in sein Werk aufnehmen. Und der Computer bürgt für Objektivität, denn er wählt nach definierten Kriterien aus, nicht nach subjektiver Laune wie die Freunde des geschriebenen Wortes.

Irgendwann, sagt Beate Varnhorn, solle der Computer die lexikografische Auswahl ganz allein machen. Das Gute daran sei auch, dass in den Zeitungsartikeln oft nicht nur die neuen Wörter, sondern auch gleich eine Erklärung dieser Wörter steht. Wenn der Feuilletonredakteur also nicht nur vom "Cheerleader" schreibt, sondern das Wort auch gleich erläutert, ist das praktisch. Der neue Wahrig definiert "Cheerleader" als "Mitglied einer Tanzgruppe, das bei sportlichen Großveranstaltungen die Stimmung anheizt".

"Anheizt" steht da. Das könnte direkt aus der Tastatur eines Feuilletonredakteurs stammen. Unter "Anheizen" notiert der Wahrig, dass es sich um ein umgangssprachliches Wort handelt. Der Wahrig benutzt also - von ihm selbst so charakterisierte - umgangssprachliche Wörter, um seine eigenen Einträge zu beschreiben? Weia, da werden die Kulturpessimisten und Apologeten des Sprachverfalls (die bestimmt auch das Wort "weia" hier nicht lesen wollen) wieder den Verfall der Sitten konstatieren: Kaum ist der Computer im Spiel, tanzen die Mäuse auf dem Tisch.

Aber weiter im Text. "Cheerio" hat der Duden von 2000 als Prost- und Adieu-Ruf notiert. Der Wahrig 2002 dagegen führt nur "Cheers" auf. Auch das ist interessant: Kaum haben wir uns an "Cheerio" gewöhnt, das in Filmen wie dem Englischen Patienten für eine koloniale Upperclass-Stimmung sorgte - schon müssen wir mit "Cheers" vorlieb nehmen, das man sich heute in jeder Vorstadtdisco zubrüllt, wenn die Plastikbecher aneinander dotzen. Der Wahrig hat hier eine klare Mehrheitsentscheidung getroffen, demokratisch, "wir schreiben den Leuten nichts vor", sagt Beate Varnhorn. Das ist gut. Aber wieso ist "Cheerio" gestorben? "Displaced Persons" ist doch auch noch drin, aus guten, historischen Gründen.

Das ist zugegebenermaßen verwirrend, ebenso wie die Existenz von Wörtern wie "Backlist", "rechtschreibschwierig", "Infokasten" oder "praxisorientiert", die alle in der Pressemitteilung der Bertelsmänner auftauchen, von denen aber keines im vom eigenen Haus herausgegebenen Wörterbuch erscheint. Es ist zum Verzweifeln.

Doch auch historisch wichtige Begriffe sucht man vergeblich. Wo ist der "G-Punkt"? Was ist mit "Stamokap", dem staatsmonopolistischen Kapitalismus, der doch immer mal vorkommt in Gesprächen mit linksradikal-nostalgischem Hintergrund (damals, weißt du noch ...?) - will denn keiner mehr wissen, wie man das schreibt? Der Duden von 2000, der hat beide Einträge noch und dazu den "Infokasten", ein scheußliches Wort, aber ein praktisches Gestaltungselement. Auch im Wahrig findet man solche Infokästen, darin werden kurz und knapp gemeine Rechtschreib-Stolpersteine behandelt. Und wer hat's erfunden? "Bertelsmann", sagt Beate Varnhorn mit Stolz. Aber dann sollte doch auch das Wort "Infokasten" in diesem Wörterbuch aufgeführt sein!

Wer nicht nur darauf, sondern auch auf Wörtern wie "Stamokap" und "G-Punkt" besteht, dem sei Folgendes empfohlen: Kaufen Sie am besten sowohl den Wahrig als auch den Duden und dann noch Meyers Lexikon von 1970, dann sind Sie auf der sicheren Seite. Unsere Kultur besteht eben nicht nur aus dem, was 2001 gesagt wurde. Und bei aller unterstützenswerten Suche nach Neologismen (pardon, Neubildungen): Auch der Benutzer ohne Graecum möchte wissen, wie er "Graecum" schreibt. Gerade der.

Wahrig Die deutsche Rechtschreibung

Bertelsmann Lexikon Verlag, Gütersloh 2002; 1200 S., 14,95 €

 

(c) Annette Leßmöllmann