Bioinformatiker und die Sprache

BLOG: Bierologie

Weissbier & Wissenschaft
Bierologie

researchblogging Bastian sagt Bastian sagt:
Jeder der die englische Sprache erlernt hat dürfte sich über die blöden unregelmässigen Verben geärgert haben die es einfach auswendig zu lernen galt. Bei regelmässigen Verben werden Simple Past und Past Participle einfach durch anhängen von -ed gebildet, wie die Reihe talk/talked/talked während die unregelmässigen Verben scheinbar keinen Regeln folgen (go/went).

Das dürfte zwar nicht die Motivation der Bioinformatiker gewesen sein die sich mit dem Aussterben dieser unregelmässigen Formen beschäftigt haben, aber vielleicht erfüllt es ja den einen oder anderen mit Genugtuung dass sie immer weniger werden, denn auch Sprache ist ja lebendig und folgt einer Art Evolution.

Übrigens gibt es noch einen kleinen Trost für alle die ungern auswendig lernen: Nur 3% aller englischen Verben sind unregelmässig. Der Haken bei der Sache: Die Top 10 der meistbenutzten Verben sind ausschliesslich unregelmässig.

Deshalb untersuchte das Team von Bioinformatikern einen Satz von 177 Verben zu verschiedenen Zeitpunkten. Sie schauten sich diese im Alt-Englischen – so um 800 n. Christus -, im Mittel-Englisch was so um die 1200 war (als Beispiel werden im Paper die Canterbury Tales angeführt) und als letzten Punkt die Gegenwart an.

Im Alt-Englischen waren all diese Verben noch unregelmässig, während im Mittel-Englischen schon nur noch 145 der betrachteten Verben ihre unregelmässige Form hatten. Und heute sind es nur noch 98.

Eine Theorie für das Aussterben der unregelmässigen Formen hängt mit der Häufigkeit der Verwendung der Worte ab. Je seltener die Verben benutzt werden desto schneller geraten die unregelmässigen Formen in Vergessenheit und werden durch Regelmässige ersetzt.
Und um dies zu überprüfen schauten sie sich die gut 18 Millionen Worte umfassende CELEX-Datenbank an und erhielten so die Nutzungsfrequenzen der Wörter die sie mit dem Aussterben der unregelmässigen Verben in Relation setzten und erhielten einen erstaunlich einfachen Zusammenhang:

Die Halbwertszeit von unregelmässigen Verben ist proportional zur Quadratwurzel der Nutzungsfrequenz. Oder um es in einem kleinen Beispiel einfacher auszudrücken: Ein Verb was 100mal weniger benutzt wird als ein Vergleichs-Verb wird 10mal so schnell zum regelmässigen Verb.

Und damit haben die Forscher dann auch Vermutungen angestellt über die Zukunft: Sollte der Trend zum Verfall so weiterlaufen wie bisher werden im Jahre 2500 nur noch 83 der 177 betrachteten Verben unregelmässig sein. Darüber hinaus haben sie auch eine Vorhersage gemacht welches der Verben als nächstes regelmässig werden wird: Vermutlich wird es wed/wed/wed sein, was mit nur 4,2 mal pro Million Verben benutzt wird. Es wird dann zu wed/wedded/wedded regelmässig gemacht.

Also liebe Englisch-Schüler, es wird noch etwas dauern bis ihr euch das Auswendiglernen sparen könnt.


Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang, Martin A. Nowak (2007). Quantifying the evolutionary dynamics of language Nature, 449 (7163), 713-716 DOI: 10.1038/nature06137

Veröffentlicht von

Bastian hat seinen Bachelor in Biologie in nur 8 statt 6 Semestern abgeschlossen. Nach einem kurzen Informatik-Studiums-Intermezzo an der TU Dortmund hat es ihn eigentlich nur für ein Stipendium nach Frankfurt am Main verschlagen. Dort gestrandet studiert er dort nun im Master-Programm Ökologie und Evolution. Zumindest wenn er nicht gerade in die Lebensweise der Hessen eingeführt wird. Neben seinen Studiengebieten bloggt er über die Themen, die gerade in Paperform hochgespült werden und spannend klingen.

Schreibe einen Kommentar