Grammatik für Primaten

Wissen Michael Tomasello erklärt die ­evo­lutionären Ursprünge der menschlichen Sprache. Alles begann mit einem Fingerzeig. Noch heute sind Hände unsere beredsten Körperteile

Stellen Sie sich vor, Sie sind zur Hochzeit der Tochter eines Freundes eingeladen worden. Sie haben die Tochter schon länger nicht mehr gesehen. Außerdem würden Sie gerne wissen, wer von den anwesenden Männern eigentlich der Bräutigam ist. Als ein junger Mann vorübergeht, deutet Ihre Gastgeberin diskret mit dem Finger auf ihn. Nun wissen Sie, wer es ist. Erstaunlich, nicht wahr?

Mehr zum Thema:

Anatomie I: Knochenkamasutra

Anatomie II: Kein Gedanke zu tief, kein Kopf zu schwer

Wieso können wir eigentlich Fingerzeige verstehen? Und wie funktioniert die Sprache der Zeigegesten? Was ist für ihre korrekte Interpretation notwendig? Und aus welchen Ursprüngen haben sich die verschiedenen Sprachen der Menschen entwickelt? Diesen Fragen ist Michael Tomasello, Kodirektor des Leipziger Max-Planck-Instituts für evolutionäre Anthropologie, in seinem neuen Buch über die Ursprünge menschlicher Kommunikation nachgegangen (Die kulturelle Entwicklung des menschlichen Denkens: Zur Evolution der Kognition, Suhrkamp 2009).

Tomasello glaubt, in den Zeigegesten den Ursprung für die Entstehung von Sprache gefunden zu haben. Er versucht evolutionär zu erklären, aus welchen Motiven und Denkstrukturen sich die Fähigkeit zur Produktion und zum Verstehen von Sprache und Gesten entwickelt hat. Hierzu teilt er die Kommunikationsmotive in drei große Klassen ein: Erstens, die Motive des Aufforderns, die sich darauf richten, dass andere etwas für einen selbst tun. Zweitens Motive des Informierens, die zum Ziel haben, anderen Dinge mitzuteilen, die für sie nützlich sind. Und drittens Motive des Teilens von Gefühlen und Einstellungen, deren Sinn darin besteht, andere dazu zu bringen, die gleichen Gefühlsreaktionen auf bestimmte Dinge und Einstellungen zu entwickeln.

Der Wert der Kooperation

Erstaunlicherweise hat sich bei der vergleichenden Untersuchungen mit Menschenaffen herausgestellt, dass die beiden letzteren Arten von Motiven nur beim Menschen vorkommen. Schimpansen verstehen zwar, dass andere Primaten (darunter auch Menschen), Ziele haben und die Welt wahrnehmen. Sie verfügen also über ein Verständnis individueller Intentionalität. Es fehlt ihnen jedoch völlig an einem Verständnis kollektiver oder geteilter Intentionalität, die bei allen gemeinsamen Handlungen mit gemeinsamen Zielen vorkommt und von Kleinkindern schon mit etwa einem Jahr verstanden wird. Die beiden Motive des Informierens und Teilens sind im Unterschied zum Motiv des Aufforderns kooperative Motive, bei denen man entweder etwas zugunsten von jemand anderem tun will (nämlich ihn informieren) oder sich so verhalten will, wie die anderen es tun.

Eine grundlegende Frage ist nun, wie sich diese Kooperationsmotive entwickelt haben. Tatsächlich appellieren ja auch Aufforderungen an ein Kooperationsmotiv, nämlich der Aufforderung Folge zu leisten. Tomasello nimmt an, dass sich das Kooperationsmotiv von Aufforderungen gerade in solchen Kontexten herausgebildet hat, in denen die Kooperation sowohl dem Auffordernden als auch dem Folge Leistenden einen Vorteil verschafft hat, zum Beispiel bei der gemeinsamen Jagd.

Die Entstehung des Informationsmotivs erklärt Tomasello hingegen aus direkter und indirekter Reziprozität. Direkte Reziprozität bedeutet, dass diejenigen Personen, die man über etwas informiert, einen selbst später auch wieder über etwas informieren, das man nützlich findet. Indirekte Reziprozität besteht darin, dass man bei anderen, die nicht unmittelbar von der Kooperation profitieren, den Ruf eines hilfsbereiten Menschen erwerben kann, welcher wieder Vorteile für einen selbst mit sich bringt. Schließlich soll sich das dritte Motiv des Teilens von Gefühlen und Einstellungen durch kulturelle Gruppenselektion entwickelt haben: Gruppen, die die Konformität innerhalb der Gruppe und ihre Verschiedenheit gegenüber anderen Gruppen erhöhten, seien erfolgreicher als Gruppen, die das nicht täten, und das Teilen von Gefühlen und Einstellungen diene genau diesem Zweck.

Mit dieser Skizze einer evolutionären Erklärung der wesentlichen Klassen von Kooperationsmotiven ist der eine Teil der Frage, nämlich der nach den Ursprüngen menschlicher Kommunikation, beantwortet. Der andere Teil dieser Frage betrifft die kognitiven Voraussetzungen. Warum sind wir in der Lage, eine diskrete Zeigegeste in einer bestimmten Situation so zu interpretieren, dass damit zum Beispiel gemeint ist „Das ist der Bräutigam“ und nicht „Das ist ein Beispiel für die Frühjahrsherrenmode“ oder „Das ist der Mann, den Sie beschatten sollen“?

Tomasellos Antwort, mit der er sich in eine sozial-pragmatische Tradition von Kommunikationstheorien einreiht, lautet: Das ist nur deshalb möglich, weil Sie und Ihre Gastgeberin über einen gemeinsamen kognitiven Hintergrund verfügen, der bestimmte Dinge enthält und andere ausschließt und innerhalb dessen Sie zuerst nach einem geeigneten Bezugsgegenstand (nach einer Person, und nicht nach einem Kleidungsstück) und dann nach einer Gesamtbedeutung der Zeigegeste suchen (dass dieser Mann der Bräutigam ist).

Ein solcher gemeinsamer Hintergrund kann entweder eine gegenwärtig wahrgenommene Szene von Gegenständen, Handlungen und Ereignissen sein oder aber durch eine gemeinsame Lerngeschichte entstehen, das heißt durch einen kulturellen Prozess, in dem man sich mit bestimmten Praktiken vertraut macht und bestimmte Fähigkeiten ausbildet. Notwendig für einen gemeinsamen Hintergrund sind aber auch die Ausbildung gemeinsamer Ziele und die Teilnahme an gemeinsamen Handlungen.

Gemeinsame Ziele und gemeinsame Aufmerksamkeit auf Gegenstände, die für diese Ziele relevant sind, setzen die Fähigkeit voraus zu erkennen, dass der andere weiß, dass man dasselbe Ziel wie er selbst hat. Darüber hinaus muss man auch wissen, dass der andere dieses Ziel hat. Solche Metarepräsentationen können dann unter dem Druck möglicher Pannen bei der Kommunikation weiter iteriert werden. Menschenaffen scheinen dagegen weder gemeinsame Ziele noch ein gemeinsames Wissen bezüglich dieser Ziele zu haben.

Zeigegesten übermitteln nur dann eine bestimmte Botschaft, wenn sich die Dinge, auf die man zeigen will, entweder im gemeinsamen Wahrnehmungsfeld befinden oder wenn man mit der Person, die die Zeigegeste verstehen soll, schon einen gemeinsamen Hintergrund durch gemeinsame Handlungen in der Vergangenheit oder durch eine ähnliche Lerngeschichte kultureller Normen hat. Wenn das nicht der Fall ist, kann man versuchen, einem anderen etwas durch pantomimische Gebärden (ikonische Gesten) zu verstehen zu geben, beispielsweise indem man, wenn man kein Italienisch spricht, im Käseladen in Italien den Daumen an Mittel- und Zeigefinger reibt, um anzudeuten, dass man einen Käse haben möchte, der sich zum Reiben und anschließenden Streuen eignet.

Wie bei den Zeigegesten gibt es auch hier zwei Ebenen der Intentionalität: eine referentielle Intention auf einen Gegenstand und eine soziale Intention, die sich darauf bezieht, was der Adressat der Geste tun, wissen oder fühlen soll. Das Verstehen ikonischer Gesten, die Handlungen repräsentieren sollen, ist aber erst dann möglich, wenn man die Handlung als Kommunikationshandlung versteht, weil man diese Gesten andernfalls für seltsam deplatzierte wirkliche Handlungen halten würde. Das Verstehen einer Handlung als Kommunikationshandlung setzt das Erkennen einer kommunikativen Absicht voraus und das erfordert wiederum die Fähigkeit zur Bildung verschachtelter Metarepräsentationen mit dem Inhalt, dass der Kommunizierende will, dass man erkennt, dass er etwas mitteilen will.

Grammatik für Primaten

Tomasello behauptet, dass menschliche Sprachen sich auf der Grundlage von Zeigegesten und ikonischen Gesten entwickelt haben. Die Demonstrativa entsprächen den Zeigegesten, während Nomina und Verben ursprünglich auf ikonischen Gesten aufbauten. Dabei lautet die spekulative Hypothese, dass sich der Übergang vom Zeigen zum Sprechen vor noch gar nicht so langer Zeit (evolutionsbiologisch gesehen) ereignet hat, nämlich vielleicht erst vor 150.000 Jahren.

Wahrscheinlich gab es aber auch schon vorher eine länger dauernde Entwicklung von ikonischen Zeichensystemen, während der bestimmte Gebärden konventionalisiert wurden und sich eine Gestengrammatik herausgebildet hat. Die Entstehung von Kommunikationsnormen im Sinne von Gesten, die immer gleich verwendet werden sollen, wenn man dieses oder jenes ausdrücken möchte, erklärt Tomasello durch kulturelle Gruppenselektion. Für ihn dienen Normen der Bezeichnung und der Grammatik dem Zusammenhalt der Gruppe, so dass verschiedene Gruppen (und nicht nur deren Mitglieder) zu Zielen der Selektion werden können.

Im Unterschied zu Chomskys Idee einer angeborenen Universalgrammatik, die in den letzten Jahrzehnten einen erheblichen Wandel erfahren hat, postuliert Tomasello also einen evolutionären Prozess der Sprachentstehung. In Anlehnung an die drei Hauptmotive der Kommunikation sieht er auch drei verschiedene Entwicklungsstadien oder -stufen der Grammatik:

Erstens, die „einfache“ Grammatik, die dem Zustand entspricht, dass die Zeichenbenutzer nur Aufforderungen verwenden wie es bei den Menschenaffen der Fall ist. Hier genügt eine Unterscheidung zwischen den Handlungen beziehungsweise den Dingen, die man wünscht, und der Person, die die Handlung ausführen soll, oder der Tatsache, dass es sich um eine Aufforderung handelt.

Zweitens, die „ernsthafte“ Grammatik, in der Ereignisse und verschiedene Mitspielerrollen wie Agent, Patient und Instrument unterschieden werden und die dem Motiv des Informierens entspricht. Hierfür ist ein reichhaltiges grammatikalische Inventar erforderlich, etwa Personalpronomen zur Identifikation von Referenten oder Adjektive zur Modifikation von Ausdrücken. Außerdem muss es Mittel geben, das Kommunikationsmotiv auszudrücken, also für die Unterscheidung von beispielsweise Fragen, Befehlen und Aussagen.

Und drittens, die „extravagante“ Grammatik, in der das zeitliche Verhältnis verschiedener Ereignisse ausgedrückt werden kann und die es ermöglicht, dieselben Mitspieler durch verschiedene Ereignisse hindurch zu verfolgen. Diese Grammatik wird notwendig, wenn man anfängt, Geschichten zu erzählen.

Vom Lärmen zum Sprechen

Tomasellos Grundidee ist, dass am Anfang bestimmte Verständigungsbedürfnisse stehen und dass diese Bedürfnisse die Mittel zu ihrer Befriedigung erzeugen. Sein Stufenmodell erklärt, was sonst ein Mysterium bliebe: wo denn so etwas Komplexes wie die Grammatik einer natürlichen Sprache überhaupt herkommen konnte.

Die stimmlichen Sprachen mit ihrer enormen Vielfalt an grammatikalischen Mitteln sollen jedenfalls erst entstanden sein, als es schon eine funktionierende Gestensprache gab und als die Menschen willentliche Kontrolle über ihre Vokalisierungen, die bei anderen Primaten unwillkürlich und mit starken Emotionen verknüpft sind, erlangt haben. Die Interpretation von Zeigegesten und Gebärden macht sich die natürliche Tendenz des Menschen zunutze, dem Blick anderer Personen zu folgen und ihr Handeln intentional zu interpretieren. Wenn sich auf dieser Basis dann eine Gestensprache entwickelt, deren Bedeutungen handlungsbasiert und in diesem Sinne „natürlich“ sind, kann sich anschließend die stimmliche Sprache dieser Gestensprache überlagern.

Die Behauptung, dass die menschliche Sprache sich erst mit der organischen Fähigkeit zur stimmlichen Modulierung von Lauten entwickelt hat, hält Tomasello für ausgeschlossen. Prozesse der kulturellen Gruppenselektion sollen erklären, warum sich aus einer ursprünglich einheitlichen Sprache die ganze Vielfalt menschlicher Sprachen entwickelt hat. Schon bei den Gesten gibt es einen Sprachwandel, der durch die sogenannte „Drift zum Arbiträren“ charakterisiert ist: jede neue Generation von Kindern, die eine Sprache lernt, interpretiert manche Elemente dieser Sprache anders als die Erwachsenen.

Tomasello versteht es meisterhaft, empirisches Material aus der Primatenforschung, der Erforschung des Kommunikationsverhaltens von Kleinkindern, bestimmte Einsichten der Sprachphilosophie und Befunde aus der Linguistik auf eingängige und durchsichtige Weise miteinander zu verknüpfen. Man mag nicht in allen Einzelheiten mit ihm einverstanden sein und man mag auch Tomasellos evolutionäre Perspektive vielleicht als zu „biologistisch“ ablehnen. Wenn man aber diese Perspektive teilt, liefert seine Forschung auf jeden Fall ein ernstzunehmende und einfallsreiche Erklärung für den Ursprung und die Besonderheit des menschlichen Sprachvermögens.

Jürgen Schröder ist Privatdozent für Philosophie und hat unter anderem die Einführung in die Philosophie des Geistes (Suhrkamp Verlag 2004) geschrieben.

Dieser Artikel ist für Sie kostenlos. Unabhängiger und kritischer Journalismus braucht aber Unterstützung. Wir freuen uns daher, wenn Sie den Freitag abonnieren und dabei mithelfen, eine vielfältige Medienlandschaft zu erhalten. Dafür bedanken wir uns schon jetzt bei Ihnen!

Jetzt kostenlos testen

Verändern Sie mit guten Argumenten die Welt. Testen Sie den Freitag in Ihrem bevorzugten Format — kostenlos.

Print

Die wichtigsten Seiten zum Weltgeschehen auf Papier: Holen Sie sich den Freitag jede Woche nach Hause.

Jetzt kostenlos testen

Digital

Ohne Limits auf dem Gerät Ihrer Wahl: Entdecken Sie Freitag+ auf unserer Website und lesen Sie jede Ausgabe als E-Paper.

Jetzt kostenlos testen

Was ist Ihre Meinung?
Diskutieren Sie mit.

Kommentare einblenden