Skip to content
BY 4.0 license Open Access Published by De Gruyter (A) August 7, 2023

Animal symbolis interveniens

Ein Versuch zur vertiefenden Anknüpfung an die philosophisch-anthropologische Sprachtheorie Arnold Gehlens

  • Simon Kasper EMAIL logo

1 Einleitung

Der vorliegende Artikel stellt den Versuch dar, die Sprachtheorie der Philosophischen[1] Anthropologie (PA) zu jüngeren Ergebnissen der empirischen Linguistik in Bezug zu setzen, an ihnen zu revidieren und dadurch zu einem Anknüpfungspunkt aktuellen sprachtheoretischen Denkens zu machen. Als „die“ Sprachtheorie der PA wird in Übereinstimmung mit Fischer (2021: 81; siehe auch Fischer 2009) diejenige Arnold Gehlens behandelt. Da die Motive für ein solches Vorhaben nicht selbsterklärend sind, seien einige Erläuterungen vorausgeschickt. Das Interesse der zeitgenössischen Linguistik an Arnold Gehlens Sprachtheorie lässt sich leicht bemessen. Eine Orientierung darüber, woher jüngere Theoriekonzeptionen in der Linguistik ihre Inspirationen bezogen haben und weiterhin beziehen, ergibt, dass die Sprachtheorie der philosophischen und Philosophischen Anthropologie im Allgemeinen und diejenige Gehlens im Speziellen nicht zu ihren Quellen gehört und auch nie dazugehört hat (vgl. Helbig 1986, Gardt 1999, Wildgen 2010).

Wieso interessiert sich die Linguistik nicht für Gehlen? Nach dem zweiten Weltkrieg haben weite Teile der deutschen Wissenschaft den Blick von deutschsprachigen Forschungs- und Denktraditionen abgewendet und ihn vor allem französisch(sprachig)en, englischen und US-amerikanischen Ansätzen zugewendet. Diese Ansätze – am prominentesten wohl der Strukturalismus in Anschluss an de Saussure (Schweiz) und Noam Chomskys Generative Grammatik als mentalistisch gewendeter amerikanischer Strukturalismus – sind stark auf die formale Struktur der Sprache fokussiert. Sie wurden ab den späten 1950er Jahren in der deutschen Linguistik aufgenommen und überlagerten im Verlauf der darauffolgenden beiden Jahrzehnte zunehmend bestimmte Forschungs- und Denktraditionen, die für Gehlen (und viele andere deutschsprachige Denker*innen) zentral gewesen waren. Diese waren inhaltlich verdächtig geworden (auch diejenige Gehlens), ihre Vertreter*innen waren tot, geflüchtet, schuldig oder nicht unschuldig (wie Gehlen), kurz: bestimmte Denk- und Forschungstraditionen wurden kaum weitergeführt. Eine solche Geschichte lässt sich für viele Forscher*innen erzählen. In dem speziellen Fall von Gehlens Sprachtheorie lässt es sich kurz so fassen: Gehlen war ein holistischer Pragmatist; er hat Wahrnehmung, Vorstellung, und Sprache unter dem Gesichtspunkt betrachtet, dass sie in einem wechselseitigen Dienstverhältnis mit dem physischen Handeln und Verhalten des Menschen stehen. Keins dieser inhaltlichen Relata zur Sprache hat den linguistischen (!) Strukturalismus interessiert. Und Chomskys Generativismus hat das Wesentliche der Sprache in einer von allen anderen Fähigkeiten des Menschen abgekapselten, autonomen, nur kognitiven Kompetenz gesehen, die sich unabhängig vom Körper, von der Wahrnehmung und von anderen kognitiven Fähigkeiten in der mentalen Manipulation bedeutungsloser Symbole erschöpft. Das ist in etwa das Gegenteil von dem, was Sprache für Gehlen war. Viele Disziplinen, bei denen sich Gehlen intellektuell „bedient“ hat, haben ebenfalls neue Wege eingeschlagen (Psychologie, Biologie, Soziologie, Anthropologie/ Ethnologie). Dies lässt sich unter anderem an der Umstrukturierung dieser Disziplinen in Subdisziplinen in der zweiten Hälfte des 20. Jahrhunderts nachverfolgen. Über die Vermittlung soziologischer Denkrichtungen, bei denen sich (auch) Kontinuitäten zu Gehlen verzeichnen lassen (Berger/Luckmann, Luhmann) sind ebenfalls keine nachhaltigen Niederschläge Gehlenʼscher Ideen in strukturlinguistischen Theorien zu verzeichnen.[2]

Was könnte die zeitgenössische Linguistik also aus einer Beschäftigung mit Gehlen gewinnen? Seit 20 bis 30 Jahren bröckelt innerhalb der Linguistik das Paradigma der Generativen Grammatik, nicht zuletzt deswegen, weil bestimmten, über die Linguistik hinausweisenden Theoriekomponenten kein paradigmatischer Status (mehr) zukommt, darunter die Computertheorie des Geistes, der Nativismus und die Autonomie der grammatischen Komponente der Sprache. Dagegen werden nun in alternativen Forschungsprogrammen die Sprache und ihre Strukturen stärker im Zusammenhang mit Wahrnehmung, Kognition und neuerdings auch mit dem Körper – Stichwort „Embodiment“ – gesehen (vgl. Pecher & Zwaan 2005, Fischer & Zwaan 2008). Hier verbietet sich aber der Zusatz „wieder“, denn diese Umorientierung hat sich aus anderen Traditionen und wissenschaftssozialen Zusammenhängen heraus vollzogen. Von den Vor- und Nachdenker*innen dieser neueren „Kognitiven Linguistik“ nimmt niemand Bezug auf Gehlen (vgl. Geeraerts & Cuyckens 2007; Dąbrowska and Divjak 2015; Dancygier 2017; Wen and Taylor 2020). Dabei hat Gehlen – um die Ausgangsfrage zu beantworten – seinerzeit zukunftsweisend gesehen, dass die Sprache ein „sensomotorisches System“ (GA 4, 98) ist, in dessen Leistungen diejenigen von Hand und Auge im bekannten dreifachen Sinn „aufgehoben“ sind.[3] Damit hat Gehlen nicht nur zentrale Annahmen der aktuellen Kognitiven Linguistik vorweggenommen, ohne dass diese dies zur Kenntnis genommen hätte, sondern er hat in der Explikation seines philosophisch-anthropologischen „Systemgedanken[s]“ (M, 13) eine Kontextualisierung der Sprache in der Gesamtkonstitution des Menschen angeboten, die weit über das Blickfeld der (Kognitiven) Linguistik hinausgeht.[4]

Eine Ausnahme zur vorgenannten Nichtbeachtung Gehlens in der zeitgenössischen Linguistik bildet die Monographie des Verfassers (Kasper 2020), im Untertitel eine „historische Korpusstudie in anthropologischer Absicht“, die man als Versuch betrachten kann, an die Sprachtheorie der PA anzuknüpfen und sie mit der neueren linguistischen Grammatikforschung in Kontakt zu bringen. Es handelt sich bei besagter Arbeit um einen Entwurf zum Verstehen, der sowohl der leiblichen Existenz des Menschen als auch der Grammatizität seiner Sprache Rechnung trägt. Die Monographie nimmt in wichtigen Teilen Bezug auf Gehlen, erfolgt aber nicht in einer dedizierten Auseinandersetzung mit ihm. Im vorliegenden Beitrag soll der Bezug zu Gehlens Sprachtheorie in aller gebotenen Kürze erläutert werden. Wichtige Thesen von Gehlen werden aufgenommen und vor dem Hintergrund empirischer Ergebnisse einer Revision unterzogen. Am Ende steht die Charakterisierung des Menschen als animal symbolis interveniens, ein Entwurf zum „Menschen und seiner Grammatik“ im Anschluss an philosophische Anthropologien, der im besten Falle Anlass zu neuem sprachanthropologischen Nachdenken gibt.

Die Philosophische Anthropologie ist nicht von ungefähr ein „Denkansatz des 20. Jahrhunderts“ (Fischer 2009) – wenn auch ein „wirkungsvoller“ (Fischer 2006) – und keiner des 21. Jahrhunderts. In Bezug auf Ziel und Umfang einer Anknüpfung an die philosophisch-anthropologische Sprachtheorie ist daher zweierlei zu bemerken: Zum einen verfolgt der vorliegende Beitrag nicht das Ziel, die PA als Ganze zu revitalisieren. Er beschränkt sich positiv auf diejenigen Teiltheoreme der Sprachtheorie Gehlens, die im Folgenden tatsächlich aufgegriffen werden. Zum zweiten erschöpft sich die wiederaufnehmende Instanz, eine zeitgenössische Sprachtheorie, in Umfang und Anspruch nicht im Wiederaufgenommenen (vgl. Kasper 2015, 2020). Die Linguistik hat in den letzten 70 Jahren in anderen als den bei Gehlen zu findenden sprachtheoretischen Aspekten enorme Entwicklungen genommen, deren Resultate in der ein oder anderen Form in jüngeren Sprachtheorien Niederschlag gefunden haben.[5]

Im folgenden zweiten Abschnitt folgt zunächst eine kurze Rekapitulation der Gehlenʼschen Sprachtheorie. Bei dieser Rekapitulation handelt es sich bereits um eine problemorientierte Interpretation seiner Theorie, d. h. sie erfolgt am Text von Der Mensch, perspektiviert aber gegebenenfalls altbekannte Zusammenhänge in einer Weise, die man in nicht-linguistischen Darstellungen von Gehlens Denken anders findet. Im dritten Abschnitt werden die Randbedingungen einer Revision der Gehlenʼschen Sprachtheorie besprochen. Die Notwendigkeit einer solchen Diskussion ergibt sich daraus, dass Gehlens Theoreme und diejenigen seiner wissenschaftlichen Bezugsgrößen nicht ohne Weiteres in zeitgenössische wissenschaftliche Modelle überführen lassen. Der vierte Abschnitt widmet sich verschiedenen Befunden der jüngeren empirischen Linguistik, die sich auf einen gemeinsamen Nenner bringen lassen: die „Präferenz für verantwortliche Ursachen“, die als Instinktresiduum rekonstruiert wird. Die Befunde machen eine präzisierende Revision der Sprachtheorie Gehlens nötig. Diese erfolgt dann im fünften Abschnitt. Es wird demonstriert, dass die Befunde nicht nur die Sprache betreffen, sondern auch die menschlichen Leistungen, auf die Gehlen die Sprache aufbaut: Hand, Auge und Phantasie/Vorstellung. Im sechsten und letzten Abschnitt erfolgt auf der Basis der vorangegangenen Ausführungen eine anthropologische Neueinordnung der grammatischen Komponente der Sprache, die eine Neubewertung des menschlichen Selbstverhältnisses impliziert.

2 Gehlens Sprachtheorie im Parforceritt

Der Mensch bei Gehlen ist anders als andere Lebewesen morphologisch, d. h. in seiner organismischen Form und Struktur, unspezialisiert und er ist korrelativ dazu instinktarm in seinem Verhalten. Damit stellt sich ihm die Wirklichkeit – denn eine artspezifische Umwelt, eine physisch charakterisierbare ökologische Nische hat er nicht – mit nahezu endlosen Merk- und Wirkmöglichkeiten dar. Seine Wahrnehmung der Wirklichkeit ist nicht auf die Aspekte eingeengt, die morphologische Spezialisierungen oder Instinktverhalten ihm diktieren würden, sondern die Wirklichkeit mit ihrer gesamten Unbestimmtheit muss von ihm erst gebändigt und das heißt, aspektvereinseitigt werden. Der Mensch hat kein festes Verhaltensrepertoire, das seinen Überschuss an Merk- und Wirkmöglichkeiten kanalisieren könnte. Wie gelingt es ihm, diese „‚unzweckmäßige[…]‘ Fülle einströmender Eindrücke“ (M, 35) zu bewältigen? Indem er die Umwelt in unmittelbarem physischem Kontakt handlungsförmig durcharbeitet und die „Gebrauchs- und Umgangswerte“ (M, 40) der Dinge auf diese Weise handelnd erfährt. Die handlungsförmige Registrierung der Umgangs- und Gebrauchswerte ist die Aspektvereinseitigung der Wirklichkeit und sie entlastet den Menschen von der kaleidoskopischen Eindrucksfülle, die auf ihm lastet. So lernt der Mensch bspw. im Hantieren mit einem Ast, dass man mit diesem schlagen, stechen und stochern kann, dass man ihn schleudern und schnitzen kann, dass man ihn als Krücke, Armverlängerung und Schläger benutzen kann usw. So fügt sich die Wirklichkeit zunehmend menschlichen „Hinsichten“. Die Selbstentlastung von der unbestimmt den Menschen andrängenden Wirklichkeit durch die Hand(lung) ist aber nur die erste Stufe der Entlastung.

Eine weitere Stufe der Entlastung wird über das Auge erreicht. Wie die Hand sinnbildlich für die motorische Erschließung der Wirklichkeit steht, so steht das Auge für die visuelle Wahrnehmung. In diesem Sinne entlastet das Auge die Hand, indem es beim Handeln die Umgangs- und Gebrauchswerte, kurz: die Indexikalität der Umweltphänomene, mitregistriert. Das führt dazu, dass der Mensch schon bald „Übersicht“ (M, 52) über die Wirklichkeit erhält, indem er, ohne die Dinge anfassen zu müssen, ihre indexikalischen Werte „übersieht“ (M, 39) und die sensomotorische Herausforderung, die sie darstellen, durch die Fernsinne „erledigt“ (M, 40). Er sieht die Angriffsmöglichkeiten (moderner: „Affordanzen“) und er kann die Möglichkeiten, als was die Dinge alles erkannt werden können, unter pragmatischen Motiven kontrolliert auf bestimmte Aspekte verengen. So genügt nach tätiger Durcharbeitung der bloße Anblick des Phänomens ‚Ast‘ mit pragmatischem Motiv, um es als Schlagwaffe, als Wurfgeschoss, als Krücke, als Armverlängerung, als Stocher usw., jeweils unter Absehung der anderen möglichen Zweckbestimmungen, zu erkennen.

Auf einer nächsten, dritten Stufe entlastet der Mensch auch noch das Auge. Dies leistet die Sprache, präziser: zunächst der lexikalische Teil der Sprache. Die autosemantischen, lexikalischen Wörter einer Sprache (d. h. diejenigen mit einer konkreten, angebbaren Bedeutung) machen die von sensomotorischen Situationsdrücken entlasteten, aspektvereinseitigten Wirklichkeitsausschnitte in Vorstellungsform verfügbar, indem sie symbolische Kristallisationen der handelnd erworbenen Umgangswerte dieser Ausschnitte darstellen (M, 201 – 205). Das Lexikon im Sinne eines virtuellen, konventionellen Repositoriums ist sozusagen das symbolische Sediment von Gebrauchs- und Umgangswerten und es enthebt den Menschen vom unmittelbaren Kontakt mit den Dingen via Hand und es enthebt ihn sogar vom mittelbaren Kontakt via Auge. Der praktische Wert des Gegenstands ist symbolisch kristallisiert im Ausdruck Schläger, Stocher, Krücke etc. „Ablösung des Vorfindbaren von der Raum-Zeit-Stelle; das ist es, was das Wort [gemeint ist das Wort als solches; SK] bedeutet, eine Handlung des Feststellens, der Daseinsstabilisierung“ (US, 90). Damit ist die Stufenleiter der Entlastung aber noch nicht erklommen.

Die nächste Entlastungsstufe und das „Meisterstück menschlicher Leistung“ (M, 50) ist zuletzt die Grammatizität der Sprache. Dazu zählen die synsemantischen, grammatischen Ausdrücke mit bloß abstrakter Bedeutung (z. B. die Kopula sein, und, be- und -t in betrifft) sowie die gesamte bedeutungsrelevante grammatische Kombinatorik (Kim sees Simone vs. Simone sees Kim). Lexikon und Grammatik erlauben zusammen satzförmige Urteile unter kohärenter Hinsicht, das sind festgestellte aspektvereinseitigte Sachverhalte. Sie erlauben die Ablösung von Sachverhalten vom Interesse des Subjekts als der 1. Person (Ich sehe Simone vor mir vs. Simone steht an der Tür.) Als Ganze ermöglicht die Sprache symbolische Welten, also kohärente, aspektvereinseitigte Vorstellungen der Wirklichkeit, seien sie vergangen, in die Zukunft entworfen, fiktiv oder kontrafaktisch. In ihnen kann das Denken „bei sich selbst bleiben“ (M, 322), anstatt immer unmittelbar auf die Dringlichkeiten des Ich, Hier, Jetzt des sprechenden Subjekts zurückbezogen zu sein. Generische Urteile der Form Der Mensch ist sterblich bleiben schließlich insoweit bei sich selbst, als sie von jedem Situationsdruck entlastet und dadurch „objektiv“ sind (M, 285).

In der Zusammenschau zeigt sich zweierlei: erstens das „Aufbaugesetz“ (M, 20) menschlicher Leistungen. Die Grammatizität der Sprache ist aufgebaut auf die Lexikalität der Sprache, diese wiederum auf die Vorstellung (Phantasie), diese auf die Wahrnehmung (Auge) und diese auf die Motorik (Hand). Jede dieser Leistungen „hebt“ diejenigen der vorangegangenen Stufe(n) in dem Sinne „auf“, dass Leistungen unterer Stufen (i) aufgenommen werden, (ii) erhalten bleiben und (iii) in ihren belastenden Anteilen außer Kraft gesetzt werden. Zweitens zeigt sich Folgendes: Der dritte Sinn von aufheben wird in der Zusammenschau der Aufbaustufen sinnfällig, und zwar insofern, als mit der Stufenfolge eine „Herabsetzung des […] Kontakts mit der Welt“ (M, 38) zunimmt: Beim motorischen Durcharbeiten der Wirklichkeit ist der Organismus mit dem durchzuarbeitenden Wirklichkeitsausschnitt verschränkt. Beim aspektvereinseitigenden „Übersehen“ der Wirklichkeit mithilfe des Auges ist der Kontakt auf den durch einen Fernsinn gehaltenen beschränkt, aber zwischen der Herausforderung durch das Wirklichkeitsphänomen und ihrer wahrnehmungsmäßigen „Erledigung“ besteht räumliche und zeitliche Kontiguität. Die Nahsinne sind ihr aber entzogen. Im Vorstellen und in der Sprache sind dann auch die Fernsinne dem Kontakt entzogen sowie die Raum- und Zeitstellen des Wirklichkeitsphänomens in der mentalen Aktivität transzendierbar. Letztere hat aber noch einen potentiellen Anlass in einer konkreten Situation. Das bei sich bleibende, objektive (sprachliche) Denken schließlich ist selbst von einem äußeren Anlass unabhängig (vgl. dazu auch Alsberg 1922).

Beide Aspekte, Leistungsaufbau im Menschen und Entlastung vom Wirklichkeitskontakt, sind also positiv miteinander korreliert. Dieses Teiltheorem der Gehlenʼschen Anthropologie soll im Folgenden am Leitfaden jüngerer Ergebnisse aus der Linguistik relativiert werden. Zunächst müssen allerdings die Gelingensbedingungen einer solchen Revision reflektiert werden.

3 Randbedingungen einer Revision

Der Entwurf Gehlens steht ganz im Zeichen der sukzessiven Entlastung von der Eindrucksflut, die mit der morphologischen Unspezialisiertheit und Instinktarmut des Menschen einhergeht. Der folgende Revisionsvorschlag setzt an einer theoretischen Stelle an, deren Revisionsbedürftigkeit Gehlen nach der Publikation von Der Mensch bereits selbst gesehen hat. Es ist der Grad an Instinktarmut, den er dem Menschen zugeschrieben hatte. Gehlen konstatierte diesbezüglich, „mit der Ablehnung umschriebener Instinktkomplexe sicher zu weit gegangen“ zu sein (GA 4, 241). „Residuen“ solcher Instinktkomplexe hatte er durch die Rezeption der klassischen Ethologie kennengelernt (Lorenz, Tinbergen, Eibl-Eibesfeldt) und sie schienen sich auch noch in hochgradig entlasteten Tätigkeiten in der Kultur zu zeigen, obwohl sie zur biologischen „Grundausstattung“ des Menschen gehörten. Dabei sollte die Kultur doch Produkt des „Hiatus“ zwischen Eindruck und Ausdruck beim Menschen sein. In einigen kleineren Schriften zwischen Der Mensch und diesem expliziten Eingeständnis hatte er für sich selbst schonendere Formulierungen gewählt, beispielsweise dass sein Entwurf „ergänzt und vielleicht verbessert worden“ sei (GA 4, 216). Letztlich reichten diese Relativierungen aber nicht sehr weit. Gehlen baute sie in seinen Entwurf als Addenda ein, sein Systementwurf zum Menschen als morphologisches Mängelwesen blieb dadurch aber insgesamt unberührt.

Einer zeitgemäßen Revision des Gehlenʼschen Entwurfs an dieser Systemstelle steht ein nicht geringes Problem im Wege. Die klassische Ethologie hat ein ähnliches Schicksal ereilt wie die Philosophische Anthropologie. Das Paradigma/Forschungsprogramm wurde nach wissenschaftstheoretischer Kritik von anderen Ansätzen mit anderen Grundüberzeugungen abgelöst. Dabei ist auch der Instinktbegriff auf der Strecke geblieben. Als Gehlen eingestanden hatte, Instinktkomplexe übermäßig abgelehnt zu haben, befand sich die klassische Ethologie schon auf dem absteigenden Ast (vgl. Kappeler 2020). Eine Revision muss daher transparadigmatisch erfolgen. Grundannahmen der Gehlenʼschen Anthropologie, die sich des Instinktbegriffs bedienen, müssen mit adäquateren Begriffen rekonstruiert werden. Natürlich kann eine solche Rekonstruktion nicht in toto erfolgen, so dass die Instinktforschung als Ganze mit dem Begriffssystem der heutigen Bio-, Neuro- und Kognitionswissenschaften reformuliert wird, denn wenn dies möglich wäre – die Rationalität der Paradigmenwechsel vorausgesetzt –, wäre die klassische Ethologie nie in eine Krise geraten. Eine Rekonstruktion des Gehlenʼschen Systems muss daher an einem konkreten Problem ansetzen und die Referenzbegriffe müssen dem aktuellen Forschungsstand entnommen werden. Dann wird es prinzipiell möglich (i) zu prüfen, was tatsächlich rekonstruierbar ist, und (ii) Revisionen vorzunehmen, die ihren Anlass in aktuellen Problemlagen haben.

4 Befunde der jüngeren Linguistik

Es folgt nun eine Reihe jüngerer linguistischer Forschungsbefunde, die sich als relevant für Gehlens Sprachtheorie erweisen werden. Eine gewisse linguistische Tiefe der Darstellung ist zwar unumgänglich, die Darstellung wird aber in aller Kürze und in weitgehend untechnischer Weise erfolgen. Für weitergehende Informationen sei auf die referenzierten Studien und auf Kasper (2020) verwiesen.

Die Befunde betreffen sämtlich die Interpretation grammatisch mehrdeutiger Äußerungen. Es wird sich im Schlussabschnitt zeigen, dass dies nicht von ungefähr kommt: Der Vergleich des menschlichen Umgangs mit grammatisch eindeutigen gegenüber mehrdeutigen Äußerungen ist ein Erkenntnisfenster zum Verhältnis des grammatisch geprägten zum nicht grammatisch geprägten Selbst- und Weltverhältnis des Menschen insgesamt.

4.1 Korpuslinguistik: Belebtheit und Reihenfolge im Umgang mit grammatischer Mehrdeutigkeit

Kasper (2020) analysiert alle Sätze in vier exemplarischen Kapiteln des Neuen Testaments in der englischen und deutschen Sprachgeschichte auf ihre grammatische Mehrdeutigkeit hin. Dabei gelten solche Sätze als grammatisch mehrdeutig, in denen die Identifikation der syntaktischen Kernfunktionen Subjekt, indirektes Objekt und direktes Objekt auf mehr als eine Weise erfolgen kann. Beispiel (1) stammt aus einer schweizerdeutschen (hochalemannischen/zürichdeutschen) Bibelübersetzung. Zum Kontext: Jesus hängt am Kreuz und erklärt seinen Lieblingsjünger und seine Mutter Maria, die vor ihm stehen, zu Sohn und Tochter. Daraufhin wird Folgendes berichtet:

(1)

Und vo säbere Stund aa hät si de Jünger zue sich gnaa. (Joh. 19, 27)

Lesart 1: ‚Und von derselben Stunde an hat sie den Jünger zu sich genommen.‘

Lesart 2: ‚Und von derselben Stunde an hat sie der Jünger zu sich genommen.‘

Der schweizerdeutsche Satz erlaubt (wenigstens) zwei inkompatible Interpretationen: Nach der ersten Lesart ist „sie“ (Maria) die Mitnehmerin des Jüngers und nach der zweiten ist der Jünger der Mitnehmer Marias. Die Mehrdeutigkeit besteht darin, dass jeder der beiden Ausdrücke in jeder der beiden „semantischen Rollen“ ‚Mitnehmer‘ bzw. ‚Mitgenommenes‘ interpretiert werden kann. Wenn von der konkreten Beziehung (hier: Mitnehmen) abstrahiert wird, um über viele bedeutungsähnliche Beziehungen generalisieren zu können, spricht man auch von den semantischen Rollen ‚Agens‘ (sehr grob: die aktivere Entität) und ‚Patiens‘ (die passivere Entität). Das Erkennen der semantischen Rollen in Sätzen hängt in komplexer Weise an den grammatischen Eigenschaften der Sprachen, zu denen diese Sätze gehören. In Aktivsätzen wie dem in (1) in Sprachen wie dem Deutschen und Englischen wird ein Agens meistens durch ein Subjekt ausgedrückt und ein Patiens meistens durch ein direktes Objekt. Beispiel (1) ist mehrdeutig, weil nicht klar ist, ob si Subjekt und de Jünger direktes Objekt ist oder umgekehrt. Die Frage, welche dieser syntaktischen Funktionen ein Ausdruck trägt, hängt wiederum an Formeigenschaften der Sätze, das heißt morphologischen und syntaktischen Eigenschaften. Dafür, dass si und de Jünger sowohl als Subjekt als auch als direktes Objekt interpretiert werden können (und damit als Agens oder Patiens), gibt es drei notwendige und zusammen hinreichende sprachformale Bedingungen: (i) Subjekte im Deutschen, Englischen und vielen weiteren Sprachen tragen den Kasus Nominativ, direkte Objekte (meistens) den Kasus Akkusativ. Die Ausdrücke si und de Jünger können aber durch historische Zusammenfälle der Kasusexponenten sowohl als Nominativ als auch als Akkusativ interpretiert werden. (ii) Subjekte im Deutschen, Englischen und vielen weiteren Sprachen stehen, wie bereits erwähnt, im Nominativ, kongruieren daneben aber auch mit dem finiten Verb in Person und Numerus (Ich spiele, du spielst, ihr spielt usw.). Hät in (1) repräsentiert 3. Person Singular, aber sowohl si als auch de Jünger sind morphologisch als 3. Person Singular spezifiziert, kongruieren also beide mit hät (Dies wäre bspw. anders, wenn es die Jünger lautete). (iii) Anders als im Neuenglischen ist die Reihenfolge der Satzglieder im Deutschen kein zuverlässiger Hinweis darauf, welches Satzglied als Subjekt und welches als Objekt zu interpretieren ist. Dies zeigt sich schon daran, dass die neuhochdeutschen Paraphrasen in Lesart 1 und 2 beide wohlgeformt sind. Subjekt steht vor Objekt in Ersterer, in Letzterer ist es umgekehrt. Selbst wenn die Bedingungen (i) und (ii) im Neuenglischen erfüllt wären, wie in Beispiel (2), würde die Reihenfolge der Ausdrücke im Satz diesen dennoch eindeutig machen:

(2)

And from that hour that disciple took the mother of Jesus unto his own home.

‚Und von dieser Stunde an nahm der Jünger die Mutter Jesu mit in sein Heim.‘

Nicht: ‚Und von dieser Stunde an nahm die Mutter Jesu den Jünger mit in sein Heim.‘

Beispiel 2 kann nicht so interpretiert werden, dass the mother of Jesus Subjekt/Agens und that disciple Objekt/Patiens ist. Im Alt- und teilweise im Mittelenglischen wäre dies noch möglich gewesen.

Nach den Bedingungen (i) und (ii) können Sätze „morphologisch“ mehrdeutig sein. Dies trifft zu, wenn alle relevanten Flexionsformen (Kasus und Kongruenz) nicht eindeutig sind. Und nach Bedingung (iii) können Sätze „syntaktisch“ mehrdeutig sein. Dies ist der Fall, wenn (auch) die Konfiguration der Ausdrücke im Satz keinen Signalwert hinsichtlich der Interpretation hat. Sätze können morphologisch mehrdeutig, aber syntaktisch eindeutig sein wie (2). Wenn sie sowohl morphologisch als auch syntaktisch mehrdeutig sind wie (1), dann sind sie „grammatisch“ mehrdeutig (im Sinne von „Grammatik = Morphologie + Syntax“). Es muss betont werden, dass grammatische Mehrdeutigkeit formal definiert ist, also völlig unabhängig von semantischer Plausibilität festgestellt werden kann.

Dieser etwas längere Vorlauf war nötig, um die Fragestellung und die Befunde in Kasper (2020) nachvollziehbar zu machen. (Die Darstellung weiterer Befunde wird auf die obigen Begrifflichkeiten zurückgreifen). Es ist allgemein beobachtbar, dass Sprachbenutzer*innen grammatische Mehrdeutigkeiten wie die in (1) in der Regel gar nicht bemerken. (Der vorangegangene Nebensatz ist bspw. genauso grammatisch mehrdeutig wie der in (1).) Sprachverstehen als kognitiver Prozess erfolgt im Millisekundenbereich und ist hochgradig routinisiert. Sprachversteher*innen werden der meisten strukturinduzierten Mehrdeutigkeiten dabei nicht einmal gewahr. (Das bedeutet natürlich nicht, dass man nicht mit kognitivem Aufwand, sozusagen philologisch, Mehrdeutigkeiten suchen kann, aber dies ist nicht der lebensweltliche Normalfall, sondern eine Spezialpraxis.) Die Spezialuntersuchung hat denn auch ergeben, dass bis zu etwa einem Viertel aller untersuchten Sätze grammatische Mehrdeutigkeiten der beschriebenen Art aufweisen (Abb. 1). Aber Leser*innen der Bibel stehen nicht in einem Viertel dieser Sätze vor der Schwierigkeit, nicht zu wissen, wie sie sie verstehen sollen.

Abb. 1: Grammatische mehrdeutige und grammatisch eindeutige Sätze in Bibelübersetzungen

Grammatische Mehrdeutigkeiten werden nicht nur meistens nicht bemerkt, die Interpretation, die Sprachversteher*innen der Form eines Satzes zuweisen, ist sogar fast immer auch die richtige, d. h. die von Produzent*innen intendierte. Kasper (2020) hat eine bestimmte Hypothese darüber geprüft, wie Sprachversteher*innen dies gelingt. Der Alltagsverstand sagt, dass der sog. „Kontext“ eines Satzes und unser Wissen über die Welt uns dabei helfen, Sätze richtig zu interpretieren, wenn die grammatische Form die Interpretation nicht vorgibt. Dies scheint für die alltägliche Wirklichkeit auch korrekt, weil Sätze darin kaum kontextlos erscheinen. Dadurch ist die Erklärung aber auch durch die Alltagserfahrung nicht falsifizierbar. Außerdem wird selbst im Alltag über fiktive Welten gesprochen, in der die Plausibilitäten der ausgezeichneten Wirklichkeit (Schütz 1971, Schütz & Luckmann 2017) nicht zu gelten brauchen. Die Hypothese in Kasper (2020) ist daher restriktiver, indem sie den Kontext und das Weltwissen methodisch ausschließt und innerhalb der Satzgrenzen verbleibt. Die Hypothese betrifft das Verstehen grammatisch mehrdeutiger Sätze und besteht aus zwei Teilen. Der erste lautet folgendermaßen:

  1. In einem grammatisch mehrdeutigen Satz ist dasjenige Satzglied, das den höher belebten Gegenstand ausdrückt, das Subjekt/Agens (bei Subjekt–Objekt-Mehrdeutigkeiten) bzw. das indirekte Objekt (bei indirektes Objekt–direktes Objekt-Mehrdeutigkeiten).

Der Ausdruck „höher belebt“ referiert hier auf die sogenannte „Belebtheitshierarchie“ oder „Empathiehierarchie“ in (3). Das ist eine Hierarchie der absteigenden Ähnlichkeit zum Selbst. In hunderten Sprachen lässt sich in verschiedenen Phänomenbereichen Evidenz für sie finden (vgl. Kasper 2020: 180 – 192 et passim). Die Wirksamkeit dieser Hierarchie mutet mythisch an, insofern sie anscheinend entgegen jeder wissenschaftlich-biologischen Taxonomie und eher im Rahmen einer „sympathischen“ oder „solidarischen“ Wirklichkeitssicht die wahrgenommene oder konstruierte (!) Ähnlichkeit zum Selbst als Klassifikationskriterium ausweist.[6] Dessen ungeachtet sind die Belege in modernen Sprachen (und Kulturen) Legion.

(3)

„Belebtheitshierarchie“/„Empathiehierarchie“

Selbst > verwandt > human > belebt > unbelebt > Ort > abstrakt > Masse

Der zweite Teil der Hypothese berücksichtigt die etwaige Gleichheit im Belebtheitsgrad der fraglichen Satzgliedreferenten.

  1. Bei gleicher Belebtheit ist die zuerst ausgedrückte Entität das Subjekt/Agens (bei Subjekt–Objekt-Mehrdeutigkeiten) beziehungsweise indirekte Objekt (bei indirektes Objekt–direktes Objekt-Mehrdeutigkeiten).

Wenn Sprachbenutzer*innen mit dieser Hypothese als „kognitiver Vorannahme“ in die Interpretation von mehrdeutigen Sätzen hineingingen, würden sie in den untersuchten Sprachen und Sprachstufen 95 % bis 100 % von ihnen richtig interpretieren (Abb. 2).

Abb. 2: Durch die Hypothese richtig und falsch vorhergesagte Interpretationen

Die Studie beweist, dass grammatische Mehrdeutigkeiten der dargestellten Art unbewusst richtig interpretiert werden könnten, wenn von den satzinternen Informationstypen Belebtheit und relative Satzgliedreihenfolge Gebrauch gemacht würde.

4.2 Neurolinguistik: Die „actor preference“ im Prozessieren von Sätzen

Neurolinguistische Studien mittels ereigniskorrelierten Potenzialen (EKP) sprechen dafür, dass „kognitive Vorannahmen“ wie die oben genannte nicht bloß Möglichkeit, sondern Wirklichkeit sind (Bornkessel-Schlesewsky and Schlesewsky 2009b; Dröge et al. 2016). In der betreffenden Forschung firmiert diese kognitive Vorannahme als „actor preference“, wobei „actor“ für die Zwecke des vorliegenden Artikels als ‚Agens‘ verstanden werden kann. Anders als Korpusstudien, in denen keine Aussagen über Zeitverläufe in der Interpretation möglich sind, können mittels EKPs Stromspannungsverläufe (mit den Parametern Latenz, Amplitude, Polarität und Topographie), die vom Kortex bis an den Skalp gelangen, dort gemessen und mit den Äußerungskomponenten korreliert werden, die diese Verläufe auslösen (vgl. Bornkessel-Schlesewsky and Schlesewsky 2009a). Indem man sprachliche Stimuli testet, die sich idealiter in nur einer Experimentbedingung unterscheiden, lassen sich die Spannungsverläufe in den Gehirnen der Proband*innen an genau der Stelle einer Äußerung vergleichen, in denen sich die Stimuli in einer kritischen Bedingung unterscheiden. Latenzen, Amplituden, Polarität und Topographie der Spannungen im Kortex sind nämlich nicht absolut interpretierbar, sondern nur im Vergleich zwischen solchen Bedingungen.

Die Studien von Bornkessel-Schlesewsky und Schlesewsky (2009b) sowie Dröge et al. (2016) haben mit anderen Beispielen und methodisch stark kontrollierten Experimentdesigns gearbeitet, aber das Hauptresultat lässt sich an (4) illustrieren. Wenn man Proband*innen mit Sätzen wie in (4) konfrontiert und die kortikalen Spannungen vergleicht, die auftreten, wenn sie den unterstrichenen bestimmten Artikel in a. bzw. b. lesen oder hören, dann ist beobachtbar, dass innerhalb der nächsten Sekunde die Verarbeitung von b. relativ zu a. neuronale Reaktionen auslöst, von denen eine einem bekannten Muster entspricht, das als Verletzung einer (unbewussten) Erwartung, oder Prädiktion, interpretiert wird.

(4)

a. Und von jener Stunde an hat sie…

a. den Jünger…

b. der Jünger…

Durch die systematische Variation verschiedener Experimentaufbauten und ihr Durchtesten lassen sich auch qualitative Aussagen über solche Prädiktionen treffen. Die Erwartungsverletzung in (4b) gegenüber (4a) lässt sich folgendermaßen erklären: Bereits bei der Begegnung mit hat bauen die Proband*innen unbewusst die Prädiktion auf, dass ein grammatisches Subjekt auftreten wird, das den Nominativ trägt und mit hat in Person und Numerus kongruiert. Grundlage dafür ist die Strukturkenntnis der deutschen Satzgrammatik: Wo ein finites Verb ist, ist auch ein Subjekt. Wenn die Proband*innen dann auf sie stoßen, werden sie sie ohne widerstreitende Evidenz als Subjekt interpretieren. Warum sollten sie das tun? Sie ist morphologisch mehrdeutig. Es kann Nominativ oder Akkusativ und damit Subjekt oder Objekt sein; in Bezug auf die Bedeutung kann sie Agens oder Patiens sein. Statistisch sollte also die Hälfte der Proband*innen sie als Subjekt/Agens, die andere Hälfte als Objekt/Patiens interpretieren. Das geschieht aber nicht. Die Frequenz, mit der in der Erfahrung der Proband*innen Subjekte in Sätzen Nicht-Subjekten vorangegangen sind, wird eine Rolle dabei spielen, dass sie sie als Subjekt/Agens statt als Objekt/Patiens interpretieren. Wichtiger aber ist ihre Vorhersage, dass das erste Satzglied, das überhaupt dafür in Frage kommt, das Agens ist. Da sie auch als Nominativ und als Subjekt identifizierbar ist, wird es im Sinne dieser Vorhersage interpretiert. Dass sie auch Akkusativ/Objekt/Patiens sein kann, wird gar nicht bemerkt. Dafür gibt es mindestens einen ökonomischen Grund: Wenn sie das Agens ausdrückt, kann der Satz mit einem nachfolgenden Partizip enden (z. B. … hat sie gesungen.) Wenn sie nicht das Agens ausdrückt und als Objekt identifiziert würde, würde die restliche vorherzusagende Struktur umfangreicher sein, denn die Strukturkenntnis der Grammatik sagt, dass dort, wo ein Objekt ist, auch ein Subjekt ist, und außerdem, dass korrelativ dazu, wo es ein Patiens gibt, ein Agens vorhanden sein muss. Sie wird beiden Sätzen entsprechend dieser Prädiktion als Subjekt interpretiert. Wenn die Proband*innen dann in (4a) den (und noch etwas später Jünger) entdecken, kann dies im Sinne der bereits vorhergesagten Struktur in diese integriert werden: Sie ist ja bereits als Nominativ/Subjekt/Agens interpretiert worden; den (Jünger) signalisiert jetzt sogar eindeutig, dass es sich um Akkusativ und damit Objekt und Patiens handelt und bestätigt damit nachträglich die Vorhersage, dass es sich bei sie um das Subjekt/Agens handelt. Bei der Interpretation von der (Jünger) in (4b) kommt es dagegen zu einem Konflikt: der (Jünger) ist eindeutig als Nominativ markiert. Da die Strukturkenntnis der Satzgrammatik der Proband*innen besagt, dass ein Satz keine zwei Subjekte haben kann, stellen sie (weiterhin unterhalb der Bewusstseinsschwelle) fest, dass ihre Prädiktion falsch gewesen ist, und sie müssen den Satz kognitiv reanalysieren, um feststellen zu können, dass sie nicht Nominativ/Subjekt/Agens gewesen ist, sondern Akkusativ/Objekt/Patiens gewesen sein muss. Die charakteristische neuronale Signatur, die (4b) relativ zu (4a) an der Stelle des bestimmten Artikels auslöst, ist auf diese „Entdeckung“ eines Konflikts mit der eigenen Prädiktion und die anschließende Reanalyse der Satz- und damit der Bedeutungsstruktur zurückzuführen. All dies geschieht innerhalb der Sekunde nach der Wahrnehmung des bestimmten Artikels.

Die Struktur in (4b) verletzt also die „actor preference“, die (unbewusste) Vorhersage, dass das erste morphologisch geeignete Satzglied in einem Satz das Agens (Subjekt) ist.

4.3 Linguistische Pragmatik: die Inferenz der höchstmöglichen Agentivität

Die meisten Menschen reflektieren die Mechanismen ihres Sprachverstehens nie. So bemerken sie auch nicht, dass ein bestimmtes Designmerkmal ihrer Sprachen eine systematische Quelle für Mehrdeutigkeit ist: Die meisten Verben, die ein Agens verlangen, lassen unspezifiziert, ob dieses Agens eine bloß physische Ursache oder aber eine intentional handelnde Person ist. Jedes Verb stellt bestimmte „Ansprüche“ an seine Mitspieler („Valenz“). Um einen wohlgeformten Satz zu bilden, muss die zweistellige Variante des Verbs trinken beispielsweise mit einem Subjekt/Agens und einem direkten Objekt/Patiens ergänzt werden. Das Subjekt/Agens von trinken muss dabei die Merkmale [+belebt], [+mit_Trinkorgan] haben, das Objekt von trinken muss das Merkmal [+flüssig] haben. Außerdem muss das Subjekt/Agens das Merkmal [+willentlich] haben, wenn gelungen von trinken die Rede sein soll. Ob etwas belebt oder flüssig ist oder ein Trinkorgan hat, sind konstante Eigenschaften von Gegenständen. Ob ein Gegenstand etwas willentlich tut, ist dagegen eine dynamische Eigenschaft, die ihm nur relativ zum Verb trinken zukommen muss. Nun ist es so, dass sehr viele Verben im Deutschen zwar ein Agens verlangen, aber den „Grad“ seiner Agentivität offenlassen. Das Verb umwerfen verlangt von seinem Subjekt beispielsweise die dynamische Eigenschaft, dass es physische Kraft ausüben muss. Genau diese Eigenschaft macht auch die Agentivität dieses Mitspielers aus. Dass das grammatische Objekt von physischer Kraft affiziert wird, macht seine „Patientivität“ aus. Dafür muss der Gegenstand solide sein und eine Basis haben, auf der er steht (5).

(5)

a. Der Sturm hat die Blumenkästen umgeworfen.

b. Robert hat die Blumenkästen umgeworfen.

c. Robert hat die Blumenkästen (versehentlich/absichtlich) umgeworfen.

In (5a) ist Sprachbenutzer*innen klar, dass der Sturm insofern ein Agens ist, als er mit seiner physischen Kraft die Blumenkästen so affiziert hat, dass sie umgefallen sind. Die Agentivität des Sturms erschöpft sich aber auch darin, dass er eine physische Ursache ist. Anders in (5b): Ohne widerstreitende Evidenz tendieren Sprachbenutzer*innen (erneut, ohne darüber Rechenschaft ablegen zu können,) dazu, Robert als intentional handelnde Person zu interpretieren, also so, dass Robert das Umfallen der Blumenkästen absichtlich und direkt verursacht hat. Im Vergleich zu (5a) wird dem Subjekt/Agens in (5b) also zusätzlich die dynamische Eigenschaft [+intentional] zugeschrieben. Dass diese Lesart des Subjekts nicht durch das Verb umwerfen erzwungen ist, sondern durch eine pragmatische Inferenz hinzugefügt wird, zeigt schon (5a), aber insbesondere (5c): Die Intentionalität des Agens kann einfach durch Hinzufügen eines Adverbs versehentlich annulliert werden, ohne dass der Satz widersprüchlich würde, oder durch absichtlich ergänzt werden, ohne dass er tautologisch würde. Genau das sollte aber passieren, wenn [+intentional] eine Eigenschaft wäre, die umwerfen von seinem Subjekt/Agens fordert.

Mit anderen Worten, umwerfen wie Myriaden weiterer Verben lässt den Grad an Agentivität seines Subjekts offen. Bei der Interpretation inferieren Sprachbenutzer*innen aber (unbewusst) den höchstmöglichen Grad an Agentivität – intentionales Handeln –, sofern das Subjekt die geeigneten konstanten Merkmale aufweist ([+human]; Holisky 1987; van Valin und Wilkins 1996).

4.4 Sprachtypologie: Die häufigste Reihenfolge von Agens und Patiens sprachenübergreifend

Der World Atlas of Language Structures (WALS) kartiert strukturelle Merkmale von Sprachen auf der Basis verfügbarer Sprachbeschreibungen (Dryer & Haspelmath 2013). Insgesamt sind 192 verschiedene Strukturmerkmale von Sprachen kartiert und von 2600 verschiedenen Sprachen ist mindestens eines dieser Strukturmerkmale im WALS enthalten.

Eins der erfassten Strukturmerkmale ist die „Reihenfolge von Subjekt, Objekt und Verb“ in transitiven Aussagesätzen (Dryer 2013a). Transitive Sätze sind solche, in denen das lexikalische Vollverb durch ein prototypisches Agens und ein prototypisches Patiens ergänzt werden muss, wie in Die Frau nimmt den Hammer. Mit der relativen Reihenfolge dieser Satzelemente hat es folgende Bewandtnis: Es gibt sechs logisch mögliche Reihenfolgen zwischen diesen drei Elementen (3 Fakultät).[7] Dabei gibt es Sprachen, in deren transitiven Hauptsätzen nur eine dieser Reihenfolgen wohlgeformt ist (darunter Englisch: SVO). In anderen Sprachen sind mehrere Reihenfolgen wohlgeformt (beispielsweise Deutsch). Unter diesen Sprachen gibt es wiederum viele, in denen eine der möglichen Reihenfolgen insgesamt häufiger verwendet wird oder in mehr sprachlichen Kontexten angemessen ist als die anderen (für Deutsch: SVO). Die bis hierhin genannten Sprachtypen rechtfertigen also die Angabe einer „dominanten“ Reihenfolge von Subjekt, Objekt und Verb (vgl. Dryer 2013b zu den Kriterien der „Dominanz“). Einen Rest bilden Sprachen, in denen mehrere Reihenfolgen möglich sind, ohne dass eine dominante identifizierbar wäre.

Sodann stellt sich die Frage, was mit „Subjekt“ und „Objekt“ sprachenübergreifend gemeint ist. Eine solche Definition gestaltet sich theoretisch tatsächlich schwierig. Dryer (2013a: o. S.) behilft sich mit einer semantischen Charakterisierung, derzufolge mit „Subjekt“ das „mehr agenshafte“ und mit „Objekt“ das „mehr patienshafte“ Satzglied gemeint ist. Das heißt, das erfasste Strukturmerkmal ist eigentlich die dominante Reihenfolge des Satzglieds, das das Agens ausdrückt, des Satzglieds, das das Patiens ausdrückt, und des Verbs in transitiven Aussagesätzen. Die Verteilung der sechs möglichen dominanten Reihenfolgen auf die erfassten Sprachen ist in Tab. 1 wiedergegeben (inklusive der Sprachen ohne dominante Reihenfolge; A = Agens, P = Patiens, V = finites Verb).

Wenn von der relativen Position des Verbs abgesehen wird, zeigt sich, dass in über 80 % der erfassten Sprachen die Reihenfolge mit einem vorangehenden Agens die dominante ist. In nur etwa 3 % der Sprachen ist eine Reihenfolge mit vorangehendem Patiens die dominante Reihenfolge.

Tab. 1:

Dominante Reihenfolgen von Agens, Patiens und Finitum im WALS

APV

AVP

VAP

VPA

PVA

PAV

564

488

95

25

11

4

1147

(83.4 %)

40

(2.9 %)

keine dominante Reihenfolge: 189

(13.7 %)

4.5 Der gemeinsame Nenner: eine Agens-Präferenz als sprachkognitive Heuristik

Ein gemeinsamer Nenner der vorangegangenen Befunde lässt sich leicht ermitteln: In sprachlich ausgedrückten Ereignissen hat das Agens eine privilegierte Stellung für die menschliche Kognition. Zwei Aspekte lassen sich dabei unterscheiden. Erstens spielt das Agens eine besondere Rolle in der Sprache dahingehend, dass Sprachbenutzer*innen unbewusst „darauf aus sind“, es im zeitlichen Verlauf einer Äußerung so früh wie möglich zu identifizieren. Dies zeigt sich in der Korpusstudie in der Rolle der Reihenfolge bei gleicher Belebtheit der Satzgliedreferenten, in den neurolinguistischen Studien darin, dass das erste geeignete Satzglied prädiktiv als Agens identifiziert wird, und in der Sprachtypologie in der hochgradig dominanten Abfolge mit vorangehendem Agens.

Zweitens ist qualitative Ausgestaltung der Agensrolle kognitiv relevant. Die semantische Rolle des Agens ist eine prototypische Rolle, die von „bloßen“ physischen Ursachen für Ereignisse über nicht-intentionales menschliches Verursachen bis hin zu kontrolliertem, intentionalem Handeln reicht. Wo immer es keine offene, widerstreitende Evidenz gibt, inferieren Sprachbenutzer*innen bei einem identifizierten Agens zugleich auch die höchstmögliche Agentivität. Dies zeigen linguistisch-pragmatische Studien.

Beide Aspekte lassen sich als unbewusste, präreflexive kognitive Prädiktionen fassen: „Das erste geeignete Satzglied wird ein Agens sein. Das als Agens identifizierte Satzglied wird eine intentional handelnde Person sein.“ Es ist von entscheidender Wichtigkeit, dass diese Annahmen bereits getätigt werden, bevor Äußerungen zu Ende geführt sind. Die Annahmen bestätigen sich (oder nicht) zu einem späteren Zeitpunkt (wie in (4) oben.) Diese zum Zeitpunkt der Zuschreibung noch nicht bestätigbaren Eigenschaften werden vorhergesagt auf Basis der zum Zeitpunkt der Wahrnehmung wahrnehmbaren Merkmale. Im Falle sprachlicher Ausdrücke sind dies ihre grammatischen (Kasus, Kongruenz, relative Position) und lexikalisch-semantischen Eigenschaften (beispielweise Belebtheit). Daher kann die Prädiktion auch als Inferenz beschrieben werden. Die Inferenz operiert sozusagen auf der Basis unvollständiger Daten und ist auf Effizienz angelegt, das heißt, auf einen Ausgleich zwischen Akkuratheit und Aufwand. Sie ist daher nicht statistisch akkurat. Aus diesem Grund entspricht sie eher einer (sprach‐)kognitiven „Heuristik“ (vgl. Moskowitz 2006, Kapitel 4 und 5).

5 Übertragung auf Gehlens Anthropologie

Im Folgenden sollen die Relevanz und die Konsequenzen der linguistischen Befunde für die Anthropologie Gehlens schrittweise entwickelt werden.

5.1 Gehlens „Vorsicht“ und „Vorsehung“ und „die Präferenz für verantwortliche Ursachen“

Woher rührt die herausgehobene Stellung des linguistisch-semantischen Agens für die Sprachkognition? Warum gibt es diese Agens-Präferenz? Wie ist die Heuristik motiviert? Bereits Gehlen konstatierte, dass dem Menschen „ein Überraschungsfeld unvorhersehbarer Struktur [gegenübersteht], das erst in ‚Vorsicht‘ und ‚Vorsehung‘ durchgearbeitet, d. h. erfahren werden muß.“ (M, 36) Wie kommt es zu Vor-Sicht und Vor-Sehung?

Je tiefer und gekonnter ein Bezirk von Situationen von uns beherrscht ist, um so mehr treten die Wahrnehmungen zugunsten ganz bestimmter Erwartungsfolgen zurück, die in unseren Bewegungen ebenso niedergeschlagen sind wie in dem symbolischen, abgekürzten Anblick der Dinge. (M, 223)

Die Erwartung als Vorstellung zu erwartender Wahrnehmungseindrücke ist hier eine „passive Einbildungskraft“.

Die biologische Funktion der passiven Einbildungskraft wird […] sehr deutlich: der Organismus scheint deshalb die schon durchlaufenen Zustände in sich aufzuheben, um ähnlichen Lage bereits angepaßt und sozusagen vorbereitet begegnen zu können. Ist dies übrigens so, dann müßte man erwarten, daß die Erinnerungsfähigkeit um so vollkommener sein wird, je größer die Chance ist, von unerwarteten und überraschenden Situationen betroffen zu werden, je weltoffener und welt-ausgesetzter also ein Wesen ist. So ist es beim Menschen. Nun hat aber die aktive Erwartungsphantasie, die in die Zukunft stößt, als ihr Material nur den Inbegriff des schon Erfahrenen, und daher geschieht die Führung unserer Existenz in die Zukunft immer mit unzureichenden Mitteln, weil diese Zukunft, anstatt bloße Wiederholung der Vergangenheit zu sein, vielmehr voll ist von einer Unendlichkeit nicht zu erwartender Ereignisse und nicht zu ermessender Sachverhalte: sie ist ‚dunkel‘, und das um so mehr, je weiter weltoffen ein Wesen ist. (M, 295 – 296)

Die zentrale These ist nun, dass die Agens-Präferenz exakt zu dieser „Vorsicht“ und „Vorsehung“ gehört, von der Gehlen spricht und mit der der Mensch dem Überraschungsfeld gegenübertritt, das die Wirklichkeit für ihn bereithält. Der nachfolgende Gedanke ist daher bei Gehlen schon angelegt, im Bannkreis der Klassischen Ethologie hat er vielleicht noch nicht die Mittel gehabt, ihn zu denken. Mit Vorsicht und Vorsehung dem Überraschungsfeld gegenüberzutreten heißt für Gehlen letztlich, die Wirklichkeit praktisch ins Lebensdienliche umzugestalten. Dies geschieht, wenn man die Stufen des Leistungsaufbaus betrachtet, die sein System bietet (s. Abschnitt 2), auf allen Entlastungsstufen mit je eigenen Zeitskalierungen, der Übertritt von der einen zur anderen ist aber auch der Übertritt von der passiven zur aktiven Einbildungskraft. Um mit den höchsten zu beginnen: Institutionen wie Staat, Kirche, Sitte und Technik stellen die Versorgung mit allem Lebensnotwendigen, stellen Lebenssicherungen und Triebsublimierungen in Zeiträumen von Dezennien bis Millennien in „Hintergrundserfüllung“ (US, 50) auf Dauer. (Aktive) Vorstellung und das Interaktionsmedium Sprache erlauben Ausprägungen von Vorsicht und Vorsehung, die es dem Menschen über Zeiträume von Minuten bis Jahren ermöglichen, die Zukunft handelnd zu entwerfen und Entwürfe interaktiv zu realisieren. Aber auch auf der Entlastungsstufe des Auges (und zu ergänzen: des Ohrs) werden Vorsicht und Vorsehung realisiert, aber anders als auf den höheren Stufen passiv, das heißt automatisch, und im vorreflexiven Zeitbereich von Millisekunden.

Tab. 2:

Zeitskalisierungen der Vorsicht/Vorsehung nach Entlastungsstufen

Entlastungsstufe

Zeitskalierung

Erklärung

Institutionen

~ Dekaden bis Millennien

Hintergrundserfüllung

Sprache

~ Sekunden bis Jahre

interaktive Handlungslenkung

Vorstellung

~ Sekunden bis Minuten

planendes Handeln

(Hand‐)Auge

~ Millisekunden

sensomotorischer Funktionskreis

Zwei Szenarien mögen dies illustrieren: Eine Person fährt im Auto auf der Straße und nimmt in 200 Meter Entfernung ein Reh im Bereich der Fahrbahn wahr. Sie wird innerhalb von Millisekunden auf Basis der Umgangs- und Gebrauchswerte des Wahrnehmungsgegenstandes vorhersagen, was das Reh als nächstes tun wird – beispielsweise die Trajektorie seiner Bewegung vorausberechnen –, und ihr eigenes Tun in Abhängigkeit von der Prädiktion regulieren. Ein anderes Szenario: Beim Fußball dribbelt eine Stürmerin der einen Mannschaft auf die Abwehrspielerin der anderen Mannschaft zu. In Abhängigkeit der jeweils wahrnehmbaren Bewegungen werden die Spielerinnen wechselseitig vorhersagen, was die jeweilige Kontrahentin als nächstes tun wird, und ihre eigenen Bewegungen in Abhängigkeit dieser Prädiktion ausführen.

Der Mensch ist ein prädiktives Lebewesen, das in jedem wachen Moment in den Situationen, in denen es sich befindet, versucht, die Vorhersagbarkeit dessen, was passieren wird, zu maximieren, um sich (a) vor Gefahr zu schützen und um (b) handlungsfähig zu bleiben. Auch das lässt sich als kognitive Heuristik formulieren, für das es unabhängige, nichtsprachliche Evidenz gibt. Kasper (2015, 2020) charakterisiert sie als „Präferenz für verantwortliche Ursachen“ (im Folgenden „PfU“) folgendermaßen:

In der Wahrnehmung von Ereignissen gehen Menschen beim ersten geeigneten Gegenstandskandidaten davon aus, dass er die Ursache dessen ist, was gerade passiert, und nicht nur das, sondern auch davon, dass es sich bei ihm – wenn immer seine Merkmale es zulassen – um eine verantwortlich handelnde Person als Ursache handelt. (vgl. Kasper 2015: 364 – 375; Kasper 2020: 261 – 264)

Erwägt man vor dem Hintergrund der Gehlenʼschen Anthropologie, was die PfU leistet, lässt sich ersehen, dass sie ganz in seinem Sinne ist. Sie stellt die größtmögliche Minimierung der Überraschungen im Wahrnehmungsfeld dar, die einem weltoffenen Wesen angesichts der „Unendlichkeit nicht zu erwartender Ereignisse“ (M, 296) möglich sind. Sie lässt den Menschen die Ursachen von Ereignissen prädiktiv identifizieren und die Ereignisse dadurch so berechenbar wie möglich machen. Am berechenbarsten sind für Menschen „verantwortliche Ursachen“, mit anderen Worten, intentional handelnde Personen, denn wenn die Intentionen von Personen bekannt sind, lässt sich mit verhältnismäßig hoher Wahrscheinlichkeit vorhersagen, was sie tun werden – „verhältnismäßig“ deswegen, weil Handeln im Sinne soziologischer und konstruktivistisch-philosophischer Handlungstheorien prinzipiell nicht zuverlässig vorhersagbar ist (vgl. Luckmann 1992, Hartmann 1996, Janich 2014). Wenn es sich „bloß“ um physische Ursachen wie fliegende Steine oder nicht-intentionales Verhalten wie Fallenlassen, Anstoßen oder Ähnliches handelt, besteht die Möglichkeit, dass noch etwas anderes die Bewegungen dieser Ursachen verursacht hat. Wenn ein Stein auf jemanden zufliegt, dann weicht die Person ihm reflexhaft aus (passive Einbildungskraft), aber 500 Millisekunden später wird sie sich daran machen, die ultimate Ursache für das Fliegen des Steins zu suchen (aktive Erwartungsphantasie).

Die PfU findet sich in verschiedenen Ausprägungen und mit unterschiedlichen Perspektivierungen in mehreren Disziplinen, die es mit humanökologischen Fragen zu tun haben, mit Fragen also, die den Menschen zugleich als wahrnehmendes und sich verhaltendes sowie handelndes Wesen betrachten. So finden sich Varianten der PfU beispielsweise im Kontext der Theory of Mind (vgl. Frith & Frith 2003, Rutherford & Kuhlmeier 2014) und bereits in Jonesʼ & Davisʼ (1965) bahnbrechenden Forschungen zur sozialen Attribution. Die letzteren beiden konstatieren, dass

[t]he person perceiver’s fundamental task is […] to find sufficient reason why the person acted […]. Instead of a potentially infinite regress of cause and effect […] the perceiver’s explanation comes to a stop when an intention or motive is assigned that has the quality of being reason enough […].“ (Jones & Davis 1965: 220)

Klassisch-ethologisch rekonstruiert, löst die Wahrnehmung von Bewegungsereignissen die Prädiktion verantwortlicher Ursachen aus, die dabei die Form eines kognitiven Verhaltensschemas hat. Im Unterschied zur Klassischen Ethologie ist das Verhaltensschema (interne Prädiktion, Inferenz) ein kognitives anstatt ein physisches, und die Klasse der auslösenden Stimuli ist maximal unspezifisch. Darunter fallen alle wahrgenommenen Bewegungsereignisse, die nicht von der 1. Person intentional ausgeführt werden. Moderner interpretiert, besteht die Prädiktion in einem intern repräsentierten Modell eines Wirklichkeitsausschnitts, dessen Realisierung antizipiert wird und mit dem die mittels physischer Aktivität hergestellten wirklichen Situationen stetig und im Millisekundenbereich abgeglichen werden, wobei das Modell auch ständig auf Basis neuer Informationslagen „upgedatet“ wird (vgl. Kunde 2006). Die Leistung der PfU als Heuristik ist die effektive Aufrechterhaltung der eigenen körperlichen Unversehrtheit sowie die Aufrechterhaltung bzw. (Wieder‐)Herstellung der eigenen Handlungsfähigkeit in einer im Fluss befindlichen Wirklichkeit.

Trotz der Notwendigkeit ihrer transparadigmatischen Charakterisierung (s. Abschnitt 3) sollte die PfU als unbewusste, kognitive Heuristik die Kriterien eines „Instinktresiduums“ erfüllen. Warum nur eines Residuums? An der PfU wurden zwei Aspekte unterschieden (s. Abschnitt 4.5): erstens die schnellstmögliche Identifikation einer Ereignisursache und zweitens die qualitative Ausgestaltung der Ursache als möglichst agentive im Spektrum zwischen bloß physischen Ursachen bis hin zu verantwortlich handelnden Personen. Was den ersten Aspekt betrifft, so sind auch Tiere, nämlich Fluchttiere, wachsam und überwachen etwaige Bewegungen in ihrer Umwelt. (Die Rede von Ursachen verbietet sich hier aufgrund der begrifflichen Zuschreibungen an Tiere, die damit verbunden sind.) Der zweite Aspekt betrifft exklusiv menschliche Kategorien. Es ist der spezifisch menschliche „Hiatus“ zwischen Wahrnehmungseindruck und motorischem Ausdruck, der konzeptuelle Differenzierungen zwischen Absicht und Versehen, Reflexion und Affekt mit sich bringt. Ohne diesen Hiatus ist ein Träger einer Bewegung (eine Ursache) so gut wie jeder andere. Doch das Lebewesen, das diesen Hiatus lebt, ist auf die Differenzierung zwischen idealtypischen und nicht idealtypischen Agentia angewiesen. An der Stelle, an der beim Tier nach der Detektion der Bewegung, also nach Stufe 1 der Präferenz, automatisches Verhalten anspringt – Warnen per Ruf, Einfrieren oder Fliehen –, sind die Regungen des Menschen weniger spezifisch, weniger festgelegt und weniger motorisch, und damit bereits „im“ Hiatus zu verorten, in der aktiven Erwartungsphantasie, wenn auch in hochgradig routinisierter Weise. Das prädiktive „Springen“ auf die höchstmögliche Agentivität der identifizierten Ursache – Stufe 2 der Präferenz – ist nämlich bereits durch kognitiven Aufwand block- oder widerrufbar (vgl. Moskowitz 2005, Kap. 5). In der Terminologie von Kahneman (2012) handelt es sich beim Ausgehen von größtmöglicher Agentivität um einen System 1-Prozess, der durch aufwändige System 2-Prozesse geblockt werden kann.

5.2 Die Agens-Präferenz als sprachspezifische Ausprägung der Präferenz für verantwortliche Ursachen

Im vorangegangenen Abschnitt wurde bereits die These erwähnt, dass die Agens-Präferenz in der Sprache im Rahmen der „Vorsicht“ und „Vorsehung“ betrachtet werden muss, von der Gehlen selbst spricht und mit der der Mensch dem Überraschungsfeld der Wirklichkeit gegenübertritt. Die kognitive Operationalisierung von Vorsicht und Vorsehung wurde als Präferenz für verantwortliche Ursachen dann allerdings auf der Leistungsstufe der „Hand“ expliziert, das heißt mit Bezug auf den sensomotorischen Funktionskreis, anstatt auf der Leistungsstufe der Sprache. Dabei wurde die PfU als „Instinktresiduum“ rekonstruiert, das die Gehlenʼsche These von der Unspezialisiertheit des Menschen relativiert. Der Bezug der PfU zur Agens-Präferenz in der Sprache soll im Folgenden noch einmal als These expliziert werden: Die Agens-Präferenz in der sprachlichen Interpretation stellt die sprachspezifische Ausprägung der Präferenz für verantwortliche Ursachen bei der nichtsprachlichen Ereigniswahrnehmung dar und ist in diesem Sinn dasselbe Instinktresiduum. Die behauptete Beziehung lässt sich in zwei Schritten plausibilisieren. Zunächst werden die beiden Präferenzen auf inhaltliche Übereinstimmung geprüft. Tab. 3 zeigt, dass eine solche Übereinstimmung vorliegt.

Tab. 3:

Inhaltliche Übereinstimmungen zwischen der sprachkognitiven und der allgemeinkognitiven Präferenz

Agens-Präferenz in der sprachlichen Interpretation (vgl. Abschn. 4.5)

Präferenz für verantwortliche Ursachen in der nichtsprachlichen Ereigniswahrnehmung

Agensidentifikation:

Das früher geäußerte oder wahrgenommene Satzglied wird bei Abwesenheit widerstreitender Evidenz als Agens identifiziert, wenn es seine grammatischen Merkmale zulassen (was in mehrdeutigen Äußerungen der Fall ist).

Identifikation der Ursache:

Der erste geeignete Gegenstandskandidat in einem wahrgenommenen Ereignis wird bei Abwesenheit widerstreitender Evidenz als Ursache identifiziert, wenn es seine wahrnehmbaren Merkmale zulassen.

Agensausprägung:

Das als Agens identifizierte Satzglied wird bei Abwesenheit widerstreitender Evidenz als intentional handelnde Person interpretiert, wenn der Satzgliedreferent das lexikalische Merkmal [+human] aufweist.

Ausprägung der Ursache:

Der als Ursache identifizierte Gegenstand wird bei Abwesenheit widerstreitender Evidenz als verantwortliche Ursache interpretiert, wenn er als inhärentes Merkmal [+human] aufweist.

Im zweiten Schritt muss plausibilisiert werden, dass die sprachlich-symbolische Agens-Präferenz eine spezifischere Instanziierung der allgemeineren PfU ist. Dafür muss die Beziehung zwischen den Präferenzen in zwei Dimensionen reflektiert werden: der medialen und der phänomenalen. Entgegen der in der Grammatiktheorie lange vorherrschenden Sicht der Chomskyʼschen Linguistik hat sich in den letzten 20 Jahren verstärkt die Auffassung durchgesetzt, dass das kognitive Format von Interpretationen sprachlicher Äußerungen nicht bloß ein Rechnen mit bedeutungslosen Symbolen, eine „Sprache des Geistes“ ist, sondern modale Repräsentationen evoziert. Das heißt, eine Äußerung ist für Sprachbenutzer*innen gewissermaßen eine grammatisch geordnete Anleitung, die Wahrnehmung des sprachlich kodierten Ereignisses zu simulieren. Simulation heißt in diesem Fall, dass die Sprachbenutzer*innen eine im Kortex lokalisierte, „bildhafte“, also analoge Vorstellung dessen haben, was durch den Satz ausgedrückt wird. Die Simulation erstreckt sich dabei sogar auf Regionen des Motorkortex (Kasper 2015: 130 – 137). Das heißt, sprachliche Interpretation ist zurückgebunden ist an die Sensomotorik, an Hand (plus Auge), die unterste Stufe des Gehlenʼschen Leistungsaufbaus. Ganz im Sinne Gehlens entpuppt sich die Sprache als sensomotorisches System, nicht nur in Bezug auf ihre Ontogenese, sondern auch in Bezug auf ihre Performanz. Die Interpretation eines Satzes ist das teilweise, verkörperte Vorstellen und Nacherleben dessen, was er ausdrückt.

Damit muss nun aber eine These Gehlens relativiert werden, nämlich die der stetigen Herabsetzung des Umweltkontakts entlang der Entlastungsstufen. Wenn sprachliche Äußerungen Sprachbenutzer*innen dazu anleiten, Wahrnehmungen und Handlungen zu simulieren, dann ist der Umweltkontakt, also der Kontakt zu dem, was sprachlich ausgedrückt wird, zwar medial tatsächlich herabgesetzt, denn die Laute oder Buchstaben (oder manuellen Gesten der Zeichensprachen) sind nicht das, was sie ausdrücken, aber phänomenal bleibt der Umweltkontakt bestehen: Was die Äußerung ausdrückt, wird in verkörperter Weise in seiner Wahrnehmung und Ausführung simuliert (Tab. 4).

Tab. 4:

Die Herabsetzung des Umweltkontakts erfolgt nur medial, nicht phänomenal

Medial

Phänomenal

Herabsetzung des Umweltkontakts

Simulation des Umweltkontakts

Symbole sind nicht die Wahrnehmungsphänomene

Symbole leiten zur Simulation der Wahrnehmungsphänomene an

Vor diesem Hintergrund wird nun begreiflich, inwiefern die Agens-Präferenz nur die sprachspezifische Ausprägung der allgemeineren PfU darstellt: Weil Sprachbenutzer*innen auf der Basis von Sätzen Wahrnehmungen simulieren, löst die Konfrontation mit ihrem Inhalt die PfU aus. Entsprechend versuchen die Sprachbenutzer*innen, im ersten geeigneten simulierten Gegenstand, den sie vor das „innere Auge“ bekommen, eine verantwortliche Ursache zu identifizieren. Die sprachspezifische Ausprägung von verantwortlichen Ursachen ist 1. das frühestmögliche Auftreten des Gegenstands im Ereignis, sprich, das erste Satzglied im Satz zu sein – weil Ursachen Wirkungen vorangehen (Tab. 3), und 2. höchstmögliche Belebtheit – denn je höher ein Gegenstand auf der Belebtheitsskala in (3) steht, desto wahrscheinlicher ist er eine verantwortliche Ursache, ein intentionales Agens (Kasper 2015: 275). Mit anderen Worten, die Präferenz für verantwortliche Ursachen läuft als Instinktresiduum durch die Entlastungsstufen hindurch und zeigt sich auch noch auf der höchsten Stufe des menschlichen Leistungsaufbaus, der Sprache. Um dies sichtbar zu machten, bedurfte es der Untersuchung grammatisch mehrdeutiger Sätze.

5.3 Die Präferenz für verantwortliche Ursachen als spezialisierte Unspezialisiertheit

Der Mensch ist morphologisch, d. h. in seiner organismischen Form und Struktur unspezialisiert und er ist korrelativ dazu instinktarm in seinem Verhalten. Die Hypothese hat weiterhin Bestand. Die PfU, die sich als kognitive Prädiktion auf Basis einer kognitiven Heuristik äußert, ändert an diesem grundsätzlichen Befund ebenso wenig wie Gehlens Anerkennung menschlicher Instinktresiduen nach dem ersten Hauptwerk. Hier ist aber eine Präzisierung vonnöten. Der Mensch mag weder vorgefertigte Verhaltensrezepte auf der Wirkseite noch vorgefertigte Hinsichten auf die Wirklichkeit auf der Merkseite des Funktionskreises haben. Dies trifft allerdings nur so lange zu, wie man die höheren Aufbaustufen menschlicher Leistungen in den Blick bekommt, also so lange, wie man die Handlung (im Unterschied zum bloßen Verhalten) und damit auch die größeren Zeitskalierungen in Hinsicht auf Vorstellung (als aktive Erwartungsphantasie im Dienste planenden Handelns), Sprache und Institutionen in den Blick bekommt. Was die PfU in ihrer sprachspezifischen Ausprägung als Agens-Präferenz aber illustriert, ist, dass sich das kognitive Verhaltensschema in vorgefertigten physischen Reaktionen – Hirnreaktionen – im Millisekundenbereich äußert, die man ohne Weiteres nicht in den Blick bekommt, die daher der alltäglichen Beobachtung enthoben sind, präreflexiv sind und erfolgen, bevor ein Wahrnehmungseindruck aspektvereinseitigt werden kann, mit anderen Worten, bevor er als etwas (nämlich als verantwortliche Ursache) erkannt werden konnte. Die Hirnreaktionen indizieren die Überraschung im Überraschungsfeld, den Verstoß gegen eine passive Einbildungskraft auf der untersten Stufe des menschlichen Leistungsaufbaus mit der kleinsten Zeitskalierung. Wie erwähnt, liegt aber schon der zweite Aspekt der PfU, die Prädiktion größtmöglicher Agentivität, nicht mehr im Bereich des bloßen automatischen Verhaltens, sondern kann mit kognitivem Aufwand überwunden werden. Wo andere Lebewesen in Verhaltenskreisen hoher Dauer gebunden bleiben, „biegt“ der Mensch also schon binnen einer Sekunde vom bloßen Verhalten infolge einer Überraschung wieder „in den“ Handlungskreis „ein“, in den der vormals überraschende Reiz, nachdem er aspektvereinseitigt (das heißt, erkannt) wurde, eingegliedert wird (vgl. Kasper 2020: 245 – 261). Dieser Kontrast mag noch einmal die Rede von einem „Residuum“ vorgefertigter Verhaltensrezepte rechtfertigen.

Gehlens Entwurf möchte die Frage nach den „Existenzbedingungen“ des Menschen beantworten: „[V]or welchen Aufgaben steht ein solches Wesen, wenn es einfach sein Leben erhalten, sein Dasein fristen, wenn es seine bare Existenz durchhalten will?“ (M, 11 – 12) Vor dem Hintergrund dieser Frage und vor dem Hintergrund der Diagnose vom morphologischen Mängelwesen erscheinen die obigen Befunde um die PfU noch einmal in neuem Licht: Nicht nur residuiert die PfU noch phänomenal in der höchsten Entlastungsstufe des Menschen, der Sprache, sondern sie ist auch Existenzbedingung eines weltoffenen Wesens. Wie sollte dieses Wesen sonst mit dem konkret-dringlichen, aber zugleich hinsichtslosen Überraschungsfeld der Wirklichkeit fertig werden als durch Vorsicht und Vorsehung selbst auf der untersten, sensomotorischen Stufe des Leistungsaufbaus? Die kognitiven und physischen Regungen im Kontext der PfU sind noch keine Handlungen, aber sie sichern dem Menschen seine Existenz als handelndes Lebewesen. Insofern komplementiert die Heuristik der PfU als kognitive Spezialisierung die morphologische Unspezialisiertheit des Menschen. So gesehen, ist der Mensch auf Unspezialisiertheit spezialisiert.

6 Animal symbolis interveniens

Bis hierhin hat die Sprache primär als Exempel gedient, an dem sich illustrieren ließ, wie sich eine kognitive Heuristik, gedeutet als Instinktresiduum, noch auf der höchsten Entlastungsstufe zeigt, so dass Gehlens These von der Herabsetzung des Kontakts mit der Wirklichkeit entlang der Entlastungsstufen einer Relativierung bedurfte. Im Folgenden soll die Sprache, genauer die Grammatik als eine ihrer Komponenten, stärker zu ihrem Eigenrecht kommen. Am Ende wird eine neue These über die Rolle der Grammatik im menschlichen Selbst- und Weltverhältnis stehen (vgl. Kasper 2020, Kap. 4.5). Die Entwicklung der These geht von den korpuslinguistischen Befunden aus Abschnitt 4.1 aus: Sätze, die mehrdeutig dahingehend sind, welches Satzglied Subjekt/Agens oder Objekt/Patiens, indirektes oder direktes Objekt ist, können über Belebtheitsunterschiede und bei gleicher Belebtheit über die Reihenfolge der Satzglieder richtig interpretiert werden. Diese beiden Merkmale hatten sich als sprachliche Indizien der außersprachlich motivierten Präferenz für verantwortliche Ursachen entpuppt.

Hier wird noch einmal bedeutsam, warum die Befunde der jüngeren Linguistik weitgehend auf grammatisch mehrdeutigen Sätzen basieren mussten. Die Effektivität der Faktoren Belebtheit und Reihenfolge für die richtige Interpretation eines Satzes kann sich nämlich nur dort zeigen und nur dort nachgewiesen werden, wo grammatische Mechanismen, die Signalwert für die Interpretation haben, entweder abwesend oder trotz Anwesenheit nicht informativ sind. Die grammatischen Mechanismen, die die Interpretation der syntaktischen Funktionen und semantischen Rollen signalisieren, sind im Deutschen Kasus und Kongruenz, im Englischen Kasus (bei den Pronomen), Kongruenz und Satzgliedreihenfolge. Wo beispielsweise im Deutschen die Exponenten zweier Kasus ununterscheidbar sind, ist das Signalsystem prinzipiell vorhanden, aber nicht informativ (der Apfel [Nominativ] – den Apfel [Akkusativ], aber die Birne [Nominativ] – die Birne [Akkusativ]).

Was dagegen mit der Präferenz für verantwortliche Ursachen, das heißt mit den Erwartungen eines Belebtheitsgefälles und einer Satzgliedreihenfolge geschieht, wenn Sprachversteher*innen nicht mit grammatisch mehrdeutigen, sondern mit grammatisch eindeutigen Sätzen konfrontiert werden, ist Folgendes: Sie simulieren die Wahrnehmung des Ereignisses, zu dem die morphologischen Formen und (im Falle des Englischen die) syntaktischen Reihenfolgen, sprich: die Grammatik, sie anleitet, und nicht, wozu die Belebtheitsmerkmale und die Reihenfolge, wenn sie frei wäre, sie anleiten!

Von zentraler Bedeutung ist aber die Tatsache, dass die Sprachversteher*innen auch in diese Sätze die Präferenz für verantwortliche Ursachen mit hineinbringen. Die instinktive Ausgangserwartung an den Satz ist weiterhin, dass das Agens höher belebt ist und bei gleicher Belebtheit als erstes Satzglied kommen wird. Bei Konfrontation mit einem konkreten Satz mit eindeutigen morphologischen Formen und gegebenenfalls festen syntaktischen Reihenfolgen kann nun zweierlei geschehen:

Erstens können die eindeutigen grammatischen Signale zu einer simulierten Wahrnehmung anleiten, zu der auch schon die Präferenz für verantwortliche Ursachen geführt hätte, also so, dass das höher belebte Satzglied oder bei gleicher Belebtheit das erstgenannte Satzglied auch grammatisch eindeutig als Subjekt und damit Agens markiert ist (Unterstreichung = eindeutige Form):

(6a)

Die Bürgermeisterin

sieht

den Lehrer.

NOM/AKK

3SG

AKK

gleiche Belebtheit, erstgenanntes Satzglied = Subjekt/Agens

(6b)

Er

isst

gern

Brot.

NOM

3SG

NOM/DAT/AKK

höher belebtes & erstgenanntes Satzglied = Subjekt/Agens

(6c)

… nachdem

die Feuerwehr

den Brand gelöscht

hat.

NOM/AKK

AKK

3SG

höher belebtes & erstgenanntes Satzglied = Subjekt/Agens

Zweitens können die grammatischen Signale zu einer simulierten Wahrnehmung anleiten, die von derjenigen, zu der die Präferenz für verantwortliche Ursachen geführt hätte, unterschieden ist, so dass das höher belebte Satzglied oder bei gleicher Belebtheit das erstgenannte Satzglied grammatisch eindeutig nicht als Subjekt und damit Agens markiert ist:

(7a)

Die Bürgermeisterin

sieht

der Lehrer.

NOM/AKK

3SG

NOM

gleiche Belebtheit, letztgenanntes Satzglied = Subjekt/Agens

(7b)

Die Kugel

traf

den Jungen.

NOM/AKK

3SG

AKK

niedriger belebtes & erstgenanntes Satzglied = Subjekt/Agens

(7c)

Den Jungen

traf

die Kugel.

AKK

3SG

NOM/AKK

niedriger belebtes & letztgenanntes Satzglied = Subjekt/Agens

Wenn die gemäß der PfU instinktiv simulierte Wahrnehmung mit der grammatisch hergestellten konfligiert (wie an der Stelle der in [7a], den in [7b] und Den in [7c]), dann geschieht außer in sehr speziellen historischen Konstellationen nur eins: Die eindeutigen morphologischen Formen, und wenn es sie gibt, die eindeutigen syntaktischen Reihenfolgen „gewinnen“. Grammatische Signalisierungsmittel sind grundsätzlich verbindlicher als außergrammatisch motivierte Präferenzen wie die PfU.

Weil die jüngere grammatiktheoretische Forschung sich lange Zeit nicht für das Außersprachliche, das heißt die ökologische oder anthropologische Dimension der Grammatik interessiert hat, hat sie auch in ihrer Theoriebildung nicht Kenntnis davon genommen, dass Sprachbenutzer*innen keine leeren Gefäße sind, die erwartungslos Sätze in sich aufnehmen, sondern mit bestimmten, eben anthropologisch oder humanökologisch begründbaren Ausgangserwartungen in die Interpretation von Äußerungen hineingehen. Die {P,p}hilosophische Anthropologie hat sich umgekehrt anscheinend nie für den menschlichen Umgang mit grammatischer Eindeutigkeit und Mehrdeutigkeit in der Sprache interessiert. Deshalb hat anscheinend keine von beiden Disziplinen jemals die Frage stellen können, warum grammatische Signale grundsätzlich verbindlicher als humanökologisch begründete Ausgangserwartungen sind. Dabei ist die Relevanz dieser Frage nach dem Gesagten kaum zu überschätzen: Sie betrifft das Verhältnis von sprachlich-grammatischen Symbolen zu den vorsprachlichen, im Sensomotorischen begründeten kognitiven Heuristiken des Menschen. Damit ist sie eine Zentralfrage der Phänomenologie, Symbolphilosophie, {P,p}ilosophischen und Kulturanthropologie. Sie verlangt Aufschluss darüber, was Grammatik mit dem sensomotorischen Weltverhältnis des Menschen macht.

Abb. 3: Mit höheren Lernformen (rechter Pol) erworbene Regungen haben Vetopotenzial gegenüber mit niedrigeren Lernformen (linker Pol) erworbenen Regungen (vgl. Kasper 2020: 283)

Aufbauend auf dem korpuslinguistischen Befund und dem revidierten bzw. ergänzten Leistungsaufbau der Gehlenʼschen Anthropologie soll folgende These formuliert werden: Kognitive oder physische Regungen, die mit höheren Lernformen erworben wurden, besitzen „Vetopotenzial“ gegenüber kognitiven oder physischen Regungen, die auf niedrigeren Lernformen basieren. Höhere Lernformen zeichnen sich dabei durch größere Offenheit, höhere Plastizität und biologische Kontingenz aus. Höhere Lernformen sind offen, das heißt, mit ihnen können alle möglichen Regungsschemata erworben werden (man denke an die Variabilität der Erwerbmotorik); höhere Lernformen sind plastisch, das heißt, sie sind in ihrem Ablauf dynamisch an die Erfordernisse einer Situation anpassbar; und sie sind biologisch kontingent, das heißt, sie dienen, wenn überhaupt, dann nur äußerst mittelbar biologischen Dringlichkeiten (vgl. Kasper 2020: 282 – 284). Der Prototyp davon ist die menschliche autonom gesetzte zweckrationale Handlung; die Selbsttötung ist eine besonders prominente. Die These, dass höhere Regungen Veto gegenüber niedrigeren Regungen haben, besagt beispielsweise, dass Menschen klassisch oder operant so konditioniert werden können bzw. sich selbst konditionieren können, dass das konditionierte Verhalten ein (residuales) Instinktverhalten hemmt, das ohne die Konditionierung einfach „durchlaufen“ würde. Analog funktioniert der Versuch, mit kognitivem Aufwand, also reflektiert und aufmerksam gegen erworbene Konditionierungen anzugehen. Das macht sich beispielsweise die Verhaltenstherapie zunutze.

Übertragen auf die Sprache bedeutet dies Folgendes: Das Befolgen grammatischer Signale, also von morphologischen Formen und festen syntaktischen Reihenfolgen, um auf ihrer Basis Wahrnehmungen zu simulieren, ist eine Form der (operanten) Konditionierung. Grammatische Symbole haben daher Veto- bzw. Stattgabepotenzial gegenüber simulierten Wahrnehmungen, die auf instinktresidualen kognitiven Heuristiken beruhen: (i) Sie intervenieren gegen diese Heuristiken und revidieren sie, wenn sie ihnen widersprechen (Beispiele in [7]); (ii) sie geben diesen Heuristiken statt und liefern interpretative Gewissheit für sie, wenn sie ihnen entsprechen (Beispiele in [6]; vgl. Kasper 2020: 284 – 288).

Die Schlussfolgerung lässt sich pointiert so formulieren: Der Mensch ist das Lebewesen, das mit grammatischen Symbolen gegen die Suggestionen aus seinem Innern interveniert, ein animal symbolis interveniens (Kasper 2020: 284), oder: Grammatik ist eine Institution der menschlichen Selbstdomestizierung.

Anmerkung:

Der Artikel geht aus einem Vortrag im Rahmen der Offenen Tagung der Sektion Kultursoziologie in der Deutschen Gesellschaft für Soziologie und zugleich Jahrestagung der Sektion an der Universität Leipzig hervor (September 2021). Ich danke den Organisatorinnen der Tagung, Uta Karstein und Heike Delitz, sowie den Verantwortlichen für das Panel des Arbeitskreises Philosophische Anthropologie und Soziologie, Aida Bosch und Joachim Fischer, für die Möglichkeit, meine disziplinäre Grenzübertretung einem soziologischen Publikum vorstellen zu dürfen. Den Teilnehmer*innen an der Diskussion danke ich für Anregungen, die ich im vorliegenden Artikel zu integrieren versucht habe.

Literatur

Alsberg, Paul (1922): Das Menschheitsrätsel. Versuch einer prinzipiellen Lösung. Dresden: Sibyllen-Verlag.Search in Google Scholar

Bornkessel-Schlesewsky, Ina/Schlesewsky, Matthias (2009a): Processing syntax and morphology: a neurocognitive perspective. Oxford: Oxford University Press.10.1093/oso/9780199207817.001.0001Search in Google Scholar

Bornkessel-Schlesewsky, Ina/Schlesewsky, Matthias (2009b): The Role of Prominence Information in the Real-Time Comprehension of Transitive Constructions: A Cross-Linguistic Approach: Prominence-Driven Sentence Processing. Language and Linguistics Compass 3, 19 – 58. https://doi.org/10.1111/j.1749 – 818X.2008.00099.x.10.1111/j.1749-818X.2008.00099.xSearch in Google Scholar

Cassirer, Ernst [1931] (2009): Die Begriffsform im mythischen Denken. In: Ders.: Schriften zur Philosophie der symbolischen Formen. Auf der Grundlage der Ausgabe Ernst Cassirer. Gesammelte Werke. Herausgegeben von Marion Lauschke. Hamburg: Meiner, 3 – 61.10.28937/978-3-7873-2121-6Search in Google Scholar

Dąbrowska, Ewa/Divjak, Dagmar (Eds.) (2015): Handbook of Cognitive Linguistics. Berlin/Boston: De Gruyter Mouton.10.1515/9783110292022Search in Google Scholar

Dancygier, Barbara, (Ed.) (2017): The Cambridge Handbook of Cognitive Linguistics. Cambridge: Cambridge University Press. https://doi.org/10.1017/9781316339732.10.1017/9781316339732Search in Google Scholar

Dröge, Alexander/Fleischer, Jürg/Schlesewsky, Matthias/Bornkessel-Schlesewsky, Ina (2016): Neural mechanisms of sentence comprehension based on predictive processes and decision certainty: Electrophysiological evidence from non-canonical linearizations in a flexible word order language. Brain Research 1633, 149 – 166. https://doi.org/10.1016/j.brainres.2015.12.045.10.1016/j.brainres.2015.12.045Search in Google Scholar

Dryer, Matthew S./Haspelmath, Martin (Eds.) (2013): The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology. (URL: http://wals.info; letzter Zugriff: 9. März 2023)Search in Google Scholar

Dryer, Matthew S. (2013a): Order of Subject, Object and Verb. In: Dryer, Matthew S./Haspelmath, Martin (Eds.): The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology. (URL: http://wals.info/chapter/81; letzter Zugriff: 9. März 2023)Search in Google Scholar

Dryer, Matthew S. (2013b): Determining Dominant Word Order. In: Dryer, Matthew S./Haspelmath, Martin (Eds.): The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology. (URL: http://wals.info/chapter/s6; letzter Zugriff: 9. März 2023)Search in Google Scholar

Fischer, Martin H./Zwaan, Rolf A. (2008): Philosophische Anthropologie – Ein wirkungsvoller Denkansatz in der deutschen Soziologie nach 1945 / Philosophical Anthropology – An Important Approach in Post-war German Sociology. Zeitschrift für Soziologie 35, 322 – 347. https://doi.org/10.1515/zfsoz-2006 – 0502.10.1515/zfsoz-2006-0502Search in Google Scholar

Fischer, Joachim (2009): Philosophische Anthropologie. Eine Denkrichtung des 20. Jahrhunderts. Studienausgabe. Freiburg/München: Karl Alber.Search in Google Scholar

Fischer, Joachim (2021): Hat Arnold Gehlen systematisches Gewicht in der Philosophischen Anthropologie? Zur Korrektur von sieben Vorurteilen über einen Denker. In: Magerski, C. (Hrsg.): Die Macht der Institution. Zum Staatsverständnis Arnold Gehlen. Baden-Baden: Nomos, 69 – 100.10.5771/9783845298511-67Search in Google Scholar

Fischer, Martin H., and Rolf A. Zwaan. 2008. Embodied Language: A Review of the Role of the Motor System in Language Comprehension. Quarterly Journal of Experimental Psychology 61, 825 – 850. https://doi.org/10.1080/17470210701623605.10.1080/17470210701623605Search in Google Scholar

Frazer, James George [1890] (2009): The Golden Bough. A new abridgement from the second and third editions. Edited by Robert Frazer. Reissue. Oxford: Oxford University Press.Search in Google Scholar

Frith, Uta/Frith, Christopher D. (2003): Development and neurophysiology of mentalizing. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 358(1431), 459 – 473. https://doi.org/10.1098/rstb.2002.1218.10.1098/rstb.2002.1218Search in Google Scholar

Gardt, Andreas (1999): Geschichte der Sprachwissenschaft in Deutsch-land. Vom Mittelalter bis ins 20. Jahrhundert. Berlin/New York: Walter de Gruyter.10.1515/9783110803419Search in Google Scholar

Geeraerts, Dirk/Cuyckens, Hubert (Eds.) (2007): The Oxford handbook of Cognitive Linguistics. Oxford: Oxford University Press.Search in Google Scholar

Gehlen, Arnold [1940] (1993): Der Mensch. Seine Natur und seine Stellung in der Welt. (Gesamtausgabe, Bd. 3.1). Hrsg. v. K.-S. Rehberg. Frankfurt a. M.: Vittorio Klostermann. [M]Search in Google Scholar

Gehlen, Arnold (1983): Philosophische Anthropologie und Handlungslehre (Gesamtausgabe, Bd. 4). Hrsg. von Karl-Siegbert Rehberg. Frankfurt a. M.: Vittorio Klostermann. [GA 4]Search in Google Scholar

Gehlen, Arnold [1956] (1986): Urmensch und Spätkultur. Philosophische Ergebnisse und Aussagen. Wiesbaden: AULA. [US]Search in Google Scholar

Helbig, Gerhard (1986): Geschichte der neueren Sprachwissenschaft. Leipzig: VEB Bibliographisches Institut Leipzig.10.1515/9783111458854Search in Google Scholar

Holisky, Dee Ann (1987): The case of the intransitive subject in Tsova-Tush (Batsbi). Lingua 71, 103 – 132. https://doi.org/10.1016/0024 – 3841(87)90069 – 6.10.1016/0024-3841(87)90069-6Search in Google Scholar

Jones, Edward E./Davis, Keith E. (1965): From acts to dispositions. The attribution process in person perception. In: Berkowitz, Leonard (Ed.): Advances in Experimental Social Psychology. Vol. 2. New York: Academic Press, 219 – 266.10.1016/S0065-2601(08)60107-0Search in Google Scholar

Kappeler, Peter M. (2020): Verhaltensbiologie. Berlin/Heidelberg: Springer. https://doi.org/10.1007/978-3-662-60546-2.10.1007/978-3-662-60546-2Search in Google Scholar

Kasper, Simon (2015): Instruction Grammar. From Perception via Grammar to Action. Berlin/Boston: de Gruyter.10.1515/9783110430158Search in Google Scholar

Kasper, Simon (2020): Der Mensch und seine Grammatik: eine historische Korpusstudie in anthropologischer Absicht. Tübingen: Narr Francke Attempto.Search in Google Scholar

Kunde, Wilfried (2006): Antezedente Effektrepräsentationen in der Verhaltenssteuerung. Psychologische Rundschau 57, 34 – 42. https://doi.org/10.1026/0033 – 3042.57.1.34.10.1026/0033-3042.57.1.34Search in Google Scholar

Langer, Susanne K. (1982): Mind. An essay on human feeling. Vol. III. Baltimore/London: Johns Hopkins University Press.Search in Google Scholar

Moskowitz, Gordon B. (2005): Social cognition. Understanding self and others. London/New York: Guilford Press.Search in Google Scholar

Pecher, D./Zwaan, R. A. (Eds.) (2005): Grounding cognition: The role of perception and action in memory, language, and thinking. Cambridge: Cambridge University Press.10.1017/CBO9780511499968Search in Google Scholar

Schütz, Alfred [1955] (1971): Symbol, Wirklichkeit und Gesellschaft. In: Ders.: Gesammelte Aufsätze. Band 1: Das Problem der sozialen Wirklichkeit. Den Haag: Martinus Nijhoff, 331 – 352.10.1007/978-94-010-2858-5_11Search in Google Scholar

Schütz, Alfred/Luckmann, Thomas [1975] (2017): Strukturen der Lebenswelt. Zweite Auflage. Konstanz/München: UVK Verlagsgesellschaft.10.36198/9783838548333Search in Google Scholar

Schwemmer, Oswald (1997): Die kulturelle Existenz des Menschen. Berlin: Akademie.10.1515/9783050073637Search in Google Scholar

Tomasello, Michael (2003): Constructing a language. A usage-based theory of language acquisition. Cambridge/London: Harvard University Press.Search in Google Scholar

Tomasello, Michael (2008): Origins of human communication. Cambridge: MIT Press.10.7551/mitpress/7551.001.0001Search in Google Scholar

Van Valin, Robert D. jr./Wilkins, David P. (1996): The case for „effector“. Case roles, agents and agency revisited. In: Shibatani, M./Thompson, S. (Eds.): Grammatical constructions. Oxford: Oxford University Press, 289 – 322.Search in Google Scholar

Wen, Xu/Taylor, John R. (Eds.) (2020): The Routledge handbook of cognitive linguistics. New York: Routledge.10.4324/9781351034708Search in Google Scholar

Wildgen, Wolfgang (2010): Die Sprachwissenschaft des 20. Jahrhunderts. Versuch einer Bilanz. Berlin/New York: Walter de Gruyter.10.1515/9783110228519Search in Google Scholar

Published Online: 2023-08-07
Published in Print: 2023-08-07

© 2023 Walter de Gruyter GmbH, Berlin/Boston

This work is licensed under the Creative Commons Attribution 4.0 International License.

Downloaded on 26.5.2024 from https://www.degruyter.com/document/doi/10.1515/jbpa-2021-0004/html
Scroll to top button