1. Der Gestaltbegriff und seine späte Rezeption in der Linguistik
Nihil est in intellectu quod non sit prius in sensu
– Nichts ist im Verstand, was nicht zuvor in der Wahrnehmung wäre.
(Thomas von Aquin, nach Aristoteles, De anima III, 8)
Hinter den unterschiedlichen semantischen Prozessen und der damit verbundenen Übertragung von Bedeutungen wurden zwei grundlegende Assoziationsprinzipien ausgemacht, die Similarität ('Ähnlichkeit') und die Kontiguität ('Nachbarschaft'). Beide sind weitgehend in der Perzeption verankert sind und vor allem die Wahrnehmung von Bewegung hat überdies gezeigt, dass die Ähnlichkeit von Perzepten nicht direkt auf Eigenschaften und schon gar nicht auf abstrakte Merkmale der außersprachlichen Realität zurückgeführt werden kann. Es ist vielmehr erforderlich, auch die neurophysiologische Verarbeitung der sensorischen Stimuli zu berücksichtigen (so weit dies nach dem Stand des Wissens möglich ist).
Es wäre daher durchaus irreführend, die mentalen Repräsentationen ('Vorstellungsbilder') als passiv empfangene Spiegelbilder der Außenwelt zu verstehen. Darauf hat Ernst Cassirer in einem wichtigen Aufsatz aufmerksam gemacht, der zu einer Zeit (1944) in den USA publiziert wurde, als die Psychologie und Sprachwissenschaft durch einen mechanischen Behaviorismus beherrscht wurden, der keinen Platz für kognitive Modelle ließ:
What we discussed last seems to digress far from the problems of the perceptual world. It is characteristic of perception that it never attains to that stage which represents the beginning of geometrical thought. Perception cannot abbandon the hic et nunc, since its peculiar task is just to apprehend the hic et nunc as precisely and completely as possible. If perception would ease to have an individual content, it would ease to have any context whatsoever. We do not deny the possibility of perceptional content. We do not deny, for rationalistic or intellectual reasons, that perception never will and can attain to that form of universality for which geometrical thought is striving. On the other hand, the sensualistic thesis, which modern psychology started out from, cannot be maintained either. It is not the force of epistemological objections, but a simple clarification of the phenomenological facts involved in perception, that has refuted this thesis. When nowadays one attempts to describe these facts as they are revealed by experiment and precise analysis, one can no longer stick to the conception that perception is nothing but a bundle of sense-impressions. That the perceptual world does possess a structure and that this structure cannot be reduced to a mere mosaic, an aggregate of scattered sensations may be taken as an established conclusion of psychology, and it is upon this conclusion that we base our reflections in the following. (Cassirer 1944, 9)
Die 'Struktur der perzeptiven Welt' führt Cassirer auf die Konditionierung der Perzeption durch den Wahrnehmungsapparat selbst zurück. Er beruft sich dabei auf die grundlegenden Einsichten der so genannten Gestaltpsychologie oder Gestaltheorie, die - wenn auch mit erstaunlicher Verspätung - in der Sprachwissenschaft, insbesondere in der kognitiven Linguistik eine starke Wirkung entfalten sollten: Die sprachwissenschaftliche Rezeption ist - von Karl Bühler abgesehen - zunächst in den USA erfolgt, wohin zahlreiche bedeutende Gestaltpsychologen während der Nazi-Herrschaft auswandern mussten. In die USA war auch Karl Bühler emigriert; er konnte dort jedoch nicht mehr wirklich Fuß fassen. Immerhin entstand eine kleine Arbeit zum "Gestaltprinzip", in der er diesen zentralen Begriff seiner psychologischen und sprachwissenschaftlichen Forschung scharf konturiert.
"Das Gestaltprinzip [...] ist, generell gesagt, ein Ordnungsprinzip im Leben der Organismen. […] Was der Ausdruck «Schlankheit» bedeutet, ist kein Teil sondern ein anschauliches Moment an dem präsentierten Etwas. Diese Überlegung führt weiterhin zu einem Vergleich der Gestalten und ihrer Abhebung von dem, was unter dem Namen Begriffe verstanden wird. Die Gestalten sind also, unserer Ansicht nach, keine Denkprodukte. Dies wird besonders deutlich am menschlichen Säugling und an Tieren (bis hinunter zu den Insekten). Während im Begriff ein Absehen, eine Abstraktion beschlossen liegt, bleibt das gestaltlich Erfasste inhaltsgesättigt." (Bühler 1960, 20, Anm. 1)
"Das Gestaltprinzip als ein Mittleres zwischen Sinnesempfindungen und begrifflichem Erkennen. Es gibt, um die These zu wiederholen, eine Brücke, metaphorisch gesprochen, zwischen dem Empfinden von Sinnesdaten und dem (begrifflichen) Denken, das Gestalterlebnis nämlich." (Bühler 1960, 88)
"Auch die automatische Transponierbarkeit im Erlebnis der optischen und der akustischen Gestalten hebt sie ab von den Empfindungsdaten, welche wir abstraktiv isolieren und für sich benennen können. So sehen wir im Regenbogen Rot, Gelb, Grün, Blau, Violett nebeneinander liegen und ineinander übergehen; doch vermögen wir sie nicht in der gleichen Weise zu transponieren. [...] die Theorien des Farbensehens sind ab ovo keine Angelegenheit des Gestaltprinzips." (Bühler 1960, 88)
"Die sprachliche Wendung, das Gestaltprinzip sei ein Mittleres zwischen Sensationen und begrifflichem Denken, bedeutet, dass es einerseits [...] zu den «Intuitionen» gehört wie die Empfindungen und doch andererseits auch transponierbar ist; dies so, wie die rein begrifflichen Operationen und Befunde. Es ist mit anderen Worten ansatzweise mit dem AAM der Biologen zu vergleichen, kann jedoch im Bereich der menschlichen Begabung begrifflich denkend überprüft werden." (Bühler 1960, 91)
Aber auch in den vereinigten Staaten setzte die Rezeption erst spät ein; vor allem Lakoff 1977 hat dabei eine große Rolle gespielt.
1.1. Gestaltbildende Faktoren
Aus den grundlgenden Arbeiten vor allem von Max Wertheimer, Wolfgang Köhler und Kurt Koffka wurden vereinfachend sogenannte ‘Gestaltgesetze’ abgeleitet, die natürlich eher als allgemeine Prinzipien und nicht als strenge Gesetze zu sehen sind. In Anlehnung an (Massironi 1998), ist es eher angebracht von Gestaltmerkmalen oder ‘gestaltbildenden Faktoren’ zu reden:
- Die Similarität wird durch den Faktor Symmetrie zusätzlich gestärkt: Die folgenden Graphiken zeigen die starke Wirkung dieses Faktors, der die starke Richtungsfortsetzung sogar noch überlagert; in der Abbildung b) wird im oberen Teil das weiße, im unteren jedoch das schwarze Element als 'Geländer' gesehen, denn es ist dort jeweils symmetrisch ausgeführt. Die asymmetrischen Elemente werden dagegen unwillkürlich als 'Zwischenräume', d.h. als Hintergrund gesehen.
- Der Faktor einfache Prägnanz: Bestimmte einfache Gestalten werden bevorzugt wahrgenommen und gelten daher als 'gute Gestalt'. Unter dem Einfluss der englischsprachigen Literatur wurd der Ausdruck Prägnant bzw. prägnant weitgehend durch Salienz bzw. salient ersetzt.
- Der Faktor der Richtungsfortsetzung (oder der durchgehenden Linie): Linien werden immer so gesehen, als folgten sie dem einfachsten Weg:
Dato un insieme di stimoli disposti in modo da seguire traiettorie diverse tra loro incrociatesi, gli elementi che fanno parte di una stessa traiettoria tendono a unificarsi in un'entità autonoma. (Massironi 1998, 66)
- Der Faktor der Geschlossenheit: Es werden bevorzugt geschlossene Strukturen wahrgenommen. In der folgenden Graphik sehen wird einen geschlossenen Würfel indem wir die Linien unwillkürlich ergänzen.
Die genannten Faktoren gelten in ähnlicher Weise für die Wahrnehmung von Bewegung. So:
-
-
- Der Faktor des gemeinsamen Schicksals: Zwei oder mehrere sich gleichzeitig in eine Richtung bewegende Elemente werden als eine Einheit oder Gestalt wahrgenommen.
- Der Faktor der Gleichzeitigkeit: gleichzeitig Veränderung führt dazu, dass die sich verändernden Elemente als zusammengehörig perzipiert werden.
-
Die gestaltpsychologische Tradition ist sehr stark an der visullen Wahrnehmung ausgerichtet; es gibt aber zweifellos auch akustische Gestalten, wie z.B. Melodien.
1.2. Figur und Hintergrund
Die gestaltbildenden Faktoren spielen eine große Rolle bei der Strukturierung unseres visuellen Wahrnehmungsraums; insbesondere tragen sie entscheidend dazu bei, ihm eine eine nach Vorder- und Hintergrund gestaffelte Perspektive zu geben: unsere Perzeption präsentiert uns ja vordergründige Objekte, d.h. Gestalten (engl. figure) vor einem zurücktretenden Hintergrund (engl. ground). Die geschlossene Linie (bzw. die geraden Kanten) sorgen dafür das die folgende linke Graphik uns weiße Quadrate auf blauem Hintergrund sehen lässt. In der rechten Graphiken erscheinen die weißen Quadrate dagegen wie Löcher in einem blaue Sternmuster, so dass der weiße Hintergrund sichtbar wird:
Die Geschlossenheit interagiert zudem mit der Form, so dass Konvexität den Eindruck einer vordergründigen Figur vermittelt, Konkavität dagegen dagegen als Hintergrund interpretiert wird. Der jeweils rechte und konvexe Teil der folgenden vier Graphiken wird unweigerlich als Segment einer Scheibe bzw. eines Rechtecks vor einem Hintergrund perzipiert. Auch bei Konzentration fällt es sehr schwer, die konkave Formen als Figur zu sehen.
Bemerkenswert ist die Tatsache, dass die Wahrnehmung der Figur durchaus mit der Art des Hintergrunds interagiert. Die gleichseitigen Dreiecke der folgenden Abbildungen zeigen als solche in keine bestimmte Richtung; durch die Linienscharen des Hintergrunds werden sie jedoch so aufgefasst, als ob sie ausgerichtet wären.
1.3. Kippfiguren
Sehr lehrreich für das Verständnis unserer Wahrnehmungsleistungen sind ferner die so genannten Kippfiguren. Dabei handelt es sich um Graphiken unterschiedlicher Komplexität, die alternative Ansicht bieten. Der so genannte Necker-Würfel in der folgenden Abbildung kann aus zwei verschiedenen Perspektiven gesehen werden und das Doppelporträt zeigt entweder das Profil eines jungen Frau (von links hinten gesehen) oder einer alten Frau, deren linkes Auge dem linken Ohr in der Ansicht des jungen Mädchens entspricht.
Dieser Effekt alternativer Lesbarkeit wurde von Peter (Koch 1994) und im Anschluss von Andreas (Blank 2001, 74f.) für die Metapherntheorie geltend gemacht. Beide sprechen explizit vom "metaphorischen Kippeffekt". Die Analogie besteht darin, dass die jeweils gegebenen Lesarten zwar schlagartig wechseln, aber sich gegenseitig ausschließen; es ist unmöglich, beide gleichzeitig oder aber ein unstrukturiertes Chaos wahrzunehmen.
1.4. Ganzheitlicher Charakter der ‘Gestalt’
Die erkannte Figur, oder: Gestalt, kann durchaus sehr komplex sein. Entscheidend ist die Tatsache, dass sie als Ganzes, sozusagen schlagartig erkannt wird. Das Erkennen ist also gerade nicht das Resultat aus vielen Einzelwahrnehmungen von spezifischen Merkmalen, die dann sukzessive zusammengesetzt werden. Ein wichtiger Wegbereiter der Gestalttheorie, Christian von Ehrenfels, hat dafür das Schlagwort der ‘Übersummativität’ geprägt (vgl. Ehrenfels 1890); eine Gestalt sei grundsätzlich mehr bzw. etwas anderes als die Summe ihrer Teile. Ein sehr anschauliche Beschreibung dieses Art des Erkennens gibt Karl Bühler ausgehend vom Wortverstehen:
Der Wortschatz einer Sprache wie des Deutschen enthält viel tausend Lautbilder, die sich im Interesse eines eindeutigen Sprechverkehrs genügend scharf voneinander abheben müssen. Wenn der Psychologe zusieht, wie dies geschieht, so findet er im Grunde dieselben Mittel, die ihm von andern Gebieten her vertraut sind. Angenommen ich muß ebenso viele Menschen, wie es Lautbilder in meiner Sprache gibt, auseinanderhalten und wiedererkennen, so kann dies in gewissen Grenzen ohne sonderliche Zurüstungen und wohlausgearbeitete Hilfsmittel geschehen; ich erkenne Hunderte von näheren Bekannten am Gesicht oder Wuchs, an eigenartigen Bewegungen oder an der Stimme. Und das heißt begrifflich gefaßt: an Komplexcharakteren, um die ich mich nicht besonders zu bemühen brauche, weil sie mir im Verkehr wie von selbst aufgehen und behalten werden; sie entstehen jedenfalls vielfach ohne eine nachweisbare Aufgliederung in Sonderelemente. (Bühler 1965, 275)
Das heißt, wir erkennen Wörter so wie bekannte Personen oder eben alle vertrauten Dinge, sehr schnell und zuverlässig - aber ohne, dass wir genau sagen könnte woran. Unterscheidende Einzelmerkmale brauchen wir nur dann, wenn das ganzheitliche Funktionieren nicht funktioniert, also etwa dann, wenn sich ein Zwilling vom anderen durch ein Muttermal unterscheidet.
1.5. ‘Gestalt’ und aktuelle Wahrnehmungsforschung
Der Begriff der Gestalt ist heuristisch nach wie vor relevant. Es ist jedoch absehbar, dass die, oder wenigstens einige der gestaltbildenden Faktoren auf konkrete neurophysiologische Prozesse zurückgeführt werden.
Die zeitgenössische Wahrnehmungsforschung hat die besondere Bedeutung von Linien und Kanten für die Objekterkennung hervorgehoben:
Bei unterschiedlich gemusterten oder gefärbten Flächen ist die entscheidende Information in den Grenzlinien enthalten. Die Linien in Strichzeichnungen enthalten die gleiche Information wie diese Grenzlinien. Deshalb können wir in gewisser Hinsicht auf der Strichzeichnung eines Hauses ebenso viel erkennen wie beim Betrachten des Hauses. Das Sehsystem neigt dazu, Flächen innerhalb bestimmter Konturen als abgegrenzte Objekte vor einem Hintergrund wahrzunehmen. So empfinden wir einen kreisförmigen Strich auf einer einheitlichen Fläche nicht als Linie, sondern als Scheibe. (Gegenfurtner 2011, 116)
Selbst da, wo keine Linien oder Kanten existieren werden sie vom Sehsystem erzeugt, um den Kontrast zu verstärken. Dieser Effekt wurde von Ernst Mach schon 1865 beschrieben; die so genannten Machschen Bänder lassen sich sehr leicht und zuverlässig erzeugen. Die farblich homogenen senkrechten Streifen werden auch in sich als schattiert gesehen: Jeder Streifen erscheint an der Grenzen zum benachbarten dunkleren Streifen als heller und an der Grenze zum benachbarten helleren Streifen als dunkler.
Der Linien- bzw. Kantenverlauf ist wohl auch für den Faktor der Geschlossenheit verantwortlich, der ein Perzept als vordergründige Figur hervortreten lässt.
1.6. Objektwahrnehmung
Alternative Wahrnehmungen können in unstabiler Weise ‘kippen’; das muss jedoch keineswegs immer der Fall sein. Die runden Flächen der beiden folgenden Graphiken werden entweder als runde Erhebung oder aber als Vertiefungen gesehen, allerdings ist die Interpretation eindeutig durch die Schattierung konditioniert: Wenn die Helligkeit nach unten abnimmt ergibt sich wohl automatisch die Lesart als Erhebung.
In der perzeptiven Korrelation von Vertikalität und Helligkeit (OBEN = HELL), die uns auch in der Polysemie sprachlicher Zeichen immer wieder begegnet, spiegelt zweifellos die Tatsache, dass "im Laufe der Evolution, und auch im Laufe unseres Lebens, die Lichtquelle fast immer ober ist" (Gegenfurtner 2011, 78).
Das Beispiel macht weiterhin auf einen anderen Komplex aufmerksam: Mit der größen Selbstverständlichkeit werden zweidimensionale Bilder, die auf der Netzhaut des Auges entstehen, dreidimensional interpretiert; nur so ist es möglich Objekte zu erkennen. Beim erfolgreichen Erkennen fließen also offenkundig noch andere Informationen ein:
Die Wahrnehmung besteht nämlich nicht nur aus Daten des Netzhautbildes, sondern auch aus Erfahrungen wie z.B. erinnerten Formen. Die Gesamtwahrnehmung setzt sich dann aus Gesehenem und Erinnertem zusammen. (Gegenfurtner 2011)
Das Erinnerte impliziert aber multimodale Informationen (aus unterschiedlichen Wahrnehmungssystemen), so haptische Erfahrungen (über den Hautsinn), die durch das Anfassen (das 'Begreifen') von dreidimensionalen Objekten vermittelt werden und durch das Sehen mit abgerufen werden. Es ist daher naheliegend, die spontane Interpretation konvexer Formen als Figur aus einer festen Assoziation der visuellen Form mit haptischer Dingerfahrung zu erklären. Wir greifen in der Regel konvexe Gegenstände; die Greiferfahrung konkaver Objekte ist selten und in der Regel auch riskant, weil schnell der Kontrolle durch den Blick entzogen; Griffe in nicht einsehbare Hohlräume erfordern Überwindung.
Einerseits dominiert also das visuelle System:
Die besondere Bedeutung der visuellen Wahrnehmung für Menschen und andere Primaten kann man an der Größe und der Anzahl der an der Bildanalyse beteiligten Gehirnareale ablesen. Neben der primären Sehrinde (V1), die etwa 15% der gesamten Großhirnrinde ausmacht, wurden bisher mehr als 30 verschiedene visuelle Areale beschrieben. Insgesamt sind etwa 60% der Großhirnrinde an der Wahrnehmung, Interpretation und Reaktion auf visuelle Reize beteiligt. (Gegenfurtner u..a.)
Die Dominanz dieser Modalität drückt sich auch in einer viel differenzierteren Lexikalisierung aus, auf die eine spezielle Vorlesung Bezug nehmen wird.
Aber andererseits sind die visuellen Bilder mit (Erinnerungs)Wissen assoziiert, das aus anderen Sinnesmodalitäten stammt: Wenn wir etwas - zweidimensional - sehen, wissen wir sehr häufig, wie es sich - dreidimensional - anfühlt:
Die taktile Perzeption, und die Erinnerung an entsprechende Wahrnehmungserlebnisse ist daher für das Wiedererkennen von großer Bedeutung; sie hat sich bekanntlich in etlichen Bedeutungsübertragungen niedergeschlagen:
- wie deu. begreifen ‘verstehen’;
- deu. handhaben ‘verständig mit etwas umgehen’;
- ita. capire ‘verstehen’ < lat. capere ‘nehmen, ergreifen’;
- ita. afferrare ‘fassen, festhalten’ und ‘verstehen’, eine Ableitung von ferro ‘Eisen’, also ursprünglich ‘Eisen ergreifen und halten’;
- ita, comprendere < lat. comprehendere ‘zusammenhalten, fassen’ und bereits auch ‘verstehen’;
- ita. apprendere < lat. apprehendere ‘anfassen, sich aneignen’ und ‘verstehen’.
Bei der Objekterkennung spielen neben der Erinnerung womöglich spezialisierte Neuronen eine Rolle:
Im temporalen Kortex konnten Bereiche identifiziert werden, die spezifisch auf ganz bestimmte Objektkategorien antworten. Untersuchungen an Affen und Menschen zeigten, dass einige Zellen des inferotemporalen Kortex nur auf Hände oder Gesichter ansprechen. Unter den gesichtsspezifischen Zellen gibt es solche , die besonders gut auf frontale Ansichten von Gesichtern ansprechen. Verändert man das Gesicht, indem man Teile weglässt oder im Profil zeigt, verringern die Neuronen ihre Antwort. Andere reagieren bevorzugt auf Profilansichten, bestimmte Gesichtsausdrücke oder nur einzelne Gesichtselemente. Zum Teil genügen schon Grundelemente wie zwei Punkte und ein Strich, um eine Reaktion auszulösen. (Gegenfurtner 2011, 55)
Man denkt hier sofort an die hohe Salienz (und den damit verbundenen Erfolg) der einfachen Smileys, wie 🙂 🙁 usw.
1.7. Zwei neuronale Verarbeitungsströme
Die Kognitions- und Wahrnehmungsforschung entwickelt sich sehr schnell; das darf allerdings nicht darüber hinweg täuschen, dass sehr viele und auch ganz grundsätzliche Zusammenhänge noch unbekannt sind. Es ist deshalb in jedem Fall spekulativ, sprachliche Kategorien unmittelbar mit neurologischem Wissen in Verbindung zu bringen. Allerdings drängen sich manche Spekulationen geradezu auf. Ein frappierendes Beispiel liefern die Erkenntnisse über die zwei Nervenbahnen, auf denen visuelle Reize verarbeitet werden:
Von V1 ausgehend scheint die kortikale Verarbeitung visueller Information über zwei Hauptpfade zu verlaufen, einen dorsalen Verarbeitungsstrom, der zum Scheitellappen verläuft, und einen ventralen Verarbeitungsstrom, der zum unteren Schläfenlappen 40 (Temporalkortex) zieht […] Auch neuere Befunde der funktionellen Kernspintomographie belegen, dass Aufgaben zur visuell räumlichen Orientierung vermehrt Areale im Parietalkortex aktivieren und Objekterkennungsaufgaben eher im Temporalkortex. Der parietale Verarbeitungsstrom dient der Steuerung von Handlungen und der Wahrnehmung von Bewegung und der Positionen des Körpers bzw. Objekte im Raum. Er wird daher oftmals als »Wo-Strom« bezeichnet. De temporale Strom dagegen ist von besonderer Bedeutung für die Farb-, Muster- und Formwahrnehmung und damit für die Objekterkennung. Er wird daher auch »Was-Strom« genannt. (Gegenfurtner 2011, 40)
Diesen beiden ‘Strömen’ im visuellen System entspricht die grundsätzliche Opposition von Verben einerseits und Nomina (inklusive der Adjektive) andererseits im sprachlichen System. Es ist doch äußerst nahe liegend, hier einen Zusammenhang zu vermuten.
Ich habe eine Frage bezüglich „Ganzheitlicher Charakter der Gestalt“. Im Text steht anfangs, dass das „Erkennen also gerade nicht das Resultat aus vielen Einzelwahrnehmungen von spezifischen Merkmalen, die dann sukzessive zusammengesetzt werden“ ist, sondern eher als Ganzes wahrgenommen.
Im darauffolgenden Zitat steht aber, dass man eine Person auch nur anhand der Stimme erkennen kann, also nicht das ‚Ganze‘ braucht.
Könnten Sie es mir vielleicht kurz klären? Danke!
Ja, richtig bemerkt; das ist nicht ganz scharf ausgedrückt; es soll heißen, dass nicht eine ganz Reihe von Merkmale einzeln abgeglichen wird, sondern dass bestimmte für sich (ohne mit anderen verglichen werden zu müssen) den Gesamteindruck erzeugen (‚Komplexcharakter‘ nennt Bühler das); die Stimme steht nicht mit anderen Stimmen verglichen, wie beim Beispiel der Sitzgelegenheiten, wo ‚mit Armlehne‘ im Gegensatz zu ‚ohne Armlehne‘ steht und im Verbund mit den anderen Merkmalen der jeweiligen Sitz.g. wahrgenommen wird.