Mündliche Kommunikation ist flüchtig. Zum einen Ohr rein, zum andern wieder raus, schweizweit bekannt als «Göschenen-Airolo»-Effekt oder seit Eröffnung des Gotthard-Basistunnels als «Erstfeld-Biasca»-Effekt.
Alles andere als flüchtig sind die Forschungsergebnisse des Sprechwirkungsforschers Professor Walter Sendlmeier von der Technischen Universität Berlin. Sein Standardwerk «Sprechwirkungforschung» gilt international als Referenzpublikation für die akustischen, physologischen und psychologischen Grundlagen und Anwendungen mündlicher Kommunikation.
Im Interview spricht Professor Walter Sendlmeier darüber, wie mannigfaltig sich Stimme und Sprechweise auf unsere Persönlichkeit und auf unsere Kommunikation auswirken, wie die Sprechweise in Medien das Publikum beeinflusst, wie wirklichkeitsfern die Kommunikationsmodelle von Schulz von Thun und Watzlawick ohne stimmlichen Ausdruck sind, wie vorbildlich «Hören» im Lehrplan 21 in der Schweizer Volksschule verankert ist, warum ein Handyverbot in Schulen wie im Kanton Nidwalden den Lernerfolg der Kinder steigern wird – mit zahlreichen wertvollen Erkenntnissen.
«Person» stammt von «per sona» ab, was griechisch «durch den Klang» bedeutet. Mit Person ist, wie Sie in Ihren Forschungsarbeiten zur Sprechwirkung darlegen, der «Klang der Stimme» gemeint. Was sagt die Stimme über uns als Individuum aus?
Walter Sendlmeier: «Die Stimme eines Menschen ist ganz individuell. Es dürfte tatsächlich keine zwei Menschen mit derselben Stimme geben. Neben der blossen Bestimmung der Identität eines Menschen lassen sich viele weitere Eigenschaften über einen Menschen anhand der Stimme und der spezifischen Sprechweise ableiten. Das Alter, das Geschlecht, der Bildungsgrad, die regionale und die soziale Herkunft sowie der gesundheitliche Zustand können sehr zuverlässig von Hörern aus dem Stimmklang und der Sprechweise eines Menschen entnommen werden. Die Stimme eines Menschen ist aber immer auch Ausdruck seiner Persönlichkeit im Sinne überdauernder charakterologischer Eigenschaften.
Die Stimme eines Menschen liefert uns viel mehr Hinweise auf seine Persönlichkeitsstruktur als die visuelle Erscheinung. Selbst die Augen, die oft als Spiegel der Seele betrachtet werden, können nicht so subtil und variantenreich die Persönlichkeit eines Menschen zum Ausdruck bringen.
In verschiedenen Untersuchungen konnten wir zeigen, dass Hörer mithilfe der Verwendung eines Persönlichkeitstests zur Ermittlung der fünf Hauptdimensionen der Persönlichkeitsstruktur (Big Five Modell nach Costa und McCrae) in der Lage sind, Sprecher und Sprecherinnen anhand nur kurzer Sprachbeispiele adäquat zu beurteilen. So wurden z.B. Sprecher und Sprecherinnen, die sich mithilfe der Ich-Form des Persönlichkeitstests selbst als eher ängstlich, unsicher, besorgt und sensibel einschätzten, auch von Hörern und Hörerinnen aufgrund kurzer Sprechproben als eher labil eingestuft.»
Wenn man von der Stimme auf die Persönlichkeit schliessen kann, welche Gefühle können wir mit der Stimme ausdrücken?
Walter Sendlmeier: «Den momentanen emotionalen Zustand eines Menschen können wir sehr schnell und zuverlässig aus dem Stimmklang und der Sprechweise entnehmen.
So erkennen wir sofort an der Sprechweise eines Menschen, ob er gerade eher freudig, traurig, ängstlich oder ärgerlich ist – und zwar auch dann, wenn der Sprecher bzw. die Sprecherin uns über den Inhalt etwas anderes vormachen möchte.
Mit dem Inhalt von Wörtern können Menschen sehr leicht lügen. Gefühlszustände und Charaktermerkmale sind sehr viel schwieriger im stimmlichen und sprecherischen Ausdruck zu verstellen. In mehreren Untersuchungen konnten wir die systematischen Veränderungen in der Artikulation, der Prosodie und im Stimmklang ermitteln, die sich im Zustand der verschiedenen Basisemotionen gegenüber einer neutralen Sprechweise ergeben.
Es ist kein Zufall, dass die Wörter «Stimme» und «Stimmung» den gleichen Wortstamm haben.
Die unterschiedlichen emotionalen Zustände stehen aber nicht nur mit bestimmten Erregungen im zentralen Nervensystem in einem Zusammenhang, sondern werden auch stark durch Aktivitäten der beiden Komponenten des vegetativen Nervensystems – des Sympathikus und des Parasympathikus – beeinflusst. Je nach Emotion zeigen sich eher sympathische oder aber parasympathische Aktivitäten. So haben z.B. die Veränderung des Muskeltonus oder die Verringerung der Speichelproduktion einen unmittelbaren Einfluss auf die Beweglichkeit der Artikulationsorgane.»
«Ärger ist übrigens die einzige Emotion,
Walter Sendlmeier, Sprechwirkungsforscher
bei der sich die Artikulationsgenauigkeit verbessert.»
Mit der Prosodie untersuchen Sie die Veränderung in der Stimme bei unterschiedlichen Gefühlslagen. Was sind prosodische Elemente zum Beispiel bei Ärger, wenn ich mich in Rage rede?
Walter Sendlmeier: «Da sprechen wir lauter und höher und die Satzmelodie weist mehr Schwankungen auf, ausserdem betonen wir viel mehr Silben als normalerweise. Das wiederum führt dazu, dass wir deutlicher sprechen – denn in die betonten Silben stecken wir mehr Energie, wir nehmen uns also mehr Zeit. Ärger ist übrigens die einzige Emotion, bei der sich die Artikulationsgenauigkeit verbessert. Bei Freude verändert sich die Deutlichkeit unserer Aussprache gegenüber der neutralen Sprechweise kaum, bei Angst und Trauer hingegen nimmt unsere Artikulationsgenauigkeit deutlich ab.»
Menschen, die gut aussehen, wirken auf andere attraktiv? Welche Rolle spielt die Stimme?
Walter Sendlmeier: «Das «what sounds beautiful is good»-Stereotyp konnte in unserer jüngeren Forschung weitgehend bestätigt werden. Attraktiven Stimmen werden positive Persönlichkeitseigenschaften für die Dimensionen Extraversion, Gewissenhaftigkeit, Neurotizismus und Offenheit für Erfahrung – nicht jedoch für Verträglichkeit – zugeschrieben.
«Bei der Beurteilung der sogenannten inneren Werte
Professor Walter Sendlmeier
ist die Stimme dominant.»
Je attraktiver Frauen anhand ihrer Stimmen eingeschätzt werden, desto extrovertierter, gewissenhafter, weniger neurotisch und offener für neue Erfahrungen werden sie beurteilt. Werden Gesicht und Stimme gemeinsam dargeboten, so spielt das Gesicht für die Bewertung der Attraktivität von jungen Frauen eine ca. dreimal so wichtige Rolle.
Für die Beurteilung der Sympathie und der Persönlichkeitseigenschaften Extraversion, Gewissenhaftigkeit und Offenheit spielt die Stimme eine doppelt so grosse Rolle. Bei Neurotizismus und Verträglichkeit ist der Einfluss der Stimme sogar drei- bis viermal so gross wie der Einfluss des Gesichts.
Beide Kanäle (auditiv und visuell) liefern einen wichtigen Einfluss; geht es aber um die sogenannten inneren Werte, ist die Stimme dominant. Einzelheiten zu diesen Forschungsergebnissen sind in der kürzlich publizierten Doktorarbeit von Anabell Hacker nachzulesen.»
Mit dem Alter verändert sich unsere Stimme. Stimmen älterer Menschen klingen eher rau, die von Kindern hingegen klar. Woran liegt das?
Mit zunehmendem Alter kommt es in den Kehlkopfknorpeln zu Verknöcherungen (Ossifikationen). Dies wirkt sich nachteilig auf die Geschmeidigkeit der Gleit- und Drehbewegungen der Stellknorpel aus. Die Stimmlippen sind mit ihren hinteren Enden an den Stellknorpeln befestigt, so dass ihre Position und Schwingungsfähigkeit direkt davon betroffen ist. Zudem kommt es zu einer Erschlaffung der Bänder, mit denen die Stimmlippen an den Knorpeln befestigt sind. Nach und nach treten auch Veränderungen im Gewebe auf. Die obere Zellschicht der Stimmlippen, das Epithel, flacht mit zunehmendem Alter ab. Ab ca. dem 40. Lebensjahr reduziert sich auch das Gewebe in der mittleren Schicht. Der für die Feinregulierung zuständige Vokalismuskel verliert an Kraft.
Insgesamt führen diese Veränderungen zu einem Verlust an Spannung, Elastizität und Masse der Stimmlippen. Dünnere und steifere Stimmlippen führen bei älteren Männern dazu, dass die Stimmlippen schneller und mit geringerer Amplitude schwingen. Dies kann bei sehr alten Männern sogar zu dem sogenannten Greisendiskant – plötzliches Umschlagen der Stimme in die Fistellage – führen.
Bei Frauen sind diese Veränderungen des Gewebes schwächer ausgebildet; dafür kommt bei ihnen ein hormoneller Einfluss in den Wechseljahren zum Tragen, der die mittlere Tonhöhe stark beeinflusst, aber in die andere Richtung. Die Stimmlagen von Frauen werden nämlich nach dem Klimakterium deutlich tiefer. Dies ist das zweite Mal, dass hormonelle Veränderungen zu deutlich hörbaren Veränderungen in der Stimmlage führen. Bei Jungen in der Pubertät und bei Frauen in der Menopause. Zusätzlich treten bei älteren Frauen (75+) häufiger unvollständige Glottisverschlüsse auf, die zu einem rauschartigen, mitunter krächzendem, Stimmklang führen.
Bei der Beurteilung des Stimmalters sind aber auch Masse der Sprechgeschwindigkeit und der Artikulationsgenauigkeit zu berücksichtigen. Insgesamt ist die Stimme älterer Sprecherinnen zittriger, tiefer, rauer und behauchter. Ältere Menschen beiderlei Geschlechts machen beim Vorlesen mehr Sprechpausen, sprechen insgesamt langsamer und artikulieren weniger genau. In Spontansprache zeigt sich, dass insbesondere die schnellen Abschnitte verlangsamt werden.»
Warum sprechen Frauen heute in tieferer Stimmlage als früher?
Walter Sendlmeier: «Es gibt zum einen Sprecherinnen mit einem höheren glockenförmigen Klang, die als sympathisch wahrgenommen werden. Diese Sprecherinnen sind aber immer in der Gefahr, in die sogenannte Kleinmädchenstimme noch weiter nach oben zu rutschen. Diese Stimmqualität wird heutzutage von der überwiegenden Mehrzahl der Hörer beiderlei Geschlechts nicht mehr als sympathisch, sondern als hilflos, inkompetent, subdominant und etwas dümmlich bewertet. Frauen mit tieferen Stimmen haben es heutzutage leichter, positiv wahrgenommen zu werden, wobei es aber wichtig ist, dass die Weiblichkeit nicht verloren geht.
Insbesondere für Frauen, die in der Öffentlichkeit stehen oder Führungspositionen bekleiden bzw. anstreben, ist eine Stimme, die etwas tiefer ist als der Durchschnitt der Frauen, ein Vorteil. Nachrichtensprecherinnen weisen diese Gemeinsamkeit auf. In der Regel senken diese ihre Stimme beim Einschalten der Mikrofone noch einmal zusätzlich um ca. zwei bis drei Halbtöne ab, um so kompetenter, glaubwürdiger und souveräner zu wirken. Auch am Beispiel bekannter Politikerinnen wie Maggie Thatcher oder Angela Merkel lässt sich aufzeigen, wie durch das Absinken der mittleren Stimmlage nach der Menopause die wahrgenommene Souveränität und Autorität und damit die Popularität insgesamt deutlich anstiegen.
Wichtig ist neben der Tonhöhe aber auch der Gesamtklang einer Stimme als hell oder dunkel, was nicht mit der Frequenz der Stimmlippenschwingungen zusammenhängt, sondern mit der Lage der Resonanzen (Formanten), die unter anderem von der Länge des Sprechtraktes abhängt. Durch Lächeln bzw. Vorstülpen der Lippen lässt sich leicht die Gesamtlänge des Sprechtraktes verändern und der damit einhergehende Gesamtklang als heller oder dunkler ist deutlich zu hören. „Das Lächeln, das man hören kann“. Diesen Rat gebe ich gern Ratsuchenden, die viel über das Telefon kommunizieren müssen. Die Zuordnung einer sprechenden Person zu einem Geschlecht ist also nicht nur von der Tonhöhe der mittleren Stimmlage abhängig, wie es in vielen Lehrbüchern steht, sondern in ganz erheblichem Masse auch von der Lage der Resonanzen im Sprechtrakt.
Die heutigen tieferen Stimmlagen von Frauen im Vergleich etwa zur Mitte des letzten Jahrhunderts können durchaus mit der zunehmenden Emanzipation von Frauen in den westlichen Industrieländern gesehen werden.
Vergleicht man etwa norwegische Frauen mit japanischen Frauen, so scheint dieser Zusammenhang naheliegend. Allerdings sind norwegische Frauen im Durchschnitt auch einen Kopf grösser als japanische Frauen. Und hört man sich Frauen im südlichen Spanien an, wo die Geschlechterrollen durch den sehr dominanten Katholizismus noch sehr traditionell aufgeteilt sind, so wundert man sich über die oft sehr tiefen und zum Teil auch rauen Frauenstimmen. Der soziolinguistische Erklärungsversuch hat also nur einen eingeschränkten explanativen Wert.»
Welche Unterschiede in der Sprechweise und im Stimmklang gibt es zwischen den privaten Sendern und den öffentlich-rechtlichen Medien wie SRF (Schweizer Radio und Fernsehen)? Mit welchen Folgen?
Walter Sendlmeier: «Deutliche Unterschiede in den Sprechweisen sind auch zwischen dem öffentlich-rechtlichen Rundfunk (ÖRR) und Privatsendern festzustellen. Hierzu haben wir bereits vor 21 Jahren eine vergleichende Untersuchung zwischen dem öffentlich-rechtlichen Deutschlandradio und dem privaten Radio NRJ durchgeführt. Mit Hilfe eines Polaritätsprofils wurden Sprechwirkungen erhoben und mit gemessenen akustischen Parametern in einen Zusammenhang gebracht. Insgesamt wurden die Sprechweise von Radio NRJ von den Hörern mit Attributen wie impulsiv, lebhaft, eher das Gefühl als den Verstand ansprechend, angespannt, unsympathisch, unangenehm und unaufrichtig beurteilt. Die Stimuli des Senders Deutschlandradio wurden deutlich positiver beurteilt.
Senderspezifische Eigenschaften der Parameter Grundfrequenz, Sprechgeschwindigkeit und Intensität stehen in einem direkten positiven Zusammenhang mit der Bewertung der Adjektivpaare der Dimension Erregung. Ebenso wird ein Zusammenhang zwischen der positiven Beurteilung bestimmter Adjektivpaare (wie sympathisch-unsympathisch, angenehm-unangenehm) und gleichmässiger Rhythmik im Sendervergleich deutlich. Ein geringer Abfall der Intonationskontur zum Äusserungsende bei gleichzeitiger Erhöhung der Anzahl deutlicher Betonungen beeinflusst die Bewertung der Adjektivpaare entspannt-angespannt, angenehm-unangenehm, sympathisch-unsympathisch in Richtung der negativen Eigenschaft.
In den vergangenen 20 Jahren hat ein Wandel eingesetzt, der zu einer mehr oder weniger starken Annäherung der Sprechweisen geführt hat. Der deutliche Schwund der jungen Hörerschaft hat dazu geführt, dass die ÖRR-Sendeanstalten neue Formate für das jugendliche Publikum entwickelt haben, in denen sich die Sprechweise in der Moderation den Privatsendern angenähert hat. Aber auch in einigen etablierten Sendungen des ÖRR ist insgesamt eine etwas emotionalere und erregtere Sprechweise zu beobachten. Gleichzeitig haben einige Privatsender ihre allzu marktschreierische Sprechweise etwas reduziert.»
Das Radio vermittelt Informationen einzig über den auditiven Kanal. Nur Stimme. Kein Gesicht. Wie beurteilen Radiohörer die Stimmen der Nachrichtensprecher bzw. der Radiomoderatoren? Welche Stimmen schaffen Vertrauen?
Walter Sendlmeier: «Die Erhebung eines Präferenzprofils ergab, dass Hörer unabhängig vom Geschlecht, Alter und Bildungsgrad recht homogene Vorstellungen davon haben, wie ein idealer Nachrichtensprecher klingen und sprechen sollte. Lediglich bei Merkmalen, die mit der Sprechgeschwindigkeit zusammenhängen, gibt es leichte Unterschiede zwischen den Altersgruppen der Hörer. Insbesondere haben wir Aspekte der Satzmelodie, der Betonung und der Sprechgeschwindigkeit als potentielle Einflussfaktoren bei der Erzielung positiver Sprechwirkungen untersucht.
Die Hörer bevorzugten Nachrichtensprecher mit einer etwas tieferen Stimme, als sie der Durchschnitt der Bevölkerung aufweist. Positiv eingeschätzt wurde eine nicht extrem rationale Sprechweise, in der dennoch keine stark ausgeprägten Tonhöhenbewegungen auftraten. Das Überwiegen gerader Konturen in der Satzmelodie ist als typisches Verlaufsmuster der Grundfrequenz für Nachrichtensprecher in den Daten erkennbar. Die Betonung wurde von der überwiegenden Zahl der Sprecher mit nur sehr geringen Tonhöhenbewegungen realisiert.
Bei der Moderation wird deutlich mehr Variation im Intonationsverlauf realisiert und die Betonungen werden entsprechend primär durch einen deutlichen Pitchakzent (ein relativ steiler Anstieg oder Abfall der Tonhöhe in der betonten Silbe) erzeugt unter Begleitung einer leichten Dehnung. Dies entspricht auch der Erwartung durch die Hörer.
Bei Nachrichtensprechern werden übermässige Längungen, ausgeprägte melodische Akzente und eine zu hohe Sprechgeschwindigkeit negativ bewertet. Hier ist aber zu berücksichtigen, dass die auditive Einschätzung der Sprechgeschwindigkeit durch eine komplexe Interaktion der Artikulationsrate mit der Pausensetzung und der Artikulationsgenauigkeit beeinflusst wird.
So wiesen der beste und der schlechteste Sprecher nahezu das gleiche Sprechtempo auf. Der gute Sprecher wurde aber deutlich langsamer eingeschätzt. Dies ist durch die häufiger und besser gesetzten, den Sinn gliedernde Pausen und durch die deutlichere Aussprache des guten Sprechers zu erklären.
Wenn Hörern solche Verarbeitungshilfen angeboten werden, dann erscheint ihnen auch das Tempo nicht zu hoch. Hörer folgen solchen Sprechern und Sprecherinnen am liebsten, die ihnen die Verarbeitung so leicht wie möglich machen.»
«Es nützt die schönste sonore Stimme nichts, wenn in der Betonungsstruktur, der Variation des Tempos, der sinngliedernden Pausensetzung und
Walter Sendlmeier, Sprechwirkungsforscher
der Aussprache viele Dinge suboptimal realisiert werden.»
Gemäss internen Leitlinien müssen Medienschaffende beim Schweizer Radio und Fernsehen (SRF) ihre persönliche Meinung möglichst zurückhalten. Und eindeutig ist Ihr wissenschaftlicher Befund zur Neutralitätsanforderung von Stimmen: Der neutrale Ausdruck kann tatsächlich von Sprechern erzeugt werden. Wie geht Neutralität in der Stimme?
Walter Sendlmeier: «Sobald ein emotionaler Ausdruck oder eine Bewertung des Gesagten durch einen Sprecher / eine Sprecherin vorgenommen werden, ändert sich die Stimme, die Artikulation und die Satzmelodie in systematischer Weise. Diese Indikatoren haben wir in zahlreichen Publikationen beschrieben. Durch Weglassen solcher Indikatoren entsteht eine neutrale Sprechweise. »
Eine objektive Berichterstattung erfordert eine neutrale Sprechweise. Woran erkennt das Publikum eine neutrale Sprechweise in Nachrichtensendungen wie der SRF-Tagesschau?
Walter Sendlmeier: «Diese Frage knüpft unmittelbar an die vorherige Frage an. Das Publikum erkennt, wenn in einer Sprechweise eine emotionale Färbung oder Bewertung enthalten ist. Fehlen solche Hinweise, so kann man davon ausgehen, dass es sich um eine neutrale Sprechweise handelt. Allerdings ist die Einstellung eines Sprechers zu der geäusserten Mitteilung weniger leicht zu durchschauen als eine emotionale Färbung.
Der Ausdruck und das Erkennen von Basisemotionen ist entwicklungsgeschichtlich sehr früh entstanden und lieferte als universelle Erscheinung schon in Form von Affekt- und Warnlauten vor der Ausbildung einer differenzierten sprachlichen Verständigung im Überlebenskampf relevante Information.
Die Bewertung einer Äusserung über eine Person oder einen Sachverhalt durch metasprachliche prosodische Veränderungen z.B. der Satzmelodie ist entwicklungsgeschichtlich als viel jüngere und subtilere Erscheinung zu betrachten.
Dem Publikum ist daher der Zugang zu dem Wirkungsgefüge nicht so unmittelbar möglich und bleibt oft im Unterbewusstsein verborgen. Die Beeinflussung des Publikums kann so unter dem Deckmantel der vermeintlichen Neutralität unterschwellig erfolgen.»
Ihre Forschungsarbeiten haben ein brisantes, bislang wenig beachtetes Ergebnis hervorgebracht: Sprecherinnen und Sprecher können mit ihrer Stimme beliebige Ereignisse und Personen bewusst aufwerten oder abwerten, mit ihrer Stimme Nachrichten positiv oder negativ ausdrücken und auslegen. Wie funktioniert das?
Walter Sendlmeier: «Hörer sind in der Lage, selbst bei neutraler Semantik anhand von Stimme und Sprechweise eine positive oder negative Einstellung des Sprechers zum Inhalt des Gesagten herauszuhören.
Die positiv wertende Sprechweise ist durch eine höhere mittlere Stimmlage und eine erhöhte Sprechgeschwindigkeit gekennzeichnet. Die Betonung wird ganz überwiegend primär durch Tonhöhenänderungen realisiert und nicht durch Änderungen der Lautstärke oder Dehnungen. Die Äusserungen sind rhythmisch beschwingt und abwechslungsreich.
Die negativ wertenden Äusserungen klingen häufig gelangweilt, manche erzeugen sogar den Eindruck von Unlust oder Abscheu. Die mittlere Sprechstimmlage ist deutlich tiefer und die Sprechgeschwindigkeit deutlich langsamer. Die Stimme klingt meist normal, aber bisweilen ist sie durch Behauchungen und Laryngalisierungen (knarrende Stimmanteile) gekennzeichnet. Die Betonung erfolgt primär durch Dehnungen; eine Akzentuierung durch Tonhöhenvariation kommt dagegen selten vor. Die Satzmelodie erscheint eher monoton.
Die akustischen Messungen bestätigen den auditiven Eindruck. Neben der Objektivierung können die akustischen Messungen aber auch noch weitere Details in der Unterscheidung der beiden Sprechweisen offenbaren.
Für die Grundfrequenzverläufe werden neben den Mittelwerten und den Häufigkeitsverteilungen auch Streuungsmasse (Standardabweichung und Range) sowie die Grundfrequenzwerte am Anfang und am Ende einer Äusserung zur Beschreibung herangezogen. Zur weiteren Deskription der Grundfrequenzkonturen in ihrer Gesamtheit haben wir die Grundfrequenzverläufe mit einem Verfahren stilisiert, das weitgehend nur die perzeptiv relevanten Veränderungen der Grundfrequenz berücksichtigt. Anhand dieser stilisierten Konturen wurden die Zahl der Richtungswechsel und die Steilheiten der Konturen ermittelt.
Die Geschwindigkeiten der Tonhöhenbewegungen sind bei der pejorativen Sprechweise deutlich geringer als bei den positiv wertenden Äusserungen. Das Verhältnis von steigenden und fallenden Tonhöhenbewegungen ist umgekehrt: Während bei positiver Wertung die Anstiege kürzer und steiler als die fallenden Bewegungen sind, trifft für negative Wertungen das Gegenteil zu.
Zahlreiche Dauermessungen auf Einzellaut- und Silbenebene und auch für Betonungsgruppen führen zu weiteren Details in der Unterscheidung der positiv wertenden bzw. negativ wertenden Sprechweise. Die längeren Silbendauern in der negativ wertenden Sprechweise kommen primär durch die Dehnung der Vokale zustande; aber auch die Dauer der Frikative ist in den abwertenden Sätzen signifikant grösser als in den positiv wertenden Sätzen.»
Ein Profisprecher der SRF-Tagesschau, der mit seiner Stimme aus dem Off wirkt, versteht seine Aufgabe in einem «Hallo SRF»-Promovideo ab Minute 2:26 so: «Meine Meinung tut nichts zur Sache. Ich muss neutral sein, aber nicht teilnahmslos, also nicht empathielos.» Ist das nicht ein Widerspruch in sich? Wie stufen Sie dieses Selbstverständnis aus dem Hause SRF ein?
Walter Sendlmeier: «Dieser Anspruch ist nicht einlösbar. Eine echte Neutralität kann nicht gleichzeitig Anteilnahme ausdrücken.»
«In der Tat haben die Mainstream-Medien in den letzten Jahren
Walter Sedlmeier, Sprechwirkungsforscher
immer stärkere Züge der Agitation und Propaganda angenommen.
In den audiovisuellen Medien manifestiert sich dieses auch
in der Stimmführung und in der Sprechweise.»
Mehr und mehr tendieren «Mainstream-Medien» zu staatsgefälligen Lautsprechern der Regierungspropaganda, zu einem quasi gleichgeschalteten Verlautbarungsjournalismus. Die ursprüngliche Kontrollfunktion der Medien als vierte Gewalt im Staate scheint passé. Schlägt sich diese Entwicklung in der Stimme und Sprechweise der Sprecher nieder?
Walter Sendlmeier: «In der Tat haben die Mainstream-Medien in den letzten Jahren immer stärkere Züge der Agitation und Propaganda angenommen. In den audiovisuellen Medien manifestiert sich dieses auch in der Stimmführung und in der Sprechweise. Es wird auf eine sehr subtile Art – insbesondere durch Variation der Satzmelodie – quasi auf einer Metaebene eine Bewertung des Inhaltes vorgenommen. Der schriftlichen Version der Äusserung sieht man diese Bewertung nicht an, da in der Kodifikation unserer Alphabetschrift und der sehr reduzierten Interpunktion keine Hinweise auf solche extralinguistischen Informationen enthalten sind.»
Auffallend ist, dass in der Schweizer Tagesschau etwa Nachrichten zum Klimawandel (aktuell etwa tiefer Wasserstand am Bodensee) mit einer langsamen, tiefen, traurigen, monotonen Stimme aus dem Off belegt werden, hingegen in einer lokalen TV-Station die Abschaffung von Parkplätzen in der Stadt Zürich mit schneller, zügiger, modulierter Stimme besprochen wird. Wie kann das mich als Zuschauer von Nachrichtensendungen beeinflussen?
Walter Sendlmeier: «Ihr Beispiel der unterschiedlich gesprochenen Meldungen zur Reduktion der Parkflächen in Zürich auf der einen Seite und die Wasserstandsmeldung des Bodensees auf der anderen Seite veranschaulicht dies sehr schön.
Die Abschaffung der Parkflächen in Zürich wird mit einer freudigen, fast heiteren Intonation gesprochen, was den Hörern eindeutig suggeriert: Dies ist eine positive Nachricht. Der niedrige Wasserstand des Bodensees hingegen wird mit tieferer und monotonerer Stimmführung realisiert und die Betonungen werden primär durch Dehnungen erzeugt. Dies signalisiert der Hörerschaft, dass es sich um eine negative Meldung handelt.
Die Wirkung dieser Bewertung wird den Hörern aber in der Regel nicht wirklich bewusst. Mündlichkeit ist sehr flüchtig, so dass Laien meist nicht in der Lage sind, diesen Vorgang tiefer zu durchdringen. Es bleibt aber der Effekt, dass die eine Meldung positiv wirkt und die andere negativ. Dies stellt eine Manipulation der Hörer dar und entfernt sich somit von einer neutralen und objektiven Berichterstattung. Noch drastischere Beispiele solcher bewertenden Stimmführung waren in den letzten Wahlkämpfen zu beobachten, in denen Politiker verschiedener Parteien mit sehr unterschiedlichem Tonfall interviewt wurden.»
Gute Journalisten sind selten auch gute Sprecher. SRF, so der Schweizer Medienkritiker René Hildbrand, begehe in Sendungen wie Schweiz aktuell oder der Tagesschau häufig den Fehler, Korrespondenten und Autoren ihre Beiträge selbst sprechen zu lassen – statt dafür ihre Profisprecher einzusetzen. Gehen Sie da als Sprechwissenschaftler mit?
Walter Sendlmeier: «Solange die Verständlichkeit nicht gravierend beeinträchtigt wird, sollten die Journalisten ihre Beiträge unbedingt selbst sprechen. Dies hat auch etwas mit Glaubwürdigkeit zu tun. Eine Reportage aus einem Krisengebiet darf bzw. muss auch einen etwas höheren Erregungsgrad aufweisen, um die Dramatik der Situation zu erfassen.
Stimmen müssen nicht schön sein im Sinne einer logopädischen bzw. phoniatrischen Stimmreinheit. So kann z.B. eine gewisse dunkle Rauigkeit bei Männerstimmen durchaus als sympathisch wahrgenommen werden. Dadurch entsteht etwas Markantes, was den Wiedererkennungswert erhöht und quasi zum Markenzeichen eines Sprechers wird.
Eine Journalistin / einen Journalisten, der/die z.B. aus einem Erdbebengebiet berichtet, nicht selbst sprechen zu lassen, sondern durch eine/n Studiosprecher/in zu ersetzen, würde die Authentizität der Berichterstattung sehr beeinträchtigen. «Authentisch» – ein schreckliches Modewort, aber in diesem Kontext doch einmal angebracht.»
Wie schaut ein Sprechwirkungsforscher wie Sie Nachrichtensendungen am Fernsehen an? Worauf achten Sie – Inhalte, Bilder … oder nur auf die Stimme?
Walter Sendlmeier: «Beim Einschalten von Nachrichtensendungen bin ich zunächst an den Inhalten interessiert. Aufgrund meiner jahrzehntelangen Übung im analytischen Hören fallen mir aber ganz schnell auch nebenbei Besonderheiten in der Stimme und Sprechweise der Nachrichtensprecher und Moderatoren auf. Es gelingt mir auch sehr leicht, auf ein rein analytisches Hören umzuschalten und mich ganz selektiv auf bestimmte Stimm- und Sprechmerkmale zu konzentrieren. Hierzu ist es notwendig, die Bedeutungsebene völlig auszuschalten. Dies ist etwas, was Laien besonders schwerfällt, da es das natürliche primäre Ziel jeder Worterkennung ist, eine Klanggestalt als vertrauten Zeichenträger wieder zu erkennen und damit Zugriff auf die Bedeutung zu erlangen. Auch bemühe ich mich, die Bilder nicht zu dominant werden zu lassen; notfalls schliesse ich die Augen, um mich ganz auf die lautsprachliche Ebene zu konzentrieren.»
Und worauf achtet der Professor für Sprechwirkung bei Nachrichtensendungen im Hörfunk?
Walter Sedlmeier: «Hier ist die Neigung, auf die Art und Weise wie gesprochen wird zu achten, um so ausgeprägter. Bilder als potentielle Distraktoren müssen nicht ausgeblendet werden. Allerdings werden in unserem Gehirn die Information der beiden Kanäle (auditiv und visuell) in der Alltagskommunikation von Angesicht zu Angesicht ständig miteinander verknüpft. Selbst wenn ein Kanal fehlt, wird die gelernte Assoziation des anderen Kanals aktiviert. Wenn wir also z.B. am Telefon oder im Radio eine vertraute Person nur sprechen hören, werden Gehirnareale aktiviert, die für das Erkennen von Gesichtern entscheidend sind. Dies konnte mithilfe funktioneller Magnetresonanztomografie nachgewiesen werden.»
Ihr Standardwerk «Sprechwirkungsforschung» gilt als Referenz schlechthin, wenn es um die Bedingungen und Wirkung von Stimme und Sprechweise geht. Welche wissenschaftlichen Fachbereiche umfasst Ihr Ansatz? Mit welchen wissenschaftlichen Methoden arbeiten Sie?
Walter Sedlmeier: «Wie wirken Menschen aufgrund ihrer Stimme und Sprechweise auf andere Menschen? Die Erforschung dieser Zusammenhänge folgt einem methodischen Dreiklang. Zunächst werden Hörerurteile durch Experten und Laien erhoben, wobei den Laien Skalierungshilfen und Klassifikationshilfen zur Verfügung gestellt werden, wie z.B. Items aus einem Persönlichkeitstest oder ein Polaritätsprofil in Form von bipolaren Adjektivpaare wie z.B. „ruhig vs. lebhaft“, „sicher vs. unsicher“, „abwechslungsreich vs. eintönig“, „unaufrichtig vs. aufrichtig“ oder „natürlich vs. unnatürlich“. Auf siebenstufigen Skalen, die durch solche Gegensatzpaare definiert sind, können auch Laien sehr spontan und zuverlässig Bewertungen abgeben.
Durch die auditive Analyse geleitet, werden zweitens gezielte sprachakustische Messungen durchgeführt. In einem dritten Schritt werden die beiden Datenbereiche (Hörerurteile und sprachakustische Messungen) aufeinander bezogen. Die sprachakustischen Messungen allein liefern keinerlei Erkenntnis über funktionale Zusammenhänge. Erst wenn man Messungen auf Hörerurteile bezieht, können Zusammenhänge zwischen sprecherseitigen Merkmalsausprägungen und hörerseitigen Attribuierungen von Sprechereigenschaften erkannt werden.»
Manager kennen sie, Pädagogen lieben sie, hierzulande in Gymnasien und Berufsschulen sind deren «Kommunikationstheoretische Texte» Programm: Die Kommunikationsmodelle von Schulz von Thun und Watzlawick sind populär. Welches Modell gibt es für Sprechwirkung?
Walter Sedlmeier: «Das Attributionsmodell der mündlichen Kommunikation stellt den Rahmen meines Ansatzes in der Sprechwirkungsforschung dar. Es erfasst die Hörerbeurteilungen auf der Grundlage stimmlicher Merkmale».

Das berühmte «Kommunikationsquadrat» von Schulz von Thun umfasst vier Schnäbel (Sprecher) und vier Ohren (Hörer) zu «Sachaussage», «Selbstoffenbarung», «Beziehung « und «Appel». Sprecher und Hörer, Schnäbel und Ohren in einem Modell – was kann es für Sie als Sprechwirkungsforscher Besseres geben?
Walter Sendlmeier: «Das sehr verbreitete Kommunikationsquadrat von Schulz von Thun eignet sich leider gar nicht als Ausgangspunkt für unsere Sprechwirkungsforschung, da Schulz von Thun in seinen Fallbeispielen doch sehr im Schriftlichen verhaftet ist und er raffiniert die Unzulänglichkeiten unseres Schriftsystems im Hinblick auf die Erfassung von z. B. emotionaler Färbung in Stimme und Sprechweise benutzt, um vermeintliche Missverständnisse zu postulieren.
In der mündlichen Alltagskommunikation wird die Beziehungsebene, die für Schulz von Thun ein besonderes Anliegen darstellt, in der Regel durch eine spezifische Sprechweise, einen besonderen Stimmklang und durch prosodische Eigenschaften wie etwa die Satzmelodie und die Art der Betonung zum Ausdruck gebracht.
Hörer haben für solche nichtlinguistischen Merkmale, die als Indikatoren z.B. des emotionalen Ausdrucks eingesetzt werden, ein sehr feines Gespür.
Mitnichten entstehen im Alltag ständig Missverständnisse, weil die Kommunikationspartner angeblich diese extralinguistischen Hinweise falsch interpretieren. Gerade bei sehr vertrauten Personen wissen wir die Nuancen von Stimme und Sprechweise sehr genau zu interpretieren.»
Paul Watzlawick prägte das Axiom «Man kann nicht nicht kommunizieren» – auch wenn ich schweige, sende ich. Wie kommt Watzlawicks Modell auf dem Prüfstand der Sprechwirkungsforschung weg?
«Auch ich war einmal als Studienanfänger sehr von den Schriften angetan. Eine genauere professionelle Beschäftigung mit seinen Texten entzauberte allerdings bald den vermeintlichen Erkenntnisgewinn.
Seine ganze Begriffsapparatur mit den sogenannten fünf Axiomen steht auf wackligen Füssen. Ich will dies nur kurz am Beispiel des bekanntesten Axioms «Man kann nicht nicht kommunizieren», das tausendfach zitiert wird, aufzeigen. Watzlawick setzt die Begriffe «Verhalten» und «Kommunikation» gleich, denn nach Watzlawick beeinflusst jegliches Verhalten eines Teilnehmers das Verhalten aller Teilnehmer, so dass man sein Axiom umformulieren kann in «Man kann sich nicht nicht verhalten». Damit findet eine Ausweitung des ohnehin schon recht vagen Begriffs «Kommunikation» hin zu einem noch breiteren Begriffsfeld «Verhalten» statt. Dies läuft dem grundsätzlichen wissenschaftlichen Bestreben entgegen, durch Einführung wohldefinierter Fachtermini den Gebrauch von Begriffen gegenüber der Alltagssprache einzugrenzen und zu präzisieren.
Die Tatsache, dass Sprechen als soziales Handeln zu betrachten ist, das stets intentional, also mit einer Mitteilungsabsicht auf das Verhalten eines anderen bezogen wird und daran in seinem Ablauf orientiert ist – wie schon Max Weber betonte – wird in Watzlawicks Ansatz völlig negiert. Sein Axiom «Man kann nicht nicht kommunizieren» wird zu einer Leerformel, die zu keinerlei Erkenntnisgewinn führt.»
Freundlicherweise haben Sie den aktuellen Lehrplan 21 für die Volksschule in der Schweiz bezüglich der Kompetenzen «Sprechen» und «Hören» gesichtet? Ihr Befund als Experte für Sprach- und Sprechwirkung? Und Ihre Empfehlung an die Volksschule in der Schweiz?
Walter Sendlmeier: «Es ist sehr erfreulich, dass im Lehrplan 21 das Hören in seinen unterschiedlichen Facetten explizit zum Lernziel erhoben wird.
Hier kann die Schweiz mal wieder Vorbild für andere Länder sein.
Insbesondere das Erkennen von Emotionen anhand des Sprechausdrucks für die Altersgruppe 2 möchte ich besonders hervorheben. Eine rasche und zuverlässige Emotionserkennung stellt einen Vorteil im Sinne einer erfolgreichen Interaktion dar. Untersuchungen für den beruflichen Alltag zeigen, dass Personen mit hoher Emotions-Erkennungsfähigkeit von Kollegen und Vorgesetzten als sozial kompetenter eingeschätzt werden. Und ihnen wird auch eine bessere Kooperation mit anderen attribuiert.
In der Alltagskommunikation entstehen von unserem Gegenüber in Sekundenschnelle erste Eindrücke. Diese sind oft die Grundlage für die Einstellung und Verhaltensweise gegenüber dem jeweiligen Kommunikationspartner. Je besser wir unsere Gesprächspartner einschätzen können, desto adäquater können wir auf sie eingehen.»
In den Volksschulen wird in Gemeinden und Kantonen ein Handyverbot zum Politikum. Eine einheitliche Regulierung zeichnet sich nicht ab. Der Kanton Nidwalden hat beschlossen, dass Mobiltelefone an Volksschulen nur noch zu Unterrichtszwecken oder im Notfall benutzt werden dürfen. Wie sehen Sie die Auswirkungen dieser Entscheidung für die Entwicklung mündlicher Kommunikationskompetenzen der Kinder und Jugendlichen?
Walter Sendlmeier: «Der Beschluss des Kantons Nidwalden, Mobiltelefone nur noch zu Unterrichtszwecken oder im Notfall zu erlauben, wird dem Lernerfolg der Kinder sehr zugute kommen.
Die allgegenwärtige Präsenz der Mobiltelefone führt zu einer permanenten Ablenkung, so dass Kinder und Jugendliche eine längere Konzentration auf bestimmte Problemlösungen oder Lerninhalte kaum noch aufbringen können. Der intensive Konsum vieler Plattformen, die bei Jugendlichen besonders beliebt sind, führt aufgrund der oft oberflächlichen Inhalte und der zeitlich sehr kurzen Taktung dazu, dass die Aufmerksamkeitsspanne immer kürzer wird.
Das sofortige Einschalten der Handys in den Pausen bewirkt, dass der gerade gelernte Stoff durch die Flutung mit Informationsmüll maskiert wird. Aber es findet nicht nur ein backward masking statt, sondern – wie wir aus Gedächtnisexperimenten wissen – auch ein forward masking. Wenn die Kinder und Jugendlichen emotional besonders aufwühlende Videos anschauen, so wird die Bereitschaft zur Aufnahme anderer, für sie relevanter Information nahezu blockiert.»
SICHTWEISENSCHWEIZ.CH dankt Professor Walter Sendlmeier für das Interview.
Kurzporträt Walter Sendlmeier

Buchempfehlung

Um die Ergebnisse der Sprechwirkungsforschung einordnen zu können, werden im ersten Teil des Buches wichtige Grundlagen der mündlichen Kommunikation erklärt. Hierbei werden in einer interdisziplinären Zugangsweise psychologische, linguistische und medizinische Aspekte des sprechsprachlichen Ausdrucks genauso wie Grundlagen der Sprachakustik und der Kommunikationstheorie erläutert.
Mehr zum Standardwerk von Walter Sendlmeier: Sprechwirkungforschung. Grundlagen und Anwendungen mündlicher Kommunikation. Logos Verlag Berlin. 3. korrigierte Auflage 2019.
Gut zu wissen: Höhen und Tiefen
«Die Stimmlippen von Erwachsenen sind etwa 1,5 bis 2,5 Zentimeter lang. Da Männer im Durchschnitt einen grösseren Kehlkopf haben – häufig ist er sogar am Hals sichtbar – besitzen sie in der Regel auch längere und dickere Stimmbänder als Frauen, und längere Stimmbänder schwingen vergleichsweise langsamer. Je langsamer wiederum die Schwingung, desto tiefer der Ton. Daher sprechen Männer generell tiefer als Frauen: Der männliche Grundton liegt bei 120 Hertz, der weibliche bei 200 Hertz. 200 Hertz bedeutet 200 Schwingungen pro Sekunde. Die Stimmlippen von Neugeborenen sind bloß etwa 6 Millimeter lang, entsprechend hoch ist die Frequenz, mit der sie schreien: Sie liegt bei 440 Hertz. Und exakt diese Frequenz hat auch der Kammerton a, nach dem Musiker*innen ihre Musikinstrumente stimmen.» Quelle: Rieke Wiemann, taz, 3./4. September 2022, Seite 35.
Bildnachweis: Hauptbild SRF Schweizer Radio und Fernsehen. Das Tagesschau-Moderationsteam im Studio, von links Cornelia Boesch, Andrea Vetsch, Florian Inhauser und Michael Rauchenstein.
Es wurde noch kein Kommentar veröffentlicht.