-
WIE TV-BEITRÄGE VERSTÄNDLICH BETEXTET WERDENDAS EINMALEINS DES TEXTENS
auf Anfrage:
Erstellen professioneller Videodokumentationen, von der Konzeption bis zum fertigen Film.
3-5 Tage auf Anfrage – für (Quer-)Einsteiger, Printjournalisten und Fotografen, die ihr Kompetenzfeld erweitern wollen.
Kamera-Intensiv-Workshop.
3-5 Tage auf Anfrage. Kameratechnik, Lichttechnik, Bildgestaltung, Szenenauflösung, 4K-Workflow, Arbeit mit Kameradrohne und Gimbal – für Einsteiger, Print-Journalisten und Fotografen, die ihr Kompetenzfeld erweitern wollen.
Schnitt und Postproduktion – vom Rohmaterial bis zur Endfassung.
3-5 Tage auf Anfrage. Projekt-Organisation, Montagetechniken, Rhythmus, Erzähldramaturgie, szenisches Schneiden, dokumentarisches Schneiden, Archivierung, 4K-Workflow – für (Quer-)Einsteiger, Printjournalisten und Fotografen, die ihr Kompetenzfeld erweitern wollen.
Wenn Sie Interesse an unseren Workshop-Angeboten haben, schreiben Sie uns bitte unter workshops@september-film.de.
Get Social
Das Einmaleins des Textens – wie Fernsehbeiträge verständlich getextet werden
Schöne Texte schreiben ist eine Sache, fürs Fernsehen schreiben ist etwas ganz anderes. Wenn ein Text mit dem Kamerabild konkurriert, gelten ganz eigene Gesetze.
Was wäre eine Reportage ohne Text? Wir erwarten den informativen, spannenden Sprechertext so selbstverständlich wie Messer und Gabel im Restaurant. Ohne Zerkleinerung in mundgerechte Häppchen durch Besteck oder Text läge ein mühsames Stück Arbeit vor uns. Ein guter Text fügt sich dabei so nahtlos in den Film ein, dass sein Besteck völlig unauffällig bleibt. Da ist es schwer, allein durchs Zuschauen die Gesetzmäßigkeiten zu erkennen. Kein Wunder, dass sich nicht nur der Hobbyist bei der Vertonung seines Vereinsfilms die Zähne ausbeißt, sondern auch erfahrene Fernsehautoren eine Menge Zeit investieren müssen, bis der Sprechertext sitzt und so selbstverständlich daherkommt, wie wir es am Bildschirm gewohnt sind. Denn es handelt sich um eine ganz eigene Sprache, eine Kunstform, die besonderen Gesetzen folgt und gut geübt sein will.
Die übliche Aufgabe des Textes ist es, dem Zuschauer mitzuteilen, was er ohne Sprecher nicht erfahren würde, was also im Bild nicht zu sehen ist. Eine Beschreibung von Bildern, wie sie im Radio und in der Zeitung vor- kommt, ist am Bildschirm nur in den seltensten Fällen sinnvoll. Sie wird meist als langweilig oder sogar als Verhohnepipelung empfunden.
Eine schöne und aufschlussreiche Ausnahme ist die Sendung mit der Maus. Hier wird Bild- und Sprachinformation bewusst gedoppelt, z.B.: Das Bild zeigt einen Jungen, der in die Schule geht. Der Text dazu lautet: „Das ist Hans. Er geht in die Schule“. Diese an Kinder gerichtete Machart hat einen einfachen Grund. Unser Nerven- und Wahrnehmungssystem ist weit mehr der Steinzeit als dem Fernsehen verhaftet. Darin liegt die ganze Herausforderung des Textens für Fernsehen und Film. Der Mensch ist nicht auf die gleichzeitige Auswertung von gesprochenem Text und Bildern programmiert. Es geht nur entweder, oder. Entweder können wir uns aufs Bild oder auf den Text konzentrieren. Die Sendung mit der Maus erleichtert Kindern die gleichzeitige Verarbeitung von Bild und gesprochenem Text. Doch auch in der Erwachsenenwelt der Nachrichtenbeiträge, Reportagen, Imagevideos und Spielfilme besteht die Kunst immer darin, die begrenzte Aufnahmefähigkeit des Zuschauers durch die Dosierung von abwechselnder Bild- und Textintensität so raffiniert zu lenken, dass beide Ebenen nicht nur wahrgenommen, sondern auch verstanden werden.
Sprachverarbeitung im Gehirn. Die linke Gehirnhälfte des Menschen ist, vereinfacht ausgedrückt, für Logik, Sprache, zeitliche Einordnung und für die Analyse von Fakten zuständig. Ja und Nein, Für und Wider, Vorher und Nachher werden hier entschieden und gesprochener Text in einzelne Schritte zerlegt. Verstehen erfolgt über die Identifizierung einzelner Laute, leichter und schneller aber immer über bekannte Lautfolgen, also Begriffe und Wortgruppen, die von der linken Gehirnhälfte erkannt und eingeordnet werden können. Je klarer der gesprochene Text und je besser er durch Sinn gebende Sprechpausen gegliedert ist, desto besser und schneller verstehen wir. Je nach Text kommt hier zusätzlich die rechte Gehirnhälfte ins Spiel, die, ebenfalls vereinfacht ausgedrückt, für Emotionen und alles Bildhafte zuständig ist. Sie verarbeitet nicht nur die mit den Augen gesehenen Bilder, sondern auch das Bildhafte der Sprache, zum Beispiel Begriffe wie „ohne Zerkleinerung in mundgerechte Häppchen“. Solche Bildhaftigkeit fördert den emotionalen Zugang, denn das stimuliert die rechte Gehirnhälfte. Die Formulierung von Bildern im Text ist jedoch nur dann sinnvoll, wenn im Zuschauer tatsächlich Gefühle angeregt werden sollen. Denn dies geht immer auf Kosten der analytischen Aufmerksamkeit.
Die Macht der Bilder. Generell gilt: Starke Bilder, schnelle Schnittfolgen, hektische Bildbewegungen entziehen dem Gesprochenen die Aufmerksamkeit. Lange Kamerafahrten und ruhige Bilder wiederum geben dem Zuschauer die Chance, sich auf den Text zu konzentrieren. Solche eher reizarmen Bilder erfordern weniger Aufmerksamkeit, die dann dem Text zur Verfügung steht. Alle Untersuchungen belegen, dass Zuschauer sich bei ruhigen Schnittfolgen besser an gesprochene Inhalte erinnern können als bei schnellen. Die Schlussfolgerung, dass lange Einstellun- gen demnach die ideale Grundlage für bessere Filme seien, wäre jedoch zu kurz gegriffen. So entspannend lange Kamerafahrten für unser Gehirn sind, die Aufmerksamkeit lässt schon nach zwanzig Sekunden dramatisch nach, wenn man immer nur das selbe Bild zu sehen bekommt, beispielsweise bei einem Interview – ganz unabhängig davon, wie spannend die Äußerungen des Interviewpartners sind. Der Mensch braucht visuelle Reize. Er ist ein Augenmensch, ein Jäger. Wir dürfen ihm die starken Bilder nicht wegnehmen, um gesprochene Texte besser zur Geltung zu bringen. Uns bleibt nur, diese Texte nach wahrnehmungspsychologischen Kriterien zu formulieren und exakt zu positionieren.
Text-Bild-Scheren. Die weitverbreitete Arbeitsweise, bei der der Text geschrieben wird, bevor das gedrehte Material vorliegt, mündet häufig in Text-Bild-Scheren, also die fehlende Beziehung von Bild und Text. Ein Beispiel: „Tausende von Menschen stehen vor dem Stadion Schlange. Sie alle wollen dem Jahrhundertereignis beiwohnen.“ So weit der vorformulierte Text. Die Bilder zeigen aber nur Polizeikräfte auf einem sonst menschenleeren Vorplatz. Denn das Kamerateam kam zu spät, um noch Schlange stehende Menschenmassen vorzufinden. Bekommt der Zuschauer im Text andere Informationen vermittelt als im Bild, hat sein Gehirn ein Entscheidungsproblem. Was stimmt, was nicht?
Der Sprechertext muss allerdings keineswegs dauernd vom Bild gestützt werden. Der Zuschauer ist durchaus bereit zu akzeptieren, dass sich Text und Bild kurzeitig voneinander entfernen. Wirklich verwirrend wird die Text-Bild-Schere immer erst dann, wenn Bild und Text sehr konkret sind, so wie im eben genannten Beispiel. Soll der Zuschauer nun auf den Text hören und die dazu gezeigten, unpassenden Bilder ignorieren, oder soll er den Bildern folgen und den Text vergessen? Er wird immer letzteres tun. Das ist die Macht der Bilder. Das ist der Jäger in uns.
Die Aufgabe besteht nun darin, den vorab gefertigten Text (siehe auch „Das Konzept ist die halbe Miete – zur Konzeption von TV-Magazin-Beiträgen“) mit den Bildern zu synchronisieren: „Sechzehn Uhr dreißig. Die geballte Polizeipräsenz vor dem Stadion lässt erahnen, dass sich eben hunderttausend Menschen durch die Tore drängten. Alle wollen dem Jahrhundertereignis beiwohnen.“ Text-Bild-Scheren treten auch dann häufig auf, wenn dem Autor keine Bilder vom Ereignis zur Verfügung stehen, über das er berichtet – ein typisches Problem bei Pressekonferenzen. Denn dort gibt es nur Referenten, Funktionäre, Kamerateams und Journalisten zu sehen. Mit den bekannten Schwenks über die Kamerakollegen lässt sich zwar Wichtigkeit suggerieren, aber kein Thema vermitteln. Also greift der Reporter auf Archivbilder zurück, die meist nicht genau passen. Die Ergebnisse kennt jeder aus den Fernsehnachrichten, und kaum einer stört sich noch an ihnen. Doch wie sehr Text-Bild-Scheren das Verständnis dennoch behindern, belegen Untersuchungen, nach denen sich Zuschauer nicht einmal fünf Prozent der Inhalte solcher Beiträge merken können.
Text-Bild-Scheren entschärfen. Die Problematik der Text-Bild-Schere lässt sich entschärfen, wenn man den Satz mit einem Wort beginnen lässt, das konkret an die Bildaussage andockt. Dies fördert die Verständlichkeit enorm. Von diesem Synchronpunkt ausgehend kann der Text dann ohne Zuschauerirritation auch Inhalte ausführen, die nicht im Bild gezeigt werden. Ist das Bild zum Beispiel eine Herzoperation, sollte der Satzanfang dieses Bild ansprechen: „Herzoperationen…“ In dieser Weise synchronisiert, kann der nachfolgende Text auch abstrakte Inhalte vermitteln, ohne den Zuschauer zu irritieren und zu überfordern: „…sind heute Standard auch in kleineren Krankenhäusern.“ Der zweite Teil des Satzes kann also über etwas informieren, was im Bild nicht zu sehen ist, bzw. was man nicht zeigen kann. Dasselbe gilt für zusammengesetzte Sätze. Der Hauptsatz wird mit der Aktion im Bild synchronisiert. Dadurch kann sich der Nebensatz eine Text-Bild- Schere erlauben, ohne Verwirrung zu stiften. Beispiel: Eine schöne, blonde Frau betritt den Saal. Text: Das ist Iris, die Anselm im Zug angesprochen hatte und in die er sich bald unsterblich verlieben würde.“ Der Hauptsatz spricht das Bild an, der Nebensatz beschreibt, was wir nicht zeigen können.
Bevormundung vermeiden. Geschmacksurteile haben im Kommentartext nichts zu suchen. Der Zuschauer lässt sich ungern bevormunden, jedenfalls nicht offenkundig. Er bildet sich lieber aufgrund von Fakten seine Meinung. Vorsicht also mit Adjektiven. Sie sind die Bewertungskeulen unserer Sprache. „Die schreckliche Finanzkrise fordert ihren furchtbaren Tribut.“ Mehr solcher Sätze, und der Autor hat das Vertrauen des Zuschauers verspielt.
Vorsicht mit Dopplungen. „Das brutale Narbengesicht des Schwerverbrechers verzieht sich zu einem hinterhältigen Lachen.“ Auch Dopplungen gehen häufig auf das Konto von Adjektiven. Die genaue Beschreibung dessen, was im Bild zu sehen ist, hat in reinen Informationsfilmen nichts verloren. Es ist jedoch ein bei Reportagen häufig angewandtes Stilmittel, um nüchterne Kamerabilder mit Gefühlen und Bedeutung aufzuladen. Auch hier lässt sich der Zuschauer nur bis zu einem gewissen Grad gut gelaunt bevormunden. Ganz schlecht wäre, wenn die emotionale Aussage des Textes nicht zum Bild passt, wenn also beispielsweise das Narbengesicht nicht brutal aussieht, sondern mitleiderregend. Auf Nummer sicher geht, wer sich an folgende Grundregel hält: Gesprochener Text ist nur dann sinnvoll, wenn er weitergehende Informationen vermittelt, die dem Bild allein nicht zu entnehmen sind und ihm auch nicht widersprechen.
METAPHERN BELEBEN. Metaphern sind das Salz in der Suppe, aber sie können die Suppe auch versalzen. Sie schaffen Sinnbilder. Sinnbilder stimulieren die rechte Gehirnhälfte. Diese ist für unsere Gefühlswelt und alles Bildhafte zuständig. Schon bekommt die trockenste Materie Gefühle eingehaucht. Wir können die Information auf mehreren Ebenen wahrnehmen und erinnern uns später besser. Gedächtnistrainer arbeiten immer mit Bildern, die sich der Proband beispielsweise im Zusammenhang mit Namen vorstellen soll. Ich habe in diesen Artikel bewusst viele Metaphern eingebaut. Allein in diesem Abschnitt sind es bislang fünf: „beleben – das Salz in der Suppe – versalzene Suppe – trockene Materie – eingehaucht.“ Viele sind uns als solche gar nicht mehr gegenwärtig, und das sind die gefährlichen. Denn auch wenn wir uns ihre konkrete Bildhaftigkeit oft nicht mehr bewusst machen, unser Gehirn entschlüsselt sie als Bilder. Solange das im weitesten Sinn passt, fällt es dem Zuschauer nicht auf. Wenn im Bericht über eine Süßspeise jedoch das Salz in der Suppe fehlt, kommt er in einem inneren Konflikt. Was gilt? Die Süßspeise oder die salzige Suppe? Diese unbewussten inneren Konflikte führen immer zu Ermüdung beim Zuschauer, genauso wie abgedroschene, zu oft wiederholte Metaphern. Er will nicht mit „Spitzen von Eisbergen“ und mit „heißen Kartoffeln“ abgespeist werden, die fallen gelassen wurden.
TEXTEN FÜRS HÖREN. Gesprochenem Text kann der Zuschauer nicht in seinem persönlichen Rhythmus folgen. Er wird von Tempo des Sprechers bestimmt, und er kann nicht nachlesen, was er nicht verstanden hat. Fernsehtexte müssen also beim ersten Hören verstanden werden. Alles, was dies erschwert, ist ein Angriff auf den Zuschauer und letztlich auf den Film. Die Sätze sollten so kurz sein, dass sie auf Anhieb verstanden werden können. Je kürzer, desto besser. Schachtelsätze können nur im Autor selbst die Anwartschaft auf höhere Fernsehweihen wecken, der CvD (Chef vom Dienst), der den Beitrag abnimmt, wird Sätze mit über zehn Worten kaum durchlassen.
HILFSVERB UND PARTIZIP ZUSAMMEN HALTEN. In der Schule haben wir gelernt, Hilfsverb und Partizip auseinander zu reißen. Beispiel: „Der Erfolg des Bankenschutzschirms ist nach den Äußerung internationaler Analysten, die heute von der Bundesregierung gehört wurden, umstritten.“ So versteht man erst ganz zum Schluss eines langen Satzes, was die Aussage ist. Bis zum letzten Wort bleibt der Zuschauer im Unklaren, wie es um den Erfolg des Bankenschutzschirms steht. Er hätte in unserem Beispiel auch „unumstritten“ sein können. Es empfiehlt sich daher bei gesprochenen Texten, Hilfsverb und Partizip beisammen zu halten, zum Beispiel: „Der Erfolg des Bankenschutzschirms ist weiter umstritten. Dies äußerten auch heute wieder internationale Analysten gegenüber der Bundesregierung.“ Der Satz wurde außerdem auf zwei Sätze verteilt, denn er hatte mehr als zehn Wörter. Noch kürzer wäre: „Umstritten: Der Bankenschutzschirm der Bundesregierung.“ Fremdwörter und Abkürzungen machen es dem Zuschauer schwerer, dem Text zu folgen. Die Verständlichkeit eines Films leidet enorm, wenn der Zuschauer seine Konzentration darauf richten muss, einzelne Wörter zu entschlüsseln. Als Produzent von Imagefilmen und Firmenpräsentationen erlebe ich immer wieder, wie die gesprochenen Texte zugeschüttet werden sollen mit Fachjargon, auch wenn die Filme in den seltensten Fällen an Spezialisten gerichtet sind. Was Knowhow und Insiderwissen vermitteln soll, hindert dann fast zwangsläufig an der beabsichtigten Kommunikation, zu der diese Filme einladen sollen.
ABSTRAKTE BEGRIFFE VERMEIDEN. Auch Zahlen bewirken beim Zuschauer bestürzend geringe Erkenntnisse, solang sie abstrakt bleiben. Beispiel: dem Zuschauer wird ein winziger CMOS-Bildwandler am Ende einer Pinzette gezeigt. Die Sprecherin sagt „Zwölf Millionen Pixel sind die stolze Leistung dieses Bildwandlers“. Die Zahl und damit die Aussage bleiben reichlich abstrakt. Es ist eine undenkbar große Zahl und an Undenkbares hat sich der Zuschauer längst gewöhnt. Erst im Vergleich wird das Undenkbare denkbar und das Thema des Beitrags, die Megapixel-Problematik, gewinnt Kontur: „Zwölf Millionen Fotozellen, dreimal die Einwohnerzahl von Berlin, drängen sich auf einem halben Quadratzentimeter.“ Dazu werden Menschenmengen gezeigt, in U-Bahnen, Fußgängerzonen, Fußballstadien. Und schon lässt sich begreifen, warum mehr Pixel nicht zu besseren Bildergebnissen führen müssen: „Je mehr Pixel, desto weniger Platz, desto kleiner die Fotozellen, desto geringer ihre Lichtempfindlichkeit und desto höher das Rauschen. Das ist die gnadenlose Physik des Megapixel-Karussells.“ Zum Schluss sieht man ein Karussell auf dem Jahrmarkt. Immer beliebter wird diese Bebilderung von Zahlenvergleichen und Metaphern, um dokumentarische Filme visuell zu stärken, ohne den Zuschauer mit willkürlichen Bilderkaskaden zu bombardieren. Wird vom Gipfel des Erfolgs eines Politikers und seinem bevorstehenden Absturz gesprochen, sehen wir neuerdings immer öfter Überflüge über schroffe Berggipfel und den schauerlichen Blick in die Tiefe.
TEXTEN FÜRS SPRECHEN. Betonung, Atmung, Sprechpausen, Rhythmus, Zungenbrecher. Viele grammatikalisch und schriftdeutsch einwandfreien Sätze laden nicht gerade dazu ein, auch gesprochen zu werden: „Die alte Dame aus dem Hunsrück, die weltweit als Tigerexpertin anerkannt ist und auch schon mal in Diensten des Schahs von Persien war, ist immer noch, obwohl sie im nächsten Jahr 85 wird, drei Monate im Jahr in der Mongolei auf Tour.“ Wer für Film und TV textet, sollte alle Texte laut sprechen und variieren. Daraus ergeben sich die besten Lösungen fast wie von selbst. Zum Beispiel: „Die alte Dame aus dem Hunsrück, weltweit anerkannt als Tigerexpertin. Auch schon mal in Diensten des Schahs von Persien. Noch immer ist sie drei Monate im Jahr in der Mongolei auf Tour – trotz ihres hohen Alters. Sie wird im nächsten Jahr 85.“ So fallen auch Zungenbrecher nicht erst bei der Sprachaufnahme auf, wenn der Film bereits endgültig geschnitten ist und wenn Textanpassungen kompliziert werden.
© Andreas Wunderlich / September Film Produktion, erschienen u.a. in Videofilmen und PC Video