In publica commoda

2.2.2 Audiodeskription

Menschen, die nicht oder schlecht sehen können, nutzen die Audiodeskription (AD), die sich zum Video hinzuschalten lässt. Dies ist immer dann erforderlich, wenn wesentliche Informationen über das Bild transportiert und nicht verbalisiert werden. Auch Texteinblendungen werden vorgelesen. Das Video lässt sich dann komplett durch Hören verstehen. Als Ergebnis entsteht eine neue Audio- und ggf. Videospur, die aus dem Original-Ton des Videos und den eingesprochenen Bildbeschreibungen besteht (siehe auch 2.1.2 Digitale Infrastruktur und technische Ausstattung).

Gegenüberstellung zweier Säulendiagramme der Covid Fallverteilung in Augsburg und Stuttgart anhand von Streuungsmaßen. Das Säulendiagramm für Augsburg ist links aufgeführt und das für Stuttgart befindet sich gegenüber, auf der rechten Seite. In beiden Diagrammen werden auf der X-Achse die Fallzahlen pro Woche in der Größenordnung von 0 bis 300 angegeben. Auf der Y-Achse sind von 0 bis 10 die Ausprägungen der Fallzahlen angezeigt. Die Ausprägungen der Fallzahlen sind für beide Städte in Form von blauen Säulen dargestellt. Der Arithmetische Mittelwert der Fallzahlen ist unterhalb der X-Achse als lila Dreieck gekennzeichnet, und beträgt für Augsburg 28 und für Stuttgart 91. Während sich die Säulen in Augsburg mit Werten zwischen 0 und 120 relativ nah um den Mittelwert (28) aufbauen, verteilen sie sich bei Stuttgart über die gesamte Breite der X-Achse von 0 bis 300. Horizontal über den blauen Säulen befindet sich in beiden Diagrammen ein roter doppelspitziger Pfeil. Dieser zeigt die Streuung der Werte, im Maß der Standartabweichung. Im Augsburger Diagramm erstreckt sich der rote Pfeil, aufgrund der geringeren Streuung von 0 bis 120 und zeigt eine Standartabweichung von 33 an. Im Stuttgarter Diagramm erstreckt sich der rote Pfeil über die komplette Breite der X-Achse, sodass die Streuung der Werte in Stuttgart, mit einer Standartabweichung von 100 deutlich größer ist als in Augsburg.
Abbildung 6: Beispiel einer komplexen Grafik zum zeitlichen Verlauf der Covid- Fallverteilung in Augsburg und Stuttgart, die eine längere Audiodeskription benötigt.

Eine AD ist dementsprechend ein Alternativtext für jegliche visuelle Informationen, der vorgelesen wird. Der Leitfaden Gut fürs Image! erklärt einfach, aber umfassend, worauf bei der Erstellung von Alternativtexten geachtet werden muss. Die Vorgaben für die Audiodeskription der öffentlichen Rundfunkanstalten sollten ebenfalls bei der Erstellung beachtet werden. Allerdings ist es z. T. nötig sie an universitäre Lehrvideos anzupassen. Die klassische Produktionsmethode der AD (Einfügung der AD in vorhandene Sprechpausen) ist für solche Lehrformate kaum anwendbar, da die regulären Sprechpausen normalerweise nicht ausreichen, um teils komplexe Abbildungen und Grafiken zu erläutern.
Für die Umsetzung gibt es verschiedene Methoden: Welche Methode für die AD verwendet wird, hängt u. a. vom Videoinhalt und dem verwendeten Player ab.

  • Originalton ersetzt AD: Werden alle visuellen Informationen bereits im Originalton vermittelt, wird keine AD benötigt. Hier ein Beispiel.
  • Synchrone Produktion von Film- und AD (Audiospur): Ist die Übertragung von Bildgeschehen in Sprache nicht möglich, kann der Einbau von Pausen helfen. Stehen ausreichend Pausen zur Verfügung, kann die Tonspur um eingesprochene kurze AD ergänzt werden. Hierfür müssen genügend Sprechpausen im Hauptaudio vorhanden sein. Hier ein Beispiel. Diese Methode bietet sich für einfache Visualisierungen an.
  • Einsatz erweiterter AD (Videospur): Erstellung eines separaten Videos, in dem die AD zur Haupttonspur hinzugefügt wird. Dies sollte nur genutzt werden, wenn das Video ohne AD unverständlich wäre und die vorhandenen Pausen nicht ausreichend sind. Hier ein Beispiel. Diese Methode bietet sich für komplexe Visualisierungen an.
  • Audioeinführung: Eine Audioeinführung wird zusätzlich zum Video als zugängliche Text- oder Audiodatei zur Verfügung gestellt. Die Nutzer*innen müssen aber mehr Zeit und kognitive Verarbeitungskapazität einsetzen, als bei der reinen Rezeption des Hörfilms.

Im DaLeLe4All-Team haben wir uns in Bezug auf die Methode für die Produktion einer erweiterten AD (Videospur) entschieden. Diese Methode ermöglicht es uns, auf lange, eingeplante Pausen zu verzichten und dennoch die komplexen statistischen Grafiken und Tabellen mit ausreichend Zeit beschreiben zu können. In der Vorbereitung wurden daher im Sprechskript die Pausen für die AD vermerkt, um diese später einfügen zu können. Eingesprochen wurden die AD in Räumen und mit der Technik des Videoteams der Universität Göttingen. Das Videoteam hat auch die Postproduktion der AD übernommen und sie bei den vermerkten Pausen in das lautsprachliche Video eingefügt. Wir haben uns dazu entschieden, während die AD läuft, die jeweilige Präsentationsfolie als Vollbild zu zeigen, damit die Sprechenden währenddessen nicht in einem verzerrten Standbild gezeigt werden. Unsere Vorbereitung der Inhalte für die sieben AD unseres ersten Lehrvideos und die Aufnahme haben deutlich mehr Zeit in Anspruch genommen, als bei den folgenden Videos, die jeweils zwei bis vier AD benötigten. Für die Erstellung der einzelnen AD lässt sich kein Durchschnittswert benennen. Der zeitliche Faktor ist stark abhängig von der Komplexität der zu beschreibenden Abbildungen und der jeweiligen Vorerfahrung.

Umsetzung der (erweiterten) Audiodeskription

Während der Vorbereitung wurde bereits im Storyboard der lautsprachliche Text und die geplanten Visualisierungen aufeinander abgestimmt. Dabei wurden unnötige Visualisierungen gestrichen und Bezugnahmen auf einfache Visualisierungen in den Sprechtext integriert. Es ist sinnvoll das Lernziel bzw. die Funktion der übrigen Abbildungen in Bezug auf den zu vermittelnden Inhalt klar zu besprechen. Ebenso sollte an diesem Punkt die Komplexität der Visualisierung kritisch geprüft und ggf. vereinfacht werden. Im nächsten Schritt werden für alle fachlich relevanten visualisierten Inhalte, die nicht im Sprechskript verbalisiert werden, AD-Entwürfe geschrieben. Hierin wird neutral beschrieben welchen Inhalt die Visualisierung in Bezug auf den Lehrkontext transportiert.
Die AD sollte ausschließlich das in Worte fassen, was in der Grafik tatsächlich zu sehen ist, aber keine Interpretation liefern. Details, die zwar sichtbar, aber nicht fachlich relevant sind, können ausgelassen werden. Daneben hat ebenfalls einen großen Einfluss auf die Beschreibung, welches Vorwissen bei den Nutzer*innen vorausgesetzt werden kann. Abhängig davon, was die Abbildung fachlich vermitteln soll oder auf welchen Inhalten bspw. in späteren Lehrvideos aufgebaut werden soll, folgt für die AD, was besonders präzise beschrieben werden muss. Die Komplexität bzw. Länge der Beschreibung hängt ebenfalls von der gewählten Einbindungsmethode ab. Der Entwurf sollte von einer Person mit Fachexpertise verfasst werden, da fachfremde Personen schwer beurteilen können, was an einer Abbildung tatsächlich relevant ist. Aufgrund dessen ist auch die externe Auftragsvergabe von AD nur bedingt sinnvoll und mit zusätzlichen Arbeitsschritten verbunden, um die fachliche Angemessenheit zu sichern.
Anschließend werden die Einbindungszeitpunkte definiert. Diese sollten so gewählt sein, dass die Visualisierungen beschrieben werden bevor die zugehörigen Inhalte im regulären Sprechtext adressiert werden. Die Entwürfe sollten vor der Aufnahme im Team geprüft werden. Ein Mehr-Augen-Prinzip hilft den Entwurf zu finalisieren, ggf. notwendige, bisher unbeschriebene Details zu ergänzen und einheitliche und passgenaue Formulierungen zu finden. Der Entwurf sollte außerdem mit potenziellen Nutzer*innen abgestimmt werden, um sicher zu gehen, dass die Inhalte in der Form zugänglich sind und alles Notwendige verständlich vermitteln.
Im Anschluss wird die AD eingesprochen. Um die AD von den anderen Teilen des Videos unterscheiden zu können, sollte diese nicht von der Person des restlichen Videos gesprochen werden. Die AD einer anderen Person sollte aber von der Tonqualität gleichwertig sein. Die AD kann von einer fachfremden Person eingesprochen werden, sofern ihr ausreichend Hinweise zu fachspezifischer Semantik und Aussprache (bspw. von Formeln oder Konzepten) gegeben werden.
Wenn die AD komplett selbst aufgenommen wird, helfen Audiodeskriptions-Tools, womit man sich ein Video ansehen, die Zeitfenster bestimmen/schneiden und die Beschreibung direkt einsprechen kann.


Für die Umsetzung sind folgende Arbeitsschritte und Überarbeitungen erforderlich:
  1. Erstellung und Abstimmung des Sprechskripts und der Präsentationsfolien mit Abbildungen
  2. Entscheidung für die passende Methode (Originalton ersetzt Audiodeskription, Audiodeskription in Sprechpausen, erweiterte Audiodeskription oder Audioeinführung) und ggf. Auswahl der daraus folgenden Einbindungszeitpunkte im Video (Minute/Sekunde)
  3. Erstellung des Entwurfs der Audiodeskription entlang der gewählten Methode
  4. Prüfung und Überarbeitung der Audiodeskription im Team
  5. Test mit Nutzer*innen
  6. Aufnahme der Audio-/Videospur
  7. Einbindung der Audiodeskription in das Video gemäß der ausgewählten Methode.

Tipps für die Praxis

Der Austausch zwischen der lehrenden Person und der Person, die die AD erstellt ist von Anfang an von großer Bedeutung. So können Ziele, Komplexität und Notwendigkeit von Abbildungen von vornherein besprochen und reflektiert werden:

  • Es ist sinnvoll, regelmäßig darüber zu beraten, ob die vorgeschlagenen Visualisierungen notwendig sind, um den Lehrinhalt zu vermitteln oder ob es sich um dekorative Bilder (Schmuckgrafiken) handelt, die keine inhaltliche Bedeutung haben. Der TU Dresden folgend empfehlen wir: „Hintergründe oder andere grafische Schmuckelemente und Platzhalter (...), die keine inhaltlich relevanten Informationen beinhalten, benötigen keine Alternativbeschreibung. (...) Alternativ können Sie darüber nachdenken, rein dekorative Bilder (...) zu entfernen“ (vgl. Müller & Voegler, 2020: 41).
  • Wenn Formeln, Fachausdrücke oder andere Fachspezifika in der Präsentation vorkommen, ist es sinnvoll, diese direkt in der gesprochenen Version inhaltlich zu beschreiben. Falls dies nicht erfolgt, muss für die Erarbeitung der AD geklärt werden, was ggf. missverständlich sein könnte oder wie Fachausdrücke oder Formeln richtig ausgesprochen werden, um Fehler in der Beschreibung oder Korrekturen im Nachhinein zu vermeiden.
  • Bei inhaltlich wenig relevanten Visualisierungen haben wir uns dazu entschieden, eine verbale Bezugnahme im gesprochenen Text im Video einzubauen, um den Aufwand der AD gering zu halten und Barrieren gar nicht erst aufzubauen. Im Video zur Durchschnittsstatistik beschreibt unser Dozent bspw. von Minute 2:50 bis 3:33 die gezeigte Karte der Gebietseinheiten Deutschlands samt der visuellen Markierungen innerhalb seines Sprechtextes, damit eine AD an dieser Stelle nicht erforderlich ist.
  • Die Komplexität der geplanten Abbildungen sollte kritisch hinterfragt werden. Was wird gezeigt und was davon ist fachlich relevant? Häufig können Abbildungen vereinfacht werden, sodass sie ausschließlich das fachlich Wesentliche vermitteln. Die Reduktion vereinfacht die AD und reduziert ihre Länge.
  • Wenn Sie sich als Methode für den Einsatz erweiterter AD entscheiden, sollte in einer AD zu Beginn des Lehrvideos darauf hingewiesen werden, dass es sich um die AD-Version des Videos handelt. Wir haben unsere AD-Versionen bspw. mit diesem Satz eingeleitet: „Wesentliche, inhaltlich-relevante visuelle Darstellungen sind im Folgenden mit Audiodeskriptionen versehen.“ Durch Fernsehsendungen, in denen AD in Sprechpausen eingefügt werden, sind sehbeeinträchtigte Personen gewöhnt, dass AD sofort beginnen. Durch den eingesprochenen Hinweis auf die AD-Version können Verwirrungen vermieden werden, ob es sich um die richtige Videoversion handelt. Sofern die lautsprachliche Videoversion im Sprechtext nicht klar Sitzungsnummer, Thema der Veranstaltung und Name des Lehrenden benennt, sollte dies als zusätzlicher sprachlicher Hinweis zu Beginn in der AD ergänzt werden.
  • Wenn Sie sich als Methode für den Einsatz erweiterter AD entscheiden, sollten die Zeitpunkte für die Einbindung der AD so gewählt werden, dass erst die AD zu einer Visualisierung erfolgt, und danach der reguläre Sprechtext zu dem Inhalt folgt. Dies ermöglicht sehbeeinträchtigten Personen die AD im Hinterkopf zu haben, während sie die inhaltliche Bezugnahme auf die Visualisierung im Sprechtext hören.
  • Weitreichende AD von komplexen Tabellen sind nicht sinnvoll, weil es kaum möglich ist den Inhalt im Kopf zu behalten. Besser ist hier Thema und Aufteilung der Tabelle (Beschriftung der Spalten und Zeilen) in einer AD zu nennen und in Bezug auf die konkreten Werte auf das Transkript zu verweisen (siehe 2.2.5 Transkription). Im Transkript wird dann die Tabelle mit allen Werten barrierefrei aufbereitet abgebildet.