Pushing the REC button is easy. Every-thing else is slightly more challenging.

Challenges of Talking Head #performance; #camerawork

Blogarticle, published in the Media & Learning News, Belgium, 2018.

There are always two sides of the coin: in educational videos.  videos in higher education, there may be even three.


The Roman rhetorician Marcus Fabius Quintilian stated around 50 B.C.: „It is often the case that the same language is free in one speaker, foolish in another, and arrogant in a third.“ (1)  As ancient this quotation is – as true it is still today, and especially get visible when investigating educators, performing in front of a camera as so called Talking Head. One speaker might be shy and starts to freeze, a second nervously wiggles around and a third may be slightly hyperactive. “For some [speakers], it’s much easier to deal with the camera/studio situation. For scientists, it’s particular tricky to work with limited time restrictions of five or six minutes, and precisely, without reading aloud but still using a script, showing display a strong academic density in the delivered content without getting superficial and offhand.” (2)

And than, there’s the other side, the ones behind the camera. One highly underestimated fact lies in the interference of the speaker and the production set-up in the university broadcast studio. All of the following citations are transcripts during different video productions at different Universities.

- Educators are often put into a narrow interaction space: “You can’t move, otherwise you get out of my depth of field.”

- They have a hard time to manage the unfamiliar interaction with technical objects, e.g. Wacom, Slide on the side of the screen and not behind, click-apparatus on the side of a table, etc. »This is really difficult! My brain has to rethink all the time.«

- Or receive instruction from the media designers behind the camera on their performance, and although meant in a constructive way, camera such as “try to stand upright”, “shoulder's back”, “do not wiggle around...” It can be assumed, that such sentences not only impact the immediate performance, but get part of the self-referential function of the speech performance. The feedback addresses the unconscious bodyschema of the speaker, but not the bodyimage and therefore, he or her is not able to control such intrinsic movement patterns, which have been accumulated over years and years.

- Well, »I guess you’re learning to swim« is often the last hope of educators. But this hasn’t necessarily need to be like that.


But within media and film studies as well as applied filmmaking knowledge, we know that different media design can create completely different images of something or someone. The camera is like a weapon – and so is the postproduction. Out of every video-snippets in the stratosphere of webdata, we’re able to tell a vast majority of completely different stories. Such knowledge from the filmmaking process can used to either support or hamper the performance of Talking Heads in terms of visual appearance, dynamic of speech-narration or affirmation of audio-visual argumentation, to name a few. As each speaker brings his or her own qualities, potentials and restrictions: There is no ‘one-style-fits-all’ approach to video media design. However, this is what we quiet often see in recent development at universities. While this helps to create a reasonable workflow, standardized production or even a Corporate Identity of an university, it also sometimes tries to unify scientific disciplines, educational content and the presentation of speakers.


To sum up, so yes, every educator who likes to get on board of the video production journey, needs to train him- or herself in speaking in front of a camera. There is no shortcut to it. And let’s be frank: every experienced media designer (filmmaker) will tell you a similar story: “How good are they on camera? First of all, there are some people; you just love to watch them perform. And then there are other people, like, ‘not really’.” (3). But there are also the ones behind the camera, the media designer who can either create a straight forward industrial mass production work-flow where ‘one-style-fits-all’ dominates, or they can co-design with the educators not only on the content transformation for videos, but only on a suitable design set-up for the individuality, discipline and content based needs for educational videos. In the end, the individual performance of the Talking Head and the chosen media design steers the dynamic of the video. To paraphrase Quintilian:

“It is often the case that the same [VIDEO STYLE] language is free in one speaker, foolish in another, and arrogant in a third.“

Well, and in the end, I still sometimes wish to sit with Quintilian in a Roman tavern, drink some red wine and have a vigorous discussion about these issues, which he couldn’t cover yet in his fantastic writings, as it still took the human race some years to develop the technology of moving images. Maybe new tech development of deep learning, Chatbots and VR will one day make it possible, to seriously have such an experience in the near future.

(1) Marcus Fabius Quintilian, Institutio Oratoria, Book 12.
(2) Original in German: “Es gelingt manchen besser, weil sie mit der Kamera-/Studiosituation besser umgehen können. Es ist insbesondere für Wissenschaftler schwierig, sich mit der Anforderung auf fünf oder sechs Minuten begrenzt, sehr präzise, ohne vorzulesen aber doch gescriptet und mit der entsprechenden ›Flughöhe/Dichte‹ und dem akademischen Anspruch an das zu vermittelnde Wissen [nicht] oberflächlich, jovial oder flapsig zu werden.“ Expert Interview with Felix Seyfarth, HSG, St. Gallen, in Zurich, 2015, in: (forthcoming) Spring 2018: Media Design Expertise for Videos in Higher Education – a Collection of Interviews with Lecturers, Filmmakers and Communication Experts from the Fields of Science Teaching, Media Design, Gesture Studies and Digital Education).
(3) Expert Interview with Chris Boebel, MIT, in Boston, 2015, in: (forthcoming) Spring 2018: Media Design Expertise for Videos in Higher Education – a Collection of Interviews with Lecturers, Filmmakers and Communication Experts from the Fields of Science Teaching, Media Design, Gesture Studies and Digital Education).

Talking Heads - eine Frage der Definition

Text extract from: "Bewegtbilder der Wissenschaft und ihr Mediendesign".


Der Begriff des Talking Heads ist im Kontext von akademischen Videos weitgehend etabliert und trägt in sich keine negative Denotation. Diese Akzeptanz ergibt sich daraus, dass die Majorität der Videos im Hochschulfeld einen Talking Head – und diesen oft alleine vor einer weißen Wand oder im Vorlesungssaal – zeigen. In Kontrast zur Bedeutung des Talking Heads steht jedoch die kritische Definition im Filmlexikon der Universität Kiel:


Talking Head (def.): Eher ironische Bezeichnung für die Dominanz der vor allem in Fernsehdokumentationen auftretenden »sprechenden Köpfe« von Interviewten, die meist in halbnaher bis naher Einstellungsgröße aufgenommen werden (sei es, vor einem szenisch-sprechenden Hintergrund – Bücherwände für Geisteswissenschaftler, Labore für Chemiker, Archivregale für Historiker etc. –, sei es vor einer neutralisierten, meist monochrom schwarzen Fläche). Die Inszenierung wirkt statisch, ist visuell wenig ansprechend, verlagert die Aufmerksamkeit ganz auf das Gesprochene [1].


Die kategoriale Subsummierung aller Darstellungen von wissenschaftlichen Experten als Talking Heads im Kontext von Bewegtbildern der Wissenschaft ist jedoch nicht einmal annähernd ausreichend differenziert, um die verschiedenen Darstellungsformate von sichtbaren Sprechern auszudrücken, denn die Performanz und Darstellung des Wissenden spielt eine essenzielle und oft unterschätzte Rolle in Bewegtbildern der Wissenschaft.


Wissenschaftliche Experten agieren im Bewegtbild nicht als neutrale Personen, sondern sie verkörpern den Kontext der Wissenschaft mit ihrer gesamten Erscheinung, ihrer Sprache und Körperlichkeit [2]. In der folgenden Untersuchung werden daher im Kontext von Theorien der Gestik, Rhetorik und Virtuosität von Sprechern die Herausforderungen der Performanz von Wissenschaftlern vor der Kamera und im Universitätsstudio beleuchtet [3]. Es ist jedoch hervorzuheben, »dass bereits aufgrund der grundlegenden, Film definierenden medialen Bedingungen der Körper an sich nie als eigentlicher präsent und unmittelbar gegeben, sondern immer bereits transformiert und filmisch vermittelt ist.«[4]


Insbesondere ist dabei einerseits der Kontrast zwischen dem in der Wissenschaft üblichen unpersönlichen Schreibstil und der Personenbezogenheit des aus populären Fernsehformaten bekannten Talking Heads auffällig. Andererseits steht im Sinne des Co-Designs von Bewegtbildern der Wissenschaft die Entscheidungen und Konsequenzen des Mediendesings mit einer kulturellen Prägung der Institution (Populär-)Wissenschaft und deren Interferenz mit dem sichtbaren Sprecher im erweiterten Diskurs [5]. Die Omnipräsenz von sichtbaren Sprechern und die weiteren dargestellten Aspekte unterstreichen, dass eine Untersuchung von Bewegtbildern der Wissenschaft ebenfalls eine Analyse von sichtbaren Sprechern inkludieren sollte.


[1]    Definition »Talking Head«, Filmlexikon Universität Kiel, http://filmlexikon.uni-kiel.de/index.php?action=lexikon&tag=det&id=7777 vom 23. April 2017.

[2]    Die Figur des Wissenschaftlers steht dabei in Bewegtbildern der Wissenschaft anhand Michael Hellermanns Erklärung in einem Spannungsfeld: »Der Wissenschaftler im Film ist eine Konstruktion, deren mediale Subjekteffekt, den sie produziert, in relativ starkem Kontrast zu den Gepflogenheiten des Wissenschaftssystem steht, wo das Objektivitätspostulat und der Kollektivgedanke wissenschaftlicher Forschung als limitierende Faktoren gleichermaßen gegen die Individualisierung von Erkenntnis als auch gegen die Zurechnung von Autorschaft wirken.« Michael Hellermann, Wissenschaft in Film und Fernsehen. Die mediale Morphologie audiovisueller Wissenschaftskommunikation, Berlin 2015,10.

[3] »Es gibt einen riesigen Unterschied selbst für erfahrene Dozenten, ob sie vor einem Seminar/Hörsaal oder vor einer Kamera/Greenscreen in einem Studio sprechen. Natürlich hilft es, wenn man Kameraerfahrung hat. Aber ich glaube, ein Schlüsselbegriff für mich ist Performance. Jedes Lehren ist Performance.« Felix Seyfarth: Experteninterviews, Zürich 2015.

[4]    Dennis Gräf, Stephanie Großmann, Peter Klimczak, Hans Krah, und Martietherese Wagner: Filmsemiotik: Eine Einführung in die Analyse audiovisueller Formate, Marburg 2011: 181.

[5]    Das Co-Design von Experten der Wissenschaft und Bewegtbildern referenziert auf einen gemeinsamen Prozess einer disziplinübergreifenden Wissensgenerierung und Produktion von akademischen Bewegtbildern zwischen Experten der Wissenschaft und des Mediendesigns.

Die Produktion von webbasierten Bildungsvideos verzeichnet einen enormen Zuwachs, sowohl an Universitäten als auch im Privatsektor. Häufig setzen die Bildungsvideos die medienspezifischen Möglichkeiten von Bewegbildern nur marginal ein. Die Mehrheit beschränkt sich auf ‚Talking Heads‘ und Präsentationsfolien als Stilmittel.



Webbasierte Bildungsvideos sind in den letzten Jahren zu einer neuen Domäne der online Wissensvermittlung herangewachsen. Ermöglicht wird dies u.a. durch die Verfügbarkeit von günstigeren Kameras, grösserer Bandbreite der Internetzugänge sowie unter der „disruptiven“, d. h. revolutionären Bewegung der Massive Open Online Courses (MOOCs). Bildungsvideos ermöglichen Lernenden unabhängig von zeitlichen und räumlichen Anforderungen der Hochschule oder der Arbeitswelt, Wissen zu erlangen. Bestehende Studien weisen darauf hin, dass Lernende unterschiedlich engagiert mit Lernvideos interagieren, abhängig vom Videostil und der verwendeten Pädagogik (Kim et al, 2014). Gleichzeitig fehlen Untersuchungen zur ästhetischen, didaktischen und narrativen Umsetzung webbasierter Bildungsvideos. Als Denken in der Produktion von webbasierten Bildungsvideos hat sich etabliert, dass sie kurz sein sollten, nicht länger als drei bis fünf Minuten. Dabei existieren kaum differenzierte Studien und diese Zeitvorgabe basiert auf spärlicher Evidenz. Die Dauer von Bildungsvideos sollte sich vielmehr an der jeweiligen Disziplin oder der Komplexität des Themenschwerpunkts orientieren als an absoluten Werten.

Die meisten Bildungsvideos werden heute in einem „high-end“ Format aufgezeichnet (Lehmann, 2013, S. 212). Aber der Einsatz von hochwertigem Equipment allein garantiert nicht als Qualität. Bildungsvideos müssen anders strukturiert werden als analoge Wissensvermittlung. So erklärt Chris Boebel, Media Developer Digital Learning am MIT: “Sometimes we have to talk about re-writing, adapting the material for a completely different medium” (Interviews 2015). Ohne eine reflektierte Strukturierung von Inhalten, didaktischer Narration und Kreativität für die Bild-Ton Umsetzung wird das Bildungsvideo dem eigentlichen Potenzial für die Wissensvermittlung nicht gerecht. Laut Nigel Smith, Head of Content von der MOOC Platform Futurelearn, stellt sich die Frage, ob das Bewegtbild überhaupt das richtige Medium ist: „Does this need to be a video? Do you have something to show? And often, I think, if you don’t have something to show, or you’re not trying to sort of use video as a medium to build a relationship between the educator and the learners, then you sometimes maybe question, if video is the right medium” (Interviews 2015).


Analyse einer größeren Datenmenge von Bildungsvideos

Wir haben in einer Vergleichsstudie 448 Bildungsvideos von vier internationalen MOOC Plattformen ( edX, Coursera, Iversity und Futurelearn) untersucht: Was sind die am häufigsten verwendeten Videostile? Welche Hintergrundräume werden verwendet? Folgende hier nur skizzierte Ergebnisse dieser Studie werden im Forschungsvideo „Video Styles in MOOCs – A journey into the world of digital education“ (https://youtu.be/5VEHBuuRKXI)  ausführlicher präsentiert:


Der Talking Head ist mit 75% aller 448 Videos der häufigste Videostil. Der Begriff des Talking Head beschreibt einen Sprecher, der zwischen einer Halbnahen (der Hüfte) oder Nahen (der Schulter) Einstellung zu sehen ist. Dieser Videostil repräsentiert das klassische Format des Frontalunterrichts – der Sprecher im Zentrum der Wissensvermittlung.


Der zweithäufigste Videostil sind Präsentationsfolien. Diese werden entweder mit einer voice-over, gesprochene Stimme ohne sichtbaren Sprecher (38%), oder mit einem sichtbaren Sprecher (33%) dargestellt. Der sichtbare Sprecher wird als Bild-im-Bild in einem kleinen Fenster in die Präsentationsfolie integriert. Clayton Hainsworth von der MOOC Plattform edX sagt über die Verwendung dieses Videostiles: „To simply present power point slides with a picture-in-picture, I’m personally not a very big fan of that at all.  […} If you just present sort of picture-in-picture slides, the small Talking Head does not really add much. In fact, I think in some ways it really detracts” (Interviews 2015). Die rege Benutzung von Präsentationsfolien erstaunt wenig: Werden diese doch heute in fast jedem traditionellen Vortrag verwendet. Hier lässt sich fragen, ob recycelte Präsentationsfolien ein passendes Lehrformat für die medialen Eigenschaften von Bewegtbildern sind und dem „Exzellenz“ Anspruch der modernen Hochschullehre gerecht werden.


Talking Heads & Wissensräume 

Wissensvermittlung findet niemals im leeren Raum statt. Im Bewegtbild ist die Frage nach dem Raum ebenso entscheidend wie der Lehrende mit seiner Performativität der Sprache. Der Hintergrund des sichtbaren Sprechers ist Teil dessen, was im Bildungsvideo „mit“ kommuniziert wird. Die Talking Head Videos verwenden verschiedene Hintergründe: 10% zeigen den Sprecher vor Ort im Freien (Outdoor). Der Sprecher steht z.B. vor einer Windanlage, wenn die Lektion Windenergie thematisiert. Mit 27% ist die Einbettung des Talking Heads in einen monochromatischen Hintergrund (weiss, schwarz, etc.) ein häufiger verwendetes Sujet. Ein monochromatischer Hintergrund kann von Vorteil sein, wenn der Schwerpunkt keine bildsprachlichen Ergänzungen zeigen kann. Durch die Reduktion von Bildinformation wird die Blickrichtung des Lernenden stärker geleitet und Hintergrundinformationen können die Aufmerksamkeit nicht stören. Allerdings können sich, wenn der Sprecher mit zwei Kameras aufgezeichnet wird, Montage-Schwierigkeiten ergeben, da durch die visuelle Monotonie des Raumes ein sogenannter Bild-Sprung entstehen kann. Dieser Bild-Sprung unterbricht den visuellen Bildfluss. Er wird in professionellen Produktionen von Spielfilmen oder Dokumentarfilmen als Stilmittel bewusst zur Irritation des Zuschauers eingesetzt. 

Es erscheint beinahe paradox, dass trotz der viel beschworenen Verdrängung des Buches durch digitale Publikationen die Bücherwand einer der beliebtesten Hintergründe im Bildungsvideo ist (10%). Bücher tragen historisch bedingt immer noch eine zentrale Bedeutung, die hier versucht wird auf den sichtbaren Sprecher zu übertragen: die Repräsentation des Wissenden.   


Das Vermitteln von Wissen in Videos gestaltet sich anders und ist nicht gleich, wie wenn der Lehrende in einem Vorlesungssaal oder einem Seminarraum sitzt. Der Lernende ist nicht sichtbar; es gibt keine direkte, d.h. face-to-face Kommunikation und Interaktion wie in Präsenz zwischen den anwesenden Lehrenden und Lernenden. Vielmehr wird bspw. der Bewegungsraum durch die Einstellungsgrösse des Kamerabildes für den Lehrenden eingeschränkt. Auch bereits der Blick in die Kameralinse kann die Art und Weise wie Lehrende Wissen vermitteln in einem entscheidenden Masse verändern.

Um diese Differenz aufzuzeigen, sind in einer Studie 448 Lektions-Videos aus MOOCs (Massive Open Online Courses) untersucht worden (vgl. Reutemann 2016).


Ein Drittel der Videos benutzen den Videostil „Talking Head“ als Wissensvermittlungs-Format. Der Talking Head beschreibt eine/n sichtbare/n Sprecher/-in, welche/r zwischen einer Halbnahen (der Hüfte) oder Nahen (der Schulter) Einstellung zu sehen ist. Das Ergebnis zeigt klar, dass die Videos des „Talking Heads“ ein klassisches Format des Frontalunterrichts also der Vortragsmethode (‚recitation method’) – die vortragende Person steht im Zentrum der Wissensvermittlung. Die „allwissenden“ Lehrenden stehen in diesem Format jedoch noch stärker im Fokus der Aufmerksamkeit, als sie dies bereits im Seminarraum sind: Denn die Lehrenden werden durch die Bildrahmung in einer „Nahen Einstellung“ oder „Halbnahen Einstellung“ zentral ins Bild gesetzt, vielfach bedeckt der Körper der Lehrperson 1/3 bis 1/2 des gesamten Bildes. Je nach Endgerät (Laptop, Beamer) erscheint die/der Sprecher/-in damit in einer ungewohnten Nähe. Mit der hohen Auflösung der Bilder werden sogar im Kleinstformat, mit dem Handy, mehr Details im Gesicht der vortragenden Person erkennbar, als man in einer „analogen Lehrveranstaltung“ mitbekommen würde. In Seminarräumen überschreitet eine Lehrperson selten die sogenannte soziale Distanz zum Lernenden (vgl. hierzu: interpersonelle Distanz), in welcher detaillierte Details der Mimik, wie bspw. Zuckungen von Augenbrauen oder Blickveränderung erkennbar werden. Aber genau dies ist der Normalfall in Bildungsvideos mit einem Talking Head, dies wird sich zukünftig verstärken, denn die Verwendung von 4K Kameras für Bildungsfilme ist bereits an Hochschulen angekommen (4K hat eine mehr als doppelt so hohe Auflösung wie HD).


Das Problem einer exakt erkennbaren Mimik des Lehrenden

Das Lesen von Expressionen in der Mimik und Mikromimik einer/eines Sprecher/-in ist eine wichtige Eigenschaft in der multimodalen Sprachinteraktion mit Menschen. Diese angeborene Fähigkeit dient uns vor allem in sozial anspruchsvollen Situationen als Orientierungshilfe und wichtige Information, wenn wir z.B. herausfinden möchten, ob jemand die Wahrheit sagt oder ob seine Aussage eine Zweideutigkeit, eine Ambiguität enthält oder wie sich die Person fühlt. Das Erkennen von Widersprüchlichkeiten, Kontroversen oder Unklarheiten zwischen dem, was wir sehen und dem, was wir hören, ist jedoch in einer Situation der Wissensvermittlung, der Lehre nicht unbedingt notwendig, sondern kann durchaus hinderlich sein für den Lernprozess. Denn eine solche Information zeigt uns, dass der/die Lehrende eventuell Schwierigkeiten mit der Vermittlung des  Themas hat, eine Unsicherheit mit sich trägt oder den Zuhörenden bewusst eine Falschaussage übermittelt (letzter Punkt kommt hoffentlich nicht vor). Gleichzeitig ist diese un-familiäre Nahansicht im Talking Head Format nicht nur bei Mehrdeutigkeit von Gesehenem und Gehörtem eine grosse Herausforderung, denn die genaue Sicht auf das Gesicht kann den Lernenden auch ohne Sprach-Ambiguität vom Lerninhalt ablenken. Der Gestenforscher Sotaro Kita, Professor für Psychologie an der Universität Warwick UK, sichtete in einem Experteninterview mit der Autorin einige Talking Head Beispiele: „ I wasn’t sure that I wanted to see all the facial expressions. In some ways, that was a bit distracting from the content“ (Kita im Experteninterview 2015).


Virtueller Blick in die Kamera

Eine der Grundsatzdiskussionen der videographischen Wissensvermittlung in MOOCs bezieht sich auf die Frage, wie eine Beziehung zwischen Lehrenden und Lernenden trotz medialer Distanz intensiviert werden kann. Es wird vermutet (es existieren kaum differenzierte Studien dazu), dass die Lernenden durch einen gegenseitigen Blickkontakt eine Beziehung zum Lehrenden aufbauen. Diese Blick-Interaktion zwischen Lehrenden und Lernenden wird in Präsenzsettings beispielsweise als eine Form der gegenseitigen Bestätigung, Bejahung und Verständnisüberprüfung verwendet. Diese notwendige Interaktion entfällt bei Bildungsvideos vollkommen (Ausnahme: bei synchron „streaming“-Varianten wie Webinaren mit mehreren Kameras oder Skype-Sessions). Die Annahme im Diskurs über Bildungsvideos besteht nun darin, dass dieses Gefühl des gegenseitigen Blickkontaktes zwischen Lehrenden und Lernenden, durch einen „simulierten“ Blick des Lehrenden in die Kameralinse, ersetzt werden könne. Als problematisch können jedoch subtile Verhaltensänderungen bei diesem simulierten Blick benannt werden, welche im nächsten Abschnitt beschrieben werden.

Promter und der nervöse (Star)r'äffchen-Blick

In den letzten drei Jahren kauften viele Hochschulen neues Studio Equipment für eine Lehrvermittlung mit Videos, und im Zuge dessen einen Prompter. Der Prompter ist in der Broadcast-Welt ein weitverbreitetes, technisches Gadget und wird als Sprechhilfe für Moderator/-innen eingesetzt indem diese den Moderationstext von einem Screen „ablesen“ können – hierbei blicken sie beim Sprechen direkt in die Kamera und der/die Zuschauer/-in glaubt (mehr oder weniger), er/sie spreche direkt mit ihm.
Die Idee, einen Prompter für die Lehrvermittlung einzusetzen, scheint darum offensichtlich. Was dabei jedoch ignoriert wird, zieht fatale Folgen mit sich: Moderator/-innen trainieren sich jahrelang im Rezipieren der Prompter-Texte, sodass diese nicht vorgelesen klingen, sondern in einer „natürlichen“ Sprachvermittlung wiedergegeben werden können. Gerade das Beherrschen solcher soft-skills sind in einer videographischen Wissensvermittlung mit Prompter ein ausschlaggebendes, didaktisch-dramaturgisches Element für den Beziehungsaufbau mit Lernenden: Wird der Text auf dem Prompter abgelesen so verliert dadurch die Sprachvermittlung ihre natürliche Intonation, Geschwindigkeit und Nachdruck der Inhalte. Ebenso verliert die Message einen relevanten Aspekt einer Wissensvermittlung. Hinzu kommt, dass durch ein unkontrolliertes Ablesen die Pupillen des/der Sprecher/-in nicht geradeaus mit einer überzeugten Festigkeit den Lernenden „virtuell-digital“ anschauen, sondern dass die Pupillen wie wild hin und her wandern. Grund dafür ist, dass die Zeilenlänge der eingeblendeten Texte zu lange ist, so dass die Pupillen insbesondere bei unvorbereitetem Vorlesen den Text Wort für Wort abtasten müssen. Damit wird kein „simulierter“ Blickkontakt nachgeahmt, sondern man sieht aus Sicht des Lernenden eine nervöse Lehrperson, dessen Augen (und manchmal auch Kopf) wie verrückt zwischen dem linken und rechten Bildrand hin- und her wackeln. Dieser, um es etwas provokativ zu benennen, „nervöse Staräffchen-Blick“ tritt bei beinahe allen, ungeübten Prompter-Sprecher/-innen auf. „Whether or not somebody is reading from a prompter you can tell from the eyes and face but also if somebody is not really thinking and saying, I think it also shows up in gestural communication as well. If you are just reading, you’re not going to gesture“ (Kita im Experteninterview 2015). Und hier folgt damit ein weiteres Problem, denn die Gesten sind relevant bei der Wissenskommunikation – vorausgesetzt die vortragende Person weiss, wovon er/sie spricht.

Gesten als sichtbare Denkprozesse
Denn gerade die redebegleitenden Gesten erzeugen in ihrer Darstellung zusätzliche Aspekte der Sprache, die sie ergänzen, erweitern oder sogar ersetzen können und sind wie ein „offenes Fenster“ in die Gedankenwelt der Person. Gesten besitzen einzigartige semiotische Eigenschaften mit einem Bedeutungsgehalt, welcher erst in einer gemeinsamen Expression von dem Gesagten mit der Geste gänzlich zum Vorschein kommen kann. Sie sind damit ein äusserst wichtiger Part in der Wissensvermittlung. Hier passiert nun jedoch ein weiteres Problem bei einer Darstellung im Talking Head Format: Wenn ein Talking Head in einer Halbnahen oder vor allem in einer Nahen Einstellung aufgezeichnet wird, sind seine Gesten zumeist nur angeschnitten oder überhaupt nicht sichtbar. Hier verliert der Lernende somit wichtige, visuelle Informationen zum Verständnis des Themas – wohingegen er die nicht sonderlich relevante Mimik und Mikromimik des Lehrenden wahrnimmt.

An diesem Punkt muss man sich zweifelsohne fragen: Ist ein solches Talking Head Videoformat wirklich für eine adäquate Wissensvermittlung geeignet oder müsste man dieses nicht vollkommen neu denken? Im Video-Medium steckt grosses Potenzial: Man sollte vielleicht besser, als die klassische Seminarsituation zu kopieren, die Bildungsvideos dahin entwickeln, dass sie den ästhetisch-didaktischen-narrativen Eigenschaften des Mediums entsprechend produziert werden.



Reutemann, Jeanine (2016): „Differences and Commonalities – A comparative report of video styles and course descriptions on edX, Coursera, Futurelearn and Iversity“, In: Proceedings of the EUROPEAN STAKEHOLDER SUMMIT on experiencies and best practices in and around MOOCs (EMOOCS 2016), eds. Khalil M., Ebner M., Kopp M., Lorenz A., Kalz M. Graz. 383-392. Online

Experteninterview von der Autorin mit Prof. Dr. Sotaro Kita, Nantes 2015.


Steigende Anzahl von Greenscreen Inszenierungen

Talking Head mit Greenscreen ist ebenfalls ein beliebter Stil (26%). Die Lehrenden werden in einem Greenscreen Studio aufgezeichnet um anschiessend in der Postproduktion die unterschiedlichsten Hintergründe einzufügen. Lara Ruppertz, Director of Didactics and Course Development von Iversity dazu: „Man sieht das immer wieder: da wurde im Greenscreen gearbeitet und das ganze wurde nicht vernünftig eingefügt. Das sind so diese kleinen Sachen, damit könnte man glaub ich noch leben, aber dieses Erzwungene: Wir machen das jetzt hier modern und anders, aber eigentlich ist das gar nicht modern und anders, sondern total 80er und 90er (Interviews 2015).“ Die Verwendung von Greenscreen ist verlockend für ein Bildungsvideo. Leider wird unterschätzt, wie viel Aufwand in Greenscreen-Studios für eine korrekte Lichtsetzung und das „keying“ (Ausschneiden) entstehen. Zusätzlich sollte beachtet werden, dass die künstliche Studiosituation für Lehrende Neuland ist, und sie ihre Sprache und Performanz neu reflektieren müssen. Denn die Haltung beim Vermitteln von Wissen - nur schon der Blick in eine Kamera - unterscheidet sich in vieler Hinsicht von der im Vorlesungssaal. Jon Wardle, Director of Curriculum, National Film and Television School of Britain: „They all try to mimic a presentation in a lecture theatre, even if it’s not them physically standing there […]. So the lecture still feels quiet strong in all of the styles of them and I think that’s a real shame. Actually, I’m not sure that the lecture as a teaching and learning model is that good anyway, and yet why are we trying to copy its conventions into the online space? (Interviews 2015)“


Mediale Eigenschaften von Bewegtbildern

 Keineswegs ist die Verwendung von Bewegtbildern für die Wissenskommunikation etwas Neues.

„I believe that the motion picture is destined to revolutionize our educational system and that in a few years it will supplant largely, if not entirely, the use of textbooks (Edison 1922).“

Es geht heute jedoch nicht mehr um die Frage, ob Bildungsvideos textliche Lehrmittel ersetzen werden. Bildungsvideos können als ein weiteres Medium für die Wissenskommunikation eingesetzt werden, gerade dort, wo ein Textbuch medial an seine Grenzen stößt. Wir üben uns bereits seit ca. 3000 Jahren in der Strukturierung von Texten. Zwar wurde seit den Entstehungsjahren der Bewegtbilder mit z.B. Eisenstein, Vertov oder Kuleshov eine fundierte Grundlage für Bilddramaturgie und Montage für eine Narration geschaffen, und heute sind in der Medien- und Filmwissenschaften empirische Studien zur Rezeption verfügbar. Doch stehen wir im Vergleich zu Texten noch ganz am Anfang der Entwicklung. Bildungsvideos können durch die artifizielle Bild-Ton Kombination, Temporalität und die Verwendung von Bewegt-„Bildern“ auf eine andere Art kommunizieren als dies alleine mit Worten möglich wäre (siehe dazu Mayer 2012). Das gilt ebenso für die Tonspur und die „Sonifikation“ (akustische Vertonung) von Wissensinhalten. Bei der Bildwahl liegt neben dem Potenzial aber gleich eine Fallgrube: Bilder tragen eine gewisse Ambiguität in sich. In Kombination mit der Tonspur kann die Bedeutung präziser erklärt werden – oder es ergeben sich bei unachtsamer Montage ungenaue, verwirrende oder sogar widersprüchliche Aussagen, denn: »We never see the same thing when we also hear; we don‘t hear the same thing when we see as well« (Chion 1994, S. 19).


Weltweite Dissemination von Wissen

Die Wissensvermittlung von Universitäten oder privatwirtschaftlichen Institutionen, welche bis anhin meistens hinter verschlossenen Türen stattfand, ist heute für interessierte Menschen mit Internetanschluss durch webbasierte Bildungsvideos zugänglich. Bildungsvideos sind damit wie wissenschaftliche Publikationen, Projektberichte oder Konferenzpräsentationen, Teil einer öffentlichen Wissenskommunikation. Sie gehören zur Reputation einer ProfessorIn oder ExpertIn und zur „Corporate Identity“ ihrer Institution und sollten daher in einer reflektierten Art und Weise produziert werden. Darin steckt großes Potenzial: Bildungsvideos dahin zu entwickeln, dass sie sowohl den praktischen Einschränkungen einer Institution als auch den ästhetisch-didaktischen-narrativen Eigenschaften des Mediums Bewegtbild entsprechend produziert werden.



Chion, M.: Audio-Vision. New York 1994.

Edison, T. zitiert in Cuban L. Teachers and Machines: The Classroom Use of Technology Since 1920 [1922].

Goldin-Meadow, S., Wagner Alibali, M.: Gesture’s role in speaking, learning, and creating language, Annu Rev Psychol. 2013.

Interviews mit Experten: Smith N., Wardle J., Ruppertz L., Kita S., Boebel C. In: Video Styles in MOOCs, Reutemann J. 2015. 

Kim, J., Guo, P., Seaton, D., Mitros, P., Gajos, K. , & Miller, R.: Understanding in-video dropouts and interaction peaks in online lecture videos. In: Proceedings of the first ACM conference 2014.

Lehmann, B.: MOOCs – Versuch einer Annäherung“. In: MOOCs – Massive Open Online Courses Offene Bildung oder Geschäftsmodell? Münster 2013.

Mayer, R. E.: The Cambridge handbook of multimedia learning. Cambridge 2014.