This forum contains results from the eponymous seminar from WS2013/2014. Each work from the students contains a summary of their results and the presentations attached (partly in German Language).
Post Reply
paul
Posts: 1
Joined: 06.11.2013, 17:03

Depth perception from stationary and moving S3D images

Post by paul » 15.04.2014, 16:19

Pagel - Referat - Ausarbeitung.pdf
Ausarbeitung: „Depth perception from stationary and moving stereoscopic three-dimensional images“
(695.71 KiB) Downloaded 1104 times
EINFÜHRUNG

Die in diesem Papier behandelte Studie untersucht die Tiefenwahrnehmung von unbewegten und bewegten stereoskopischen 3D-Szenen (nachfolgend auch als „S3D-Szenen“ abgekürzt). Zunächst werde ich auf wichtige Begriffe der monokularen und binokularen Tiefenwahrnehmung sowie auf die Grundlagen der stereoskopischen Wahrnehmung natürlicher sowie künstlicher stereoskopischer 3D-Szenen eingehen. Anschließend stelle ich die Studie vor, die darin durchgeführten Experimente und erläutere jeweils Versuchsaufbau, Durchführung und Ergebnis. Im Anschluss fasse ich den Sachverhalt und die Empfehlungen aus der Studie zusammen.

GRUNDLAGEN MONOKULARER UND BINOKULARER TIEFENWAHRNEHMUNG

Monokulare Tiefenwahrnehmung

Die menschliche Wahrnehmung bedient sich diverser Möglichkeiten, Tiefe zu erkennen. So nutzt die Bewegungsfaktoren und Bildindikatoren, welche bereits durch die monokulare Wahrnehmung, also die Rezeption mit einem Auge, Hinweise auf die Tiefe in der Szene liefern. Die Auswertung dieser erfolgt unbewusst während des Wahrnehmungsprozesses. Bei der Verarbeitung der Reize spielen Erfahrungswerte eine wichtige Rolle. Widersprüchliche Informationen werden meist unterdrückt, weshalb auch zweidimensionale Abbildungen Räumlichkeit vermitteln können (vgl. Jäger 2013).

Bewegungsfaktoren

Neben verschiedenen Bildindikatoren, auf die ich im weiteren Verlauf eingehen werde, spielen Bewegungsfaktoren eine Rolle. Nehmen wir an, eine Person betrachtet den Horizont durch das Fenster eines Zuges, der an einer Landschaft vorbei fährt. Sie sieht dabei, dass Objekte wie Bäume und Sträucher im Vordergrund von den Bergen im Hintergrund unterschiedlich weit voneinander entfernt liegen.
Abbildung 1: Abfolge von Bildern simuliert Bewegungsparallaxe und Ver- / Aufdeckungsbewegung (Ayton 2006)
Abbildung 1: Abfolge von Bildern simuliert Bewegungsparallaxe und Ver- / Aufdeckungsbewegung (Ayton 2006)
1.jpg (143.26 KiB) Viewed 33756 times
Durch ihren parallelen Blick in die Landschaft auf den Horizont erscheint es, als würden die Objekte im Vordergrund schneller als die Objekte im Hintergrund an der Person vorbeiziehen. Dieser Effekt wird als Bewegungsparallaxe bezeichnet (siehe Abb. 1). Bei der Fahrt vorbei an den Objekten in der Landschaft ändert sich deren Verdeckung, was als Verdeckungsbewegung beschrieben wird. Sowohl die Bewegungsparallaxe als auch die Verdeckungsbewegung liefern monokulare Hinweise auf die visuelle Tiefe des Geschehens (vgl. Jäger 2013).

Bildindikatoren

Neben Bewegungsfaktoren liefern Bildindikatoren weitere Hinweise, mit denen Tiefe ohne Stereosehen wahrgenommen werden kann. Hierzu greift die Wahrnehmung neben den Bildindikatoren auf Schätzmechanismen und Erfahrungswerte zurück. Nachfolgend stelle ich die wesentlichen Bildhinweise vor (nach Jäger 2013).

Monokulare Verdeckung

Werden Teile eines Objekts von einem anderen verdeckt, ist dies ein Hinweis darauf, dass sich das verdeckte Objekt im Hintergrund und somit in der Tiefe des Raumes befindet. Im nachfolgenden Beispiel ist zu sehen, wie der braune und der gelbe Spielzeug-Dinosaurier den grünen verdecken. Die menschliche Wahrnehmung rekonstruiert dabei die verdeckten Teile des grünen Dinosauriers. Aus diesen erschießt sie wiederum die Lagebeziehung zu den anderen Objekten. Dies ermöglicht die Wahrnehmung von Tiefe bereits durch das Monokularsehen (vgl. ebd.). Die monokulare Verdeckung tritt sowohl bei der Betrachtung dynamischer als auch bei statischen Bildobjekten auf. Im Unterschied zur dynamischen Verdeckungsbewegung funktioniert die monokulare Verdeckung bereits bei der Wahrnehmung statischer Objekte (vgl. ebd.).
Abbildung 2: Monokulare Verdeckung (Davidd 2008)
Abbildung 2: Monokulare Verdeckung (Davidd 2008)
2.jpg (55.8 KiB) Viewed 33756 times
Größe

Sind Objekte in einer Landschaft unterschiedlich weit voneinander entfernt, kann die Wahrnehmung aus Erfahrungswerten und der wahrgenommenen Größe der Objekte auf die Lageposition und Entfernung schließen (vgl. ebd.). In der nachfolgenden Abbildung ist die historische Stadt Machu Picchu links im Hintergrund zu sehen. Der Vordergrund zeigt einen Felsen. Die Nähe des Felsens zum Betrachter und die Größe der Stadt im Hintergrund erzeugen ein Gefühl von Weite (vgl. ebd.).
Abbildung 3: Historische Stadt Machu Picchu links und Felsen (Miraglia 2010)
Abbildung 3: Historische Stadt Machu Picchu links und Felsen (Miraglia 2010)
3.jpg (63.37 KiB) Viewed 33756 times
Höhe
Weitere Tiefenhinweise liefern die Höhenunterschiede von Objekten. Je höher ein Objekt ist, desto größer erscheint es dem Betrachter. In der nachfolgenden Abbildung ist das Denkmal für den Zaren Peter I. des Großen in Moskau zu sehen, im Hintergrund dagegen eine Kirche. Die Höhe der Statue im Verhältnis zur wahrgenommenen Größe der Kirche, die aus der Perspektive in der das Foto aufgenommen wurde resultiert, erzeugen den Eindruck von Tiefe im Bild (vgl. ebd.).
Abbildung 4 Denkmal für Peter I., Höhe: ca. 96 m, Moskau (Brady 2010)
Abbildung 4 Denkmal für Peter I., Höhe: ca. 96 m, Moskau (Brady 2010)
4.jpg (30 KiB) Viewed 33756 times
Atmosphärischer Dunst

Auch die Helligkeit und der Kontrast haben Einfluss auf die menschliche Tiefenwahrnehmung. Im Hintergrund von Landschaftsaufnahmen führt der sogenannte atmosphärische Dunst oft zu einer Schichtung und Abschwächung des Kontrastes zum Horizont. Aus Erfahrungswerten interpretiert die menschliche Wahrnehmung aus diesen Gegebenheiten Tiefe (vgl. ebd.).
Abbildung 5: Zimba, Österreich, 2643 m ü. A. (Böhringer 2010)
Abbildung 5: Zimba, Österreich, 2643 m ü. A. (Böhringer 2010)
5.jpg (16.61 KiB) Viewed 33756 times
Lineare Perspektive

Bei der Betrachtung von Autobahnstraßen oder langen Wegen fällt auf, dass die parallel zur Straße verlaufenden Begrenzungslinien vermeintlich in einem Fluchtpunkt im Horizont zusammenlaufen. Der Weg erscheint mit zunehmender Entfernung schmaler zu werden. Physiologisch liegt dieser Eindruck darin begründet, dass die Seitenbegrenzungen nicht parallel auf der Netzhaut projiziert werden. Diese Perspektive wird als monokularer Tiefenhinweis vom Sehzentrum des Menschen interpretiert (vgl. Holger 2012).

Binokulare Tiefenwahrnehmung

Die eingangs vorgestellten Mechanismen der monokularen Tiefenwahrnehmung sind möglicherweise fehleranfällig, da sie größtenteils auf Schätzmechanismen und Heuristiken beruhen, die bei ungünstigen visuellen Verhältnissen zu einer Fehlinterpretation führen können (vgl. Freie Universität Berlin 2009). Weiterhin kann die monokulare Tiefenwahrnehmung keine plastische Tiefenwahrnehmung von 3D-Objekten wie z. B. Gesichter erklären (vgl. ebd.). Die binokulare Tiefenwahrnehmung hingegen ist weniger fehleranfällig, da beide Augen zur optischen Wahrnehmung genutzt werden. im Sehen wird die Perspektive beider Augen am jeweiligen Fixationspunkt, der Fovea centralis, auf der Netzhaut abgebildet. Dabei sieht jedes Auge aus einer leicht abweichenden Perspektive, welche aus dem individuellen Augenabstand resultiert. Dieser Unterschied bildet die Grundlage für die binokulare stereoskopische Tiefenwahrnehmung (vgl. ebd.). Zu ihr gehören die Okulomotorik sowie die binokulare Disparität.
Abbildung 6 Querschnitt des menschlichen Auges (Jäger 2013)
Abbildung 6 Querschnitt des menschlichen Auges (Jäger 2013)
6.jpg (23.38 KiB) Viewed 33756 times
Okulomotorik

Die Okulomotorik beruht auf der Wahrnehmung von Veränderungen der Position der Augen sowie der Spannung der Augenmuskeln, welche als Tiefenhinweise interpretiert werden.

Konvergenz

Wird mit den Augen ein Finger fixiert und führt man diesen an die eigene Nase heran, so konvergieren die Augen, was zu einer Spannung der Augenmuskulatur führt. Diese wird vom Gehirn als Nähe interpretiert. Entfernt man den Finger wieder von der Nase, so divergieren die Augen und die Spannung der Augenmuskulatur löst sich. Diese Entspannung wird vom Gehirn als Tiefe interpretiert (vgl. Ciccarello / Berger 1997).

Akkommodation

Neben der Spannung und Entspannung der Augenmuskulatur liefert auch die Akkommodation (lat. accommodare „anpassen“) der Augenlinsen einen binokularen Tiefenhinweis. So besteht ein Zusammenhang zwischen der Entfernung eines wahrgenommenen Objektes und der Wölbung der Augenlinsen. Fixieren die Augen einen Punkt in der Landschaft, so dehnen oder stauchen Ziliarmuskeln im Auge die Linse, um ihre Lichtbrechung entsprechend der Entfernung zum Objekt anzupassen. Dabei wird die Veränderung der Brechkraft ebenso als binokularer Tiefenhinweis interpretiert (vgl. ebd.)

Horopter

Wie bereits erwähnt, nimmt jedes Auge das Geschehen aus einer leicht unterschiedlichen Perspektive wahr, was in unterschiedlichen Netzhautbildern resultiert. Bei der Fixierung eines Objektes lassen sich korrespondierende Punkte auf der Netzhaut beider Augen definieren, welche auf dem fixierten Punkt beruhen, der in der Fovea centralis abgebildet wird. In der nachfolgenden Abbildung ist der Fixationspunkt A und der korrespondierende Fixationspunkt A‘ zu erkennen. Die Nebenpunkte sind folglich B, C mit ihren korrespondierenden Punkten B‘, C‘. Alle Abbildungen, die auf die korrespondierenden Netzhautstellen fallen, liegen auf einer gedachten Kreislinie in der Umwelt, dem Horopter. (vgl. Marsch 2006).
Abbildung 7: Korrespondierende Netzhautstellen auf dem Horopter (nach Jäger 2013)
Abbildung 7: Korrespondierende Netzhautstellen auf dem Horopter (nach Jäger 2013)
7.jpg (20.97 KiB) Viewed 33756 times
Er ist ein theoretisches Konstrukt, welches durch die Knotenpunkte der Augen und den Fixationspunkt verläuft (vgl. Marsch 2006). Dabei wird zwischen dem theoretischen und empirischen Horopter unterschieden. Im Gegensatz zum theoretischen, ist der empirische Horopter nicht vollständig rund, sondern leicht verschoben und horizontal elliptisch geformt. Der theoretische Horopter findet vorzugsweise in der Mathematik Anwendung (vgl. ebd.).

Disparität

Objekte, die nicht auf dem Horopter liegen, fallen demzufolge auf nichtkorrespondierende Netzhautstellen in den sogenannten Panumraum. Ihr Abstand voneinander wird Disparität oder Querdisparation genannt. Der Panumraum bildet einen relativ schmalen Bereich, der den Horopter umgibt, in dem die nichtkorrespondierenden Bildpunkte gleichzeitig fusioniert wahrgenommen werden. Diese Fusion gelingt jedoch nur, wenn die Objekte sich relativ nah vor oder hinter dem Fixationspunkt befinden. In der unten stehenden Abbildung ist der Panumraum grün hervorgehoben.
Abbildung 8: Fixationspunkt (gelb) mit Nebenpunkten im Panumraum (grün) (Jäger 2006)
Abbildung 8: Fixationspunkt (gelb) mit Nebenpunkten im Panumraum (grün) (Jäger 2006)
8.jpg (20.69 KiB) Viewed 33756 times
Nebenpunkte die vor dem Horopter im Panumraum liegen, erzeugen gekreuzte Disparität. Der Betrachter nimmt diese Punkte näher wahr als den Fixationspunkt. Bei der Betrachtung einer künstlichen S3D-Szene befinden sich Objekte mit gekreuzter Disparität im Zuschauerraum vor der Bildebene (vgl. Marsch 2006).

Punkte die hinter dem Horopter liegen, erzeugen ungekreuzte Disparität. Dies bedeutet, dass ein Objekt weiter entfernt ist als der Fixationspunkt. Bei der Betrachtung einer künstlichen S3D-Szene befinden sich Objekte mit ungekreuzter Disparität hinter der Bildebene. Je größer diese ist, desto größer ist auch die empfundene Tiefe. (vgl. Jäger 2013).

Objekte die sich außerhalb des Panumraums befinden, erzeugen Doppelbilder. Sie können nicht mehr fusioniert wahrgenommen werden. Bezogen auf die Wahrnehmung einer natürlichen S3D-Szene würde dies jedoch bedeuten, dass ständig Doppelbilder außerhalb des Fixationspunktes erkannt werden würden. In der Realität ist dies jedoch nicht der Fall, da die Bildpunkte sich außerhalb der Fovea centralis befinden, was wir als natürliche Tiefenunschärfe wahrnehmen. Die geringe Zäpfchenauflösung auf der Netzhaut außerhalb der Fovea centralis erzeugt unscharfe Bilder, die vom Sehzentrum unterdrückt werden.

Natürliche und künstliche Stereopsis

Beim natürlichen stereoskopischen Sehen arbeiten die genannten Mechanismen zusammen: Die Disparität von Punkten wird analysiert und in Beziehung zum Horopter gestellt. Mithilfe monokularer und binokularer Tiefenhinweise ermittelt das Gehirn die Abstände vom Betrachter zum Objekt, sodass die Wahrnehmung von Räumlichkeit ermöglicht wird und die Teilbilder verschmolzen werden (vgl. Jäger 2013).

Matthias Jäger weist darauf hin, dass es einen Unterschied zwischen der natürlichen Stereopsis und der Wahrnehmung einer stereoskopischen 3D-Szene gibt. Bei der Wahrnehmung einer natürlichen Szene werden die Bildobjekte außerhalb des Panumraums verschwommen abgebildet und ihre Wahrnehmung vom Sehzentrum unterdrückt (vgl. Jäger 2013). Im Gegensatz dazu sind in einer künstlichen stereoskopischen 3D-Szene alle Bildelemente gleich entfernt dargestellt. Sie werden gleichzeitig scharf abgebildet. Objekte, die sich außerhalb des Panumraums befinden, erzeugen Doppelbilder und erschweren daher die Verarbeitung der Informationen im Sehzentrum. Es ist nicht mehr in der Lage, zwischen Vordergrund und Hintergrund zu unterscheiden, da die natürliche Tiefenschärfe fehlt. Um die ganze Tiefe der Szene zu erfassen, müssen die Augen das Bild „absuchen“, was auf Dauer zu Beschwerden wie Kopfschmerzen führen kann (vgl. ebd.). Die nachfolgende stereoskopische Rot-Cyan-Abbildung visualisiert die Problematik. Jäger empfiehlt deshalb, den maximal nutzbaren Raum in künstlichen stereoskopischen 3D-Szenen zu begrenzen, um den Betrachter nicht visuell zu überfordern (vgl. ebd.).
Abbildung 9: Stereoskopische 3D-Szene mit maximal ausgenutztem Tiefen-Raum (Jäger<br />2013)
Abbildung 9: Stereoskopische 3D-Szene mit maximal ausgenutztem Tiefen-Raum (Jäger
2013)
9.jpg (51.06 KiB) Viewed 33756 times
STUDIE

Die Studie „Depth perception form stationary and moving stereoscopic three-dimensional images“ des Pacific University Vision Performance Institute, Oregon in Kooperation mit der User Experience Research Group, Intel Cooperation, hat sich mit der Tiefenwahrnehmung von künstlichen stereoskopischen 3D-Szenen auseinandergesetzt. Ziel war es dabei zu evaluieren, wie die Genauigkeit der menschlichen Tiefenwahrnehmung von statischen und sich bewegenden Bildinhalten innerhalb stereoskopischer 3D-Szenen durch die Übereinstimmung von proportionalen und konstanten Größenhinweisen in den Szenen, beeinflusst wird. Hierzu wurden jeweils zwei Experimentreihen ausgeführt, auf die ich im Nachfolgenden ausführlich eingehen werde.

Experiment 1 – Tiefenwahrnehmung statischer stereoskopischer 3D-Bildinhalte

Anhand statischer S3D-Bildinhalte wurde die Genauigkeit und Verlässlichkeit der Tiefenwahrnehmung evaluiert. Das Experiment wurde mit 60 Normalsichtigen im Alter von 18 bis 40 Jahren (Median: 24,5 Jahre) durchgeführt. Fehlsichtige mit Korrekturbrillen wurden ausgeschlossen, da die Korrektur die Ergebnisse der Messung der Tiefenposition verfälscht hätte.

Zur Evaluation der subjektiven Tiefenwahrnehmung wurde die individuelle Pupillendistanz der Versuchspersonen gemessen. Mithilfe dieser konnte die objektive Tiefenpositionen errechnet werden. Aus ihr wurde in der Analyse die Abweichung von der subjektiven Tiefenwahrnehmung festgestellt. Der Abstand der Augen beeinflusst dabei entscheidend die Nah- und Fernwirkung eines S3D-Objektes auf den Betrachter. Eine geringe Pupillendistanz (unter 60 mm) bewirkt, dass ein S3D-Objekt näher wahrgenommen wird, als dies bei einer größeren Pupillendistanz der Fall sein würde.

Versuchsaufbau
Den Versuchspersonen wurde ein viereckiger Rahmen in Form eines Diamanten präsentiert, der jeweils vier Kreise enthielt. Diese wurden mithilfe von Adobe Flash animiert. Zur Abbildung wurde ein 55“ LG 3D TV genutzt, der 2.4 m von den Versuchspersonen entfernt war.
Abbildung 10: 2D-Version des S3D-Teststimulus aus<br />der Studie
Abbildung 10: 2D-Version des S3D-Teststimulus aus
der Studie
10.jpg (9.73 KiB) Viewed 33756 times
Bei jedem Versuchsdurchlauf wurde die Abbildung mit dem Diamanten-Rahmen als Referenzobjekt mit einer Disparität von 0 Pixel – also auf dem Horopter liegend – dargestellt. Die vier Kreise hingegen zeigten bei jedem Durchlauf gekreuzte Disparität. Diese betrug 36, 48 oder 60 Pixel. Relativ zur jeweiligen gekreuzten Disparität waren die Kreise entweder konstant oder proportional groß in drei Größengruppen (klein, mittel, groß). In konstanter Größe verblieben alle Kreise gleich groß zum Referenz-Diamanten, nur die Disparität änderte sich. In proportionaler Größe wurden die Kreise skaliert: 1.22° (klein), 1.60° (mittel), 1.96° (groß) für die jeweilige Disparität von 36, 48 oder 60 Pixel.

Durchführung

Insgesamt wurden sechs Situationen evaluiert, die jede Versuchsperson durchlief. Dabei wurde jede Situation 20 Mal wiederholt mit insgesamt 120 Versuchen in zwei Blöcken. Der Versuch begann mit der Abbildung des Diamantenrahmens und der Kreise in konstanter Größe, anschließend in proportionaler Größe, um den Kontrast zu liefern. Die Versuchsperson hatte jeweils 10 Sekunden Zeit, den Tiefenabstand vom Referenzobjekt zu den Kreisen zu messen. Dies erfolgte mithilfe einer Schur und einem Stab, den sie an die Stelle ziehen sollte, an der sie die Kreise wahrgenommen hatte. Der somit ermittelte Wert wurde in der Analyse mit der aus dem Augenabstand berechneten objektiven Tiefenposition verglichen und die Differenz ausgewertet. Nachfolgend habe ich beispielhaft mehrere Rot-Cyan-Abbildungen des S3D-Testes erstellt, die dem S3D-Test-Stimulus aus der Studie gleichen. Hierzu habe ich Testbilder ausgewählt, in denen die Kreise mit proportionaler Größe relativ zum Referenzobjekt dargestellt werden, da hier der Tiefen-Effekt laut Studie größer ist als bei konstanter Größendarstellung.
Abbildung 11: Testbild 1 Diamantrahmen: Disparität = 0,<br />Kreise: gekreuzte Disparität = 36 Pix, proportionale Größe
Abbildung 11: Testbild 1 Diamantrahmen: Disparität = 0,
Kreise: gekreuzte Disparität = 36 Pix, proportionale Größe
11.jpg (10.33 KiB) Viewed 33756 times
Abbildung 12: Testbild 2 Diamantrahmen: Disparität = 0,<br />Kreise: gekreuzte Disparität = 70 Pix, proportionale Größe
Abbildung 12: Testbild 2 Diamantrahmen: Disparität = 0,
Kreise: gekreuzte Disparität = 70 Pix, proportionale Größe
12.jpg (12.03 KiB) Viewed 33756 times
Abbildung 13: Testbild 3 Diamantrahmen: Disparität = 0,<br />Kreise: gekreuzte Disparität = 80 Pix, proportionale Größe
Abbildung 13: Testbild 3 Diamantrahmen: Disparität = 0,
Kreise: gekreuzte Disparität = 80 Pix, proportionale Größe
13.jpg (12.83 KiB) Viewed 33756 times
Ergebnisse

Die Differenz zwischen prognostizierter und wahrgenommener Tiefe sowie die Auswirkung der Größenhinweise (konstant/proportional) wurden in mehreren Varianzanalysen ausgewertet. Die Ergebnisse zeigen, dass die Disparität signifikanten Einfluss auf die subjektive Tiefenwahrnehmung der Versuchspersonen hatte. Die zunehmende Disparität rief dabei einen größeren Tiefenabstand in allen Größen-Gruppen (klein, mittel, groß) hervor. Der Einfluss der Größenhinweise selbst war nur in der Größen-Gruppe „groß“ signifikant.

Ebenso hatte die Disparität signifikanten Einfluss auf die Abweichung zwischen subjektiver und objektiver Tiefenwahrnehmung. Je größer die Disparität war, umso mehr verschätzten sich die Versuchspersonen bei der subjektiv wahrgenommenen Tiefe. Eine Ausnahme bildete dabei die Darstellung der Kreise mit geringer Disparität (36 Pixel) in der Bild-Gruppe „groß“, auf die ich nachfolgend eingehe.

Generell überschätzten die Versuchspersonen die Tiefe um 4 bis 8 %. Die S3D-Bilder wurden subjektiv tiefer wahrgenommen, als zuvor objektiv prognostiziert, wofür hauptsächlich die Disparität verantwortlich war. Die Veränderung der Größe der Kreise hatte keinen signifikanten Einfluss auf Genauigkeit der Tiefenwahrnehmung. Jedoch zeigte sich eine Kombination als Ausnahme: Wurden die Kreise aus der Gruppe „groß“ in der Entfernung bei geringer Disparität präsentiert, nahmen die Versuchspersonen diese näher wahr als faktisch dargestellt. Dieses Phänomen wird als „Looming“ bezeichnet. Die Größenveränderung erweckt den Eindruck, als würde der Bildinhalt sich zum Betrachter hinbewegen. Der Effekt entsteht bei der Vergrößerung von statischem Bildinhalt und wird verstärkt, je schneller die Vergrößerung erfolgt.

Experiment 2 – Tiefenwahrnehmung dynamischer stereoskopischer 3D-Bildinhalte

Untersucht wurde die Genauigkeit der menschlichen Wahrnehmung, die Tiefe von Objekten in einer dynamischen S3D-Szene in Abhängigkeit zu einem Referenzobjekt abzuschätzen. Es wurde dieselbe Versuchspersonengruppe aus dem Experiment 1 verwendet (60 Normalsichtige im Alter von 18 bis 40 Jahren).

Versuchsaufbau

Den Versuchspersonen wurden wieder S3D-Test-Stimului präsentiert, die jeweils aus einem aus dem Experiment 1 bekannten Diamanten-Rahmen mit vier Kreisen bestanden. Bei jedem Versuchsdurchlauf wurde der Rahmen mit einer unterschiedlichen gekreuzten Disparität präsentiert (36, 48, 60 Pixel). Er diente als Referenzobjekt, um das Ende einer Strecke zu markieren, welche die vier Kreise zurücklegen sollten, die mit einer Sekunde Verzögerung eingeblendet wurden. Die Kreise bewegten sich mit einer steigenden Disparität von 0 bis 60 Pixeln (und darüber hinaus) auf das Referenzobjekt zu. Ihre Geschwindigkeit betrug entweder 27, 32 oder 40 Pixel pro Sekunde. Die Versuchsabläufe wurden wieder mit Größenhinweisen in konstanter oder proportionaler Kreisgröße durchgeführt.

Durchführung

Insgesamt wurden 18 Situationen evaluiert. Hierfür wurden die Versuchspersonen gebeten, einen Knopf zu betätigen, sobald die abgebildeten Kreise die Tiefe des Referenzobjektes erreicht hatten. Die 18 Situationen setzten sich aus drei Disparitäts-Levels des Referenzobjektes, drei Geschwindigkeiten der Kreise sowie zwei Größen (proportional / konstant) zusammen. Jede Situation wurde sechs Mal wiederholt, was insgesamt in 108 Versuchen pro Person resultierte. Die Dauer betrug jeweils 20 Minuten.

Die nachfolgende Animation simuliert den S3D-Stimulus der dem Experiment 2 zugrunde liegt. Zu Beginn der Animation ist der statische Referenzrahmen mit gekreuzter Disparität dargestellt. Die Kreise werden mit einer Verzögerung von einer Sekunde eingeblendet und bewegen sich anschließend mit steigender proportionaler Größe und gekreuzter Disparität auf das Referenzobjekt zu. Sie erreicht bei 3 Sekunden den Disparitätswert des Referenzobjektes und steigt weiter auf ihren Maximalwert bis zum Ende des Videos.
Diamond_50_Kreise_0-MAX.webm
Stereo Red/Cyan Animation
(1.87 MiB) Downloaded 22034 times
Ergebnisse

Die Auswertung der Reaktionszeiten ergab, dass die Versuchspersonen dazu neigten, die Tiefe dynamischer Bildinhalte in S3D-Szenen zu überschätzen. Die Fehleinschätzung über die Ankunftszeit nahm jedoch ab, sobald die Größe der Kreise proportional zum Referenzobjekt war. Weiterhin hatte die Geschwindigkeit der Kreise einen signifikanten Einfluss. So nahm die Genauigkeit der Reaktionszeit zu, sobald die Kreise sich mit einer geringeren Geschwindigkeit auf das Referenzobjekt zubewegten. Eine höhere Streckenlänge wirkte sich ebenso positiv auf die Reaktionszeit aus.

ZUSAMMENFASSUNG

Die vorliegende Studie untersuchte in zwei Experimenten die Genauigkeit der menschlichen Tiefenwahrnehmung. Experiment 1 zeigte, dass die gekreuzte Disparität die Genauigkeit und Intensität der Tiefenwahrnehmung signifikant beeinflusst. So nahmen die Versuchspersonen statischen S3D-Inhalt tiefer wahr, als faktisch dargestellt. Experiment 2 zeigte auch, dass Versuchspersonen die Tiefe dynamischer S3D-Inhalte überschätzten. Die Genauigkeit der Tiefenwahrnehmung nahm jedoch zu, wenn die Referenz-Disparität größer war, bei proportionaler Größenänderung, und geringer Tiefenbewegung.

Aus den Ergebnissen beider Experimente schlussfolgern die Wissenschaftler:
1. Die menschliche Wahrnehmung neigt dazu, die Nähe eines S3D-Objektes in Relation zur eigenen Position zu überschätzen und…
2. die Zeit zu unterschätzen, die benötigt wird, um einen Punkt in der Tiefe einer S3D-Szene zu erreichen.

Diese Effekte werden durch das Fehlen einer kohärenten Bildgröße sowie einer (zu) schnellen Bild-Bewegung verstärkt und sind beispielsweise aus Kinofilmen bekannt, die den Tiefenraum in den Szenen regelmäßig maximal ausschöpfen. Die Folgen für den Betrachter sind dabei oft in der Überforderung des Seh- und Wahrnehmungszentrums zu spüren, was sich am ehesten in einer Motion Sickness beim Betrachten von S3D-Inhalten bemerkbar macht.

Um die Genauigkeit und den Komfort der Tiefenwahrnehmung in S3D-Szenen zu erhöhen, wird empfohlen, die Bildgröße in Anhängigkeit zur Disparität zu setzen, sowie eine geringere Tiefenbewegung bei dynamischen Bildinhalten zu verwenden.

QUELLENVERZEICHNIS

Ayton, Jens (2006): „A constructed example of parallax scrolling.”; http://de.wikipedia.org/wiki/Datei:Para ... xample.gif, Genehmigung durch CC BY 2.0, keine Änderungen vorgenommen, letzter Zugriff: 02.12.13.

Böhringer, Friedrich (2010): Zimba, http://upload.wikimedia.org/wikipedia/c ... norama.jpg, Genehmigung durch CC BY-SA 2.5, keine Änderungen vorgenommen, letzter Zugriff: 02.12.2013.

Brady, Katie (2010): Statue von Peter den Großen, Moskau. http://flic.kr/p/8i14qT, Genehmigung durch CC BY 2.0, keine Änderungen vorgenommen, letzter Zugriff 02.12.2013.

Ciccarello, Liborio; Berger, Dirk (1997): Tiefenwahrnehmung durch binokulare Stereopsis. Universität Mannheim; http://irtel.uni-mannheim.de/lehre/semi ... binoc.html; letzter Zugriff: 25.11.2013.

Davidd (2008): Cricket Creek -- The 365 Toy Project; http://www.flickr.com/photos/puuikibeac ... otostream/, genehmigt durch CC BY 2.0, keine Änderungen vorgenommen, letzter Zugriff: 17.01.2014.

Freie Universität Berlin (2009): Allgemeine Psychologie. „Wahrnehmung: Tiefe und Bewegung“; http://www.ewi-psy.fu-berlin.de/einrich ... gpsy_3.pdf; letzter Zugriff: 25.11.2013.

Jäger, Matthias (2013): Disparität, Horopter, Panumraum; http://www.weir3d.de/film/node/33, genehmigt durch CC BY-SA 3.0, keine Änderungen vorgenommen, letzter Zugriff: 25.11.2013.

Marsch, Sebastian (2006): Binokulares Sehen, http://glossar.hs-augsburg.de/Binokulares_Sehen, genehmigt durch CC BY-SA 3.0 DE, keine Änderungen vorgenommen, letzter Zugriff: 02.12.2013.

Miraglia, Eric (2010): Machu Picchu, http://flic.kr/p/8jkUxq, genehmigt durch CC BY-NC-SA 2.0, Änderungen: rote Kreismarkierung eingefügt, letzter Zugriff: 02.12.2013.

Roelandts, Tom (2013): Looming; http://tomroelandts.com/articles/the-looming-effect; letzter Zugriff 25.11.2013.

Tauer, Holger (2012): STEREO 3D INFO, Glossar; http://www.stereo-3d-info.de/glossar.html; letzter Zugriff: 25.11.2013.

Yu-Chi Tai; Sowjanya Gowrisankaran; Shun-nan Yang; James E. Sheedy; John R. Hayes, et al. (2013): „Depth perception from stationary and moving stereoscopic three-dimensional images“, Proc. SPIE 8648, Stereoscopic Displays and Applications XXIV, 86480O (March 12.13); doi:10.1117/12.2005166; http://dx.doi.org/10.1117/12.2005166 .

Post Reply