Derzeit gibt es 7,9 Milliarden menschliche Gesichter auf der Erde. Alle sind Variationen desselben Modells: zwei Augen flankieren eine Nase über einem Mund. Doch mit nur einem Blick können die meisten von uns den Unterschied zwischen zwei Gesichtern erkennen. Wie kommt unser Gehirn zu diesen blitzschnellen Urteilen?
Spoiler-Alarm: Niemand weiß es. Und während die heutigen Computerprogramme großartig darin sind, Gesichtern Namen zu geben, ist keines besonders gut darin, zu beurteilen, wie ähnlich (oder unähnlich) verschiedene Gesichter erscheinen. Aber in einer heute veröffentlichten Studie in der Proceedings of the National Academy of Sciences (PNAS), Ein internationales Forscherteam, das Objekterkennungsprogramme testet, liefert Hinweise auf die Art von Berechnungen, die Gehirne möglicherweise durchführen, wenn sie beurteilen, wie ähnlich Gesichter sind.
„Gesichter voneinander zu unterscheiden ist eine sehr feine visuelle Unterscheidung, aber wir haben dies gemeistert, selbst wenn Teile von Gesichtern, wie Nasen und Wangen, gleich aussehen können“, sagte er Kamila M. Jozwik, PhD, von der University of Cambridge und Erstautor der Veröffentlichung. „Unsere Studie könnte uns helfen zu verstehen, wie wir Menschen erkennen und wahrnehmen, was beeinflusst, wie wir über sie denken und sie behandeln.“
„Die Fähigkeit, Unterschiede sogar auf demselben Gesicht zu erkennen, wie z. B. in Gesichtsausdrücken oder in vertrauten Gesichtern, die gealtert sind, beeinflusst unsere Emotionen und die Art und Weise, wie wir mit Menschen interagieren“, fügte er hinzu Katherine R. StorrsPhD, von der Justus-Liebig-Universität in Gießen, Deutschland, und der zweite Hauptautor der Studie.
In ihrem Artikel erklären Dr. Jozwik und Storrs, Nikolaus KriegeskortePhD, leitender Forscher am Zuckerman Institute in Columbia und Hauptautor der Studie, und mehrere Co-Autoren identifizierten ein „überraschend einfaches“ Computermodell, das sich als sehr effektiv bei der Bewertung von Gesichtsunterschieden erwiesen hat.
„Wir hoffen, dass dies uns einen theoretischen Einblick in den Rechenprozess geben wird, den unser Gehirn durchführt, wenn es bekannte Gesichter erkennt oder auf neue trifft“, sagte Dr. Kriegeskorte.
Zu diesem Zweck rekrutierten die Forscher 26 Studenten im Grundstudium an der University of Cambridge und baten sie, zahlreiche Paare realistischer computergenerierter Gesichter (basierend auf Scans echter Gesichter) nach der Ähnlichkeit der beiden Gesichter jedes Paares zu ordnen.
Die Forscher wiesen dann 16 verschiedene Computerprogramme an, die jeweils ein Modell ausführten, das die Gesichter auf unterschiedliche Weise darstellte, um dieselben Gesichtsähnlichkeitsbewertungen vorzunehmen. Einige der Models zeigten Gesichter als digitale Bilder, massive Anordnungen von Pixeln. Einige Modelle stützten sich auf geometrische Netze, deren Facetten angepasst werden können, um Gesichter darzustellen. Wieder andere machten Vergleiche von Gesichtsmerkmalen. Schließlich verwendeten einige Modelle Informationen über die Texturen und Formen von Merkmalen wie Augenbrauen oder basierten selbst auf Systemen der künstlichen Intelligenz.
„Wir suchten nach einem Computermodell, das die gleichen Urteile treffen würde wie Menschen beim Vergleichen von Gesichtern“, sagte Dr. Jozwik. „Das würde uns an einen großartigen Ort bringen, um zu fragen, wie das Gehirn verschiedene Gesichter vergleicht.“
Die Forscher fanden heraus, dass zwei Arten von Modellen am effektivsten bei der Replikation von Schülerähnlichkeitsrankings waren. Ein Typ, Deep Neural Networks (DNN), wird auf unseren Mobiltelefonen verwendet, um Gesichter auf Fotos zu erkennen, und wird oft in Filmen und Fernsehsendungen dargestellt, deren Handlungsstränge KI beinhalten.
Programmierer trainieren DNNs, ein Objekt zu erkennen, z. B. eine Katze oder ein menschliches Gesicht, mit Galerien digitaler Bilder, die bereits von einer Person als Beispiele für das interessierende Objekt kommentiert wurden. In der Trainingsphase wird die Abfolge der von den DNNs durchgeführten Berechnungen ständig neu angepasst, bis diese Programme der künstlichen Intelligenz das Zielobjekt in neuen Bildern erkennen können, die den Modellen präsentiert werden. In der Studie verglichen DNN-Modelle die mehreren tausend Pixel, aus denen verschiedene Gesichter bestehen. Aus diesen Vergleichen berechneten die DNNs Ähnlichkeitsrankings zwischen denselben Gesichtspaaren, die die Schüler bewerteten.
Der andere Programmtyp, der besonders effektiv bei der Reproduktion der Gesichtsähnlichkeitsbeurteilungen des Schülers war, wurde vom Basler Gesichtsmodell (BFM) abgeleitet. Stellen Sie sich BFM als eine Art digitalen Ton für Gesichter vor. Durch das Massieren verschiedener Teile digitaler Gesichter (gescannt von echten Menschen) wird es möglich, ein Gesicht mehr oder weniger subtil in ein anderes Gesicht zu verwandeln; und Formen und Texturen können präzise und mathematisch spezifiziert werden. Für die PNAS-Studie erstellten die Forscher Gesichtspaare aus diesem BFM-Modell und baten die Studenten, sie basierend auf der Ähnlichkeit der Gesichtspaare auf einem großen Computer-Touchscreen anzuordnen.
Das bemerkenswerteste Ergebnis, so die Forscher, ist, dass das BFM genauso gut wie die viel rechenintensiveren DNN-Modelle darin war, die Wahrnehmungen der Schüler von Gesichtsähnlichkeit zu reproduzieren. Dieses Ergebnis legt nahe, dass die Art der statistischen Variationen zwischen Gesichtern, die vom BFM-Modell bewertet werden, wichtig für unser Gehirn ist, sagte Dr. Storrs.
Die Forscher weisen darauf hin, dass ihre Studie Grenzen hat. Zum einen wurde das BFM von Forschern in Basel, Schweiz, basierend auf Scans von 200 meist jungen, weißen Gesichtern gebaut. „Die natürliche Variation in einer Population von Gesichtern ist für verschiedene Menschen an verschiedenen Orten unterschiedlich“, sagte Dr. Kriegeskorte. Tools und Datensätze, die repräsentativ für die Gesichtsvielfalt der Welt sind, sind derzeit nicht verfügbar. Dies schränkt das Vertrauen der Forscher derzeit ein, dass ihre Arbeit tatsächlich auf die eigenen Rechentechniken des Gehirns zur Bewertung von Gesichtern hinweist.
„Wir hoffen, dass diese Ergebnisse uns zu Fragen und Forschungsmethoden führen können, die genauer aufdecken, wo und wie im Gehirn diese entscheidende Aufgabe der Informationsverarbeitung stattfindet“, sagte Dr. Kriegeskorte. „Wir hoffen auch, dass Forschung wie die unsere uns helfen wird, das Innenleben und die Mängel von Systemen der künstlichen Intelligenz zur Gesichtserkennung zu verstehen, die in unseren technologischen Landschaften immer häufiger vorkommen.“
Bezug: Jozwik KM, O’Keeffe J, Storrs KR, Guo W, Golan T, Kriegeskorte N. Urteile über die Unähnlichkeit von Gesichtern werden durch die Repräsentationsdistanz in morphbaren und bildberechenbaren Modellen vorhergesagt. PNAS. 2022;119(27):e2115047119. mache ich: 10.1073/pnas.2115047119
Dieser Artikel wurde aus dem Folgenden neu veröffentlicht Materialien. Hinweis: Das Material wurde möglicherweise hinsichtlich Länge und Inhalt bearbeitet. Für weitere Informationen wenden Sie sich bitte an die angegebene Quelle.
„Typischer Zombieaholic. Allgemeiner Twitter-Fanatiker. Food-Fanatiker. Gamer. Entschuldigungsloser Analyst.“