Formel für die Figur - Hintergrund

Allen, die es etwas genauer wissen wollen, möchten wir auf dieser Seite erklären,

  • wie die Schönheitsformel funktioniert,
  • wie man auf die Schönheitsformel kommt und
  • was die Qualitätskriterien für eine gute Schönheitsformel sind.

Die Schönheitsformel ist eine mathematische Gleichung, bei der man Messwerte einer Figur in einzelne Variablen (= Platzhalter) der Gleichung einsetzen und damit einen Attraktivitätswert für die jeweilige Figur berechnen kann. Dieser berechnete Wert ist nicht die Attraktivität der Figur selbst, sondern ein Schätzwert für ihre wahre Attraktivität. Die wahre Attraktivität erhält man, indem man eine große und für die Bevölkerung repräsentative Anzahl von Menschen befragt, die Attraktivität dieser Figur bewerten lässt und deren Urteile zu einem Durchschnittsurteil zusammenfasst. Dieses Durchschnittsurteil ist per Definition die wahre Attraktivität einer Figur. Eine Schönheitsformel kann daher auch niemals "besser" oder genauer sein als das Durchschnittsurteil der Bevölkerung, sie kann nur versuchen, möglichst nah an dieses Urteil heranzukommen.

Eine perfekt funktionierende Schönheitsformel sagt daher die Attraktivitätsurteile der Bevölkerung perfekt voraus. Das Kriterium dafür, was schön oder nicht schön ist, bleibt damit immer der Mensch! Eine mathematische Formel kann nicht bestimmen, was schön ist. Sie kann aber eine Vorhersage treffen, was Menschen als schön empfinden werden, wenn man ihnen bestimmte Reize (Figuren, Gesichter) zur Beurteilung vorlegt.

Wie die Schönheitsformel funktioniert

Doch wie kann man aus Messwerten für eine Figur (= physikalischen Größen) ein Attraktivitätsurteil, also eine subjektive Empfindung (= psychologische Größe) vorhersagen? Um eine Schönheitsformel (= Regressionsgleichung) aufzustellen, muss man eine Regressionsanalyse rechnen. Wir möchten das Prinzip im Folgenden an einer einfachen (anstatt einer multiplen) Regressionsanalyse erklären. Bei einer einfachen Regression wird ausgehend von einer einzigen Variable X eine andere Variable Y vorhergesagt.

  • Die Variable X, mit der etwas vorhergesagt wird (= Prädiktorvariable) soll hier das Verhältnis von Taille zu Hüfte (= waist-to-hip ratio) sein.
  • Die Variable Y, die vorhergesagt wird, ist die Attraktivität einer Figur.

Um eine statistische Analyse rechnen zu können, muss man zuerst eine Untersuchung durchführen, bei der man Daten erhebt. In unserem Beispiel wurden Fotos von 100 standardisiert fotografierten Frauenfiguren einer großen Anzahl von Versuchspersonen vorgelegt und nach Attraktivität (auf einer Skala von 1 bis 7) beurteilt. Danach wurde für jede Figur das durchschnittliche Attraktivitätsurteil über alle Beurteiler berechnet, so dass man nun genau weiß, wie attraktiv jede Figur von der Bevölkerung bewertet wird.

Anschließend wurden die Fotos der Figuren vermessen, nämlich die Taillenweite und die Hüftbreite (sichtbare Distanzen, gemessen in Bildpunkten). Aus diesen beiden Messgrößen wurde für jede Figur ein Taille-Hüfte-Verhältnis (= waist-to-hip ratio, WHR) berechnet, indem man die Taillenweite durch die Hüftweite teilt. Die Maßeinheit (Bildpunkte) kürzt sich dadurch raus und es ergeben sich dadurch Werte im Bereich von 0,6 bis 0,9.

Da aus der Attraktivitätsforschung bekannt ist, dass ein kleiner Wert für das Taille-Hüfte-Verhältnis (WHR) eine Frauenfigur attraktiv macht (d. h. eine schmale Taille im Verhältnis zur Hüfte), stellen wir die Hypothese auf: "Je kleiner das Taille-Hüfte-Verhältnis, desto attraktiver die Figur."
Diese Hypothese überprüfen wir statistisch. Die folgende Grafik illustriert das Ergebnis anhand der Figur-Messwerte von 100 Frauenfiguren.

Jedem Punkt im Streudiagramm entspricht eine Figur. Auf der x-Achse ist das Taille-Hüfte-Verhältnis einer Figur angetragen, auf der y-Achse die dazugehörige Attraktivität der Figur. Die Linie durch die Punkte (= Regressionsgerade) zeigt den allgemeinen Trend der Daten an. Die Gerade fällt leicht ab. Das bedeutet: Je kleiner das Taille-Hüfte-Verhältnis, desto attraktiver ist tendenziell die Figur. Die Größe des Zusammenhangs kann durch eine Korrelation ausgedrückt werden: Sie beträgt r = .31 (= Vorhersagekorrelation), dies ist ein leichter Zusammenhang.
Die Regressionsgerade lässt sich auch durch eine Geradengleichung beschreiben. Sie lautet allgemein:

y = b * x + t

wobei b die Steigung der Geraden und t der Schnittpunkt mit der y-Achse ist

In unserem speziellen Fall lautet die Gleichung:

y = -5,67 * x + 7,88

Diese Geradengleichung ist bereits eine Schönheitsformel, allerdings nur eine ganz einfache und ziemlich ungenaue. Aber man kann sie trotzdem dazu benutzen, um aus einem bekannten Figur-Messwert (= x-Wert, hier das Taille-Hüfte-Verhältnis) die Attraktivität einer Figur (= y-Wert) vorherzusagen.

Beispiel:
Setzt man für x den Wert 0,7 in die Gleichung ein, so ergibt sich:

y = -5,67 * 0,7 + 7,88 = 3,91

In der Grafik liegt dieser y-Wert genau auf der Geraden, senkrecht über dem x-Wert von 0,7.

Dieser Attraktivitätswert ist jedoch nur eine Vorhersage. Wie man an der Grafik sieht, gibt es etliche Figuren, die ein Taille-Hüfte-Verhältnis um die 0,7 besitzen, die jedoch in ihrer Attraktivität deutlich über oder unter dem vorhergesagten Attraktivitätswert liegen. Diese senkrechten Abweichungen der einzelnen Datenpunkte zur Regressionsgeraden, sind die Fehler, die die Formel bei der Vorhersage macht! Wäre diese einfache Formel perfekt, dann würden alle Datenpunkte genau auf der Regressionsgeraden liegen; wäre die Formel sehr gut, dann wären alle Datenpunkte dicht um die Gerade herum verteilt.

Hier geht es jedoch nicht um die Frage, wie gut diese simple Regressionsgleichung Attraktivität vorhersagen kann, sondern um die zugrunde liegende Idee, wie man aus Figur-Messwerten Attraktivität vorhersagen kann. Der konstante Faktor b rechnet das Figurmaß in ein Attraktivitätsmaß um und der konstante Wert t sorgt dafür, dass die vorhergesagten Attraktivitätswerte im Wertebereich der Attraktivitätsskala zwischen 1 und 7 landen. Beide Konstanten sind ein Ergebnis der Regressionsanalyse.

So wie diese einfache Regressionsanalyse funktioniert im Prinzip auch eine multiple Regressionsanalyse, auf der unsere Schönheitsformel basiert. Anstatt einer einzigen Prädiktorvariablen (x-Wert) gibt es jedoch viele gleichzeitig (aktuell 8 Variablen). Die konstanten Faktoren (Beta-Gewichte) vor diesen Variablen haben nicht nur die Funktion, Figurmesswerte in ein Attraktivitätsmaß umzurechnen, sondern sie gewichten auch gleichzeitig die einzelnen Variablen. Denn es gibt Körpermerkmale, die für die Attraktivität einer Frauenfigur wichtiger sind (z. B. Oberschenkelbreite) und solche, die weniger wichtig sind (z. B. Schulterbreite). Wichtige gehen daher mit einer stärkeren Gewichtung in die Berechnung des Attraktivitätswerts ein. Leider lässt sich eine Regressionsanalyse mit mehr als einer Prädiktorvariablen nicht mehr anschaulich grafisch darstellen. Sie lässt sich nur noch rechnen.

Qualitätskriterien für eine gute Schönheitsformel

Für eine gute Schönheitsformel gibt es letztlich nur ein einziges Qualitätskriterium: Sie muss funktionieren, d. h. sie muss Vorhersagen liefern, die mit der Realität übereinstimmen. Wie sie genau zu ihrer Vorhersage kommt, also welche Messgrößen sie wie verrechnet, ist nebensächlich. Was zählt, ist das Ergebnis. Besteht eine hohe Übereinstimmung zwischen den Vorhersagen der Formel und den Beurteilungen von Menschen, dann funktioniert die Schönheitsformel.

Wie hoch so eine Übereinstimmung ist, lässt sich statistisch durch eine Korrelation ausdrücken. Die Vorhersagen der Beautycheck-Figur-Formel korrelieren mit den Attraktivitätswerten von menschlichen Beurteilern mit r = .85. Dies ist ein außergewöhnlich hoher Wert. Das Streudiagramm illustriert den Zusammenhang anhand von 100 fotografierten Frauenfiguren.

Diejenigen Figuren, für die die Schönheitsformel einen hohen Attraktivitätswert voraussagt, bekommen von menschlichen Beurteilern tatsächlich eine hohe Beurteilung, diejenigen, für die sie einen niedrigen Wert voraussagt, bekommen tatsächlich eine niedrige Beurteilung. Die Datenpunkte sind dicht um die Regressionsgerade herum verteilt; das bedeutet, dass die Formel sehr genaue Prognosen liefert. Es gibt jedoch auch vereinzelt Ausreißer, z. B. die beiden Punkte rechts oben in der Grafik. In diesen Einzelfällen lag die Formel mit ihrer Vorhersage etwas daneben und hat die tatsächliche Attraktivität dieser beiden Figur unterschätzt.

Gründe für die hohe Präzision der Schönheitsformel

Es gibt zwei Hauptgründe, warum die Beautycheck-Schönheitsformel so außergewöhnlich genaue Vorhersagen liefert:

  1. Die Masse macht's
  2. Erfahrung

Der erste Grund für die genaue Vorhersage: Die Masse macht's

  • Die Schönheitsformel beruht auf einem statistischen Verfahren, und in der Statistik gilt der simple Grundsatz: Viel hilft viel! Die Regressionsgleichung arbeitet mit vielen Prädiktoren (insgesamt 8). Mit vielen Prädiktorvariablen lassen sich immer genauere Vorhersagen erzielen als mit weniger Prädiktorvariablen, selbst dann, wenn jede einzelne Variable für sich allein genommen nur wenig zur Erklärung von Attraktivität beiträgt. Gemeinsam können sie Schönheit trotzdem gut vorhersagen. Abgesehen davon können aber auch nur viele Variablen der Komplexität des Themas gerecht werden. Denn selbstverständlich gibt es nicht ein oder zwei Körpermerkmale, die allein für Schönheit verantwortlich sind, sondern es sind viele einzelne Details, die in ihrer Gesamtheit bewirken, ob der Mensch eine Figur attraktiv findet oder nicht.
  • Viele Prädiktoren kann man aber aus statistischen Gründen nur dann verwenden, wenn man noch viel mehr Figuren hat. Hat man z. B. nur 30 Figuren zur Verfügung, kann man für eine Regressionsgleichung höchstens zwei Prädiktoren verwenden und die sind obendrein aufgrund der geringen Gesamtzahl (N = 30) sehr ungenau. Die Beautycheck-Schönheitsformel wurde aus über 400 Figuren berechnet. Wie man sich leicht vorstellen kann, ist es nicht so einfach, an standardisiert aufgenommene Fotos von Frauen im Bikini zu kommen. Dies erklärt auch, warum andere Forschergruppen, mit einer funktionieren Schönheitsformel bislang keinen Erfolg hatten. Mit nur 50 Figuren kommt man eben nicht sonderlich weit.
  • Je mehr Versuchspersonen die Attraktivität der Figuren beurteilen, desto genauer kann man deren tatsächliche Attraktivität ermitteln, die man benötigt, um eine Regressionsanalyse rechnen zu können. Durch unsere Online-Experimente können wir auf die Urteile von über 85.000 Beurteilern aus der ganzen Welt zurückgreifen. Wir können dadurch sogar den "Geschmack" von einzelnen Untergruppen analysieren und vorhersagen (z. B. US-Amerikaner, Deutsche oder nur deutsche Männer oder nur deutsche Frauen im Alter von 15 bis 25 Jahren). Durch die enorme Menge an Urteilen sind die so ermittelten Attraktivitätswerte über jeden Zweifel erhaben.

Der Grund zweite für die genaue Vorhersage: Erfahrung

  • Bei der Vermessung der Figur vermessen wir insgesamt 26 Referenzpunkte am Körper. Die Strecke zwischen zwei Referenzpunkten ist eine mögliche Messgröße, die für eine Analyse verwendet werden kann. Rein rechnerisch ergeben sich daraus 351 Distanzen. Die meisten davon sind unsinnig, aber es bleiben immer noch viele übrig, die als Prädiktor in Frage kämen.
    Wir verwenden jedoch nicht nur einfache Distanzen als Prädiktoren, sondern auch Quotienten aus Distanzen (z. B. Taille-Hüfte-Verhältnis). Bei 351 Distanzen gibt es bereits über 61.000 Kombinationsmöglichkeiten, jeweils zwei zu einem Quotienten zu verrechnen. Die meisten sind wiederum unsinnig, aber dennoch bleiben sehr viele übrig, die als Prädiktoren denkbar wären. Viel zu viele um sie alle auszuprobieren.
  • An dieser Stelle ist Erfahrung und Kompetenz wichtig, um zwischen guten und schlechten Kandidaten als Prädiktoren zu unterscheiden. Diese Entscheidung, welche Variable für die Regressionsanalyse ausgewählt wird, bedeutet zwar noch nicht, dass eine bestimmte Variable am Schluss tatsächlich als Prädiktor in der Regressionsgleichung auftaucht. Stellt sie sich nämlich als ungeeignet heraus, wird sie automatisch aus dem Regressionsmodell ausgeschlossen. Doch diese Entscheidung hat einen Einfluss darauf, welche Fragen in der statistischen Analyse gestellt werden. Dies ist ein ganz wesentlicher Aspekt aller Wissenschaft: Es kommt darauf an, die richtigen Fragen zu stellen und gute Hypothesen zu formulieren. Nur wer die richtigen Fragen stellt, bekommt darauf auch brauchbare Antworten! Wer z. B. nicht auf die Idee kommt, danach zu fragen, ob das Verhältnis von Hüftbreite zu Beinlänge wichtig sein könnte, wird nie eine Antwort darauf erhalten und wird eine wichtige Einflussgröße übersehen.

Alle oben genannten Punkte, nämlich viele Prädiktoren, viele Figuren, viele Beurteilerpersonen und das richtige Gespür bei der Vorauswahl geeigneter Prädiktoren führen zusammen genommen zur außergewöhnlich präzisen Vorhersagekraft der Schönheitsformel.