Untersuchungsfeld, Operationalisierung der Hypothesen, Datenerhebung und Auswertungsverfahren

3.1  Methodisches Vorgehen und Auswahl der Stichprobe

Nach ausführlichem Literaturstudium (vgl. Gipser 1967 und Jüngling-Gipser 1969), der Formulierung der Fragestellung und der Hypothesenbildung ging es darum, eine empirische Untersuchung in Angriff zu nehmen. Es mußten Entscheidungen getroffen werden für die Art der Datengewinnung, ein bestimmtes Auswahlverfahren und verschiedene Auswertungsmethoden. Dazu war eine Reihe von Vorüberlegungen notwendig, da die Wahl einer Erhebungstechnik, nicht ohne Rücksicht auf vorhandene Methoden möglich ist und von daher auch die Mindestgröße der Untersuchungsgruppe bestimmt werden muß.
In der gegebenen Situation wurde für die Ermittlung von Daten als bestmögliche Methode das Interview gewählt, das gegenüber einer schriftlichen Befragung den Vorteil geringerer Ausfallquoten hat. Eine andere Erhebungstechnik als die Befragung war für dieses Forschungsvorhaben nicht anwendbar. Aufgrund der Überlegungen zur Operationalisierung der Hypothesen — die im Anschluß referiert werden — und der zu verwendenden Erhebungs- und Auswertungsmethoden wurde die Minimalgröße der Untersuchungsgruppe auf 100 festgelegt. Dabei waren mehrere Gesichtspunkte maßgeblich.

Die in der einschlägigen Literatur kontrovers geführte Diskussion um Festlegung von Stichprobengrößen läßt erkennen, daß hierzu konkrete Entscheidungshilfen schwer aufzustellen sind. Die aus statistischen Überlegungen resultierenden Aussagen zur Stichprobengröße sind zunächst nur auf einzelne Meßvariable gerichtet. Bei Setzung von bestimmten Vertrauensbereichen und einem erwünschten Sicherheitsgrad von Schlußfolgerungen lassen sich zur Untersuchung einzelner Variablen exakte Berechnungen zur Stichprobengröße durchführen (s. u.a. Schrader 1971, S. 136 f.). Der Anwendung dieser Kriterien auf komplexe Forschungsprobleme sind jedoch Grenzen gesetzt.

Entscheidend sind weiterhin die spezifischen Zielsetzungen und praktischen Bedingungen, unter denen eine Untersuchung durchgeführt wird. Da zu dem hier behandelten Problembereich bisher wenig empirisch geforscht worden ist, wurden Informationen erhoben, um den Bereich hinreichend beschreiben zu können und weiteren Fragestellungen Material zur Verfügung zu geben. Hierzu wie auch zur Überprüfung der komplexen Hypothesen war es notwendig, ein relativ breit angelegtes Befragungsinstrument zu entwerfen, dessen zeitaufwendige Vorgabe — bei den beschränkt zur Verfügung stehenden Mitteln — eine praktische Begrenzung der Befragungsgruppe bedingte. Zur Sicherung methodischer Kriterien wurde die Mindestgröße von 100 Personen für die Untersuchungsgruppe festgelegt; dies vor allem im Hinblick auf die Anwendung multivariater Verfahren (z.B. Faktorenanalyse), mit denen erst eine eingehende Analyse des Bedingungsgefüges abweichenden Verhaltens erfolgversprechend wird.

Mit Berücksichtigung eines gewissen Spielraums wählte ich als Stichprobengröße n = 125.

Die Überlegungen zur Auswahl der zu befragenden Mädchen geschahen aufgrund meiner Kenntnisse der Situation in Strafanstalten, Heimen und bei der Polizei. Bei einer Beschränkung der Befragung auf Mädchen, die wegen irgendwelcher Auffälligkeiten in Heime und Strafanstalten eingewiesen wurden, besteht die Gefahr einer Verzerrung der Untersuchungsergebnisse insofern, als die Entscheidungskriterien der sozialen Kontrollinstanzen als unkontrollierbare Variable in die Untersuchungsergebnisse mit eingehen.

Die Auswahl der zu befragenden delinquenten Mädchen aus der Gesamtzahl derer, die bei der Polizei auffällig geworden sind, ist mit folgender Annahme begründet. Da — wie ich zu Anfang dieser Arbeit ausgeführt habe — zu vermuten ist, daß der Anteil der Mädchen, die deviantes Verhalten zeigen, relativ gering ist, bestand die Möglichkeit, daß bei einer Zufallsstichprobe aus der Bevölkerung insgesamt so wenig Mädchen mit deviantem Verhalten ausfindig gemacht werden könnten, daß Zusammenhänge abweichenden Verhaltens mit anderen Variablen nicht signifikant nachzuweisen wären.
So wurden zunächst die Polizeibögen[1] aller Mädchen, die innerhalb eines Zeitraumes von zwei Jahren bei der Hamburger Polizei wegen irgendwelcher Delikte aufgefallen sind, ausgewertet. Aus dieser Gruppe von 1673 Mädchen wurden diejenigen der Geburtsjahrgänge 1948 bis 1952 ausgewählt, die innerhalb dieses Zeitraumes von zwei Jahren mindestens zweimal oder einmal fortgesetzt handelnd wegen Eigentumsdelikten — den häufigsten von Mädchen begangenen Delikten — der Polizei bekannt wurden.
Damit sollten Bagatellfälle und besondere Einzelfälle (z.B. Abtreibung)ausgeschlossen werden.
Aus dieser Gruppe von 389 Mädchen, von denen 272 Polizeiakten ausgewertet wurden, konnte eine Zufallsstichprobe von n = 112 Mädchen befragt werden.
Um die Relevanz der erhaltenen Ergebnisse überprüfen zu können, ist die Untersuchung einer nichtauffälligen Kontrollgruppe notwendig. Die Kontrollgruppe der nichtdelinquenten Mädchen stellt eine Zufallsstichprobe von Mädchen der gleichen Geburtsjahrgänge (1948 — 1952) dar, die das Statistische Landesamt Hamburg zusammenstellte. Hier konnten 125 Mädchen befragt werden; vorher war bei Polizei und Jugendamt überprüft worden, ob diese Mädchen auch wirklich mit keiner der vorhandenen sozialen Kontrollinstanzen in Berührung gekommen waren.
Somit besteht die Befragtengruppe insgesamt aus n = 237 Mädchen, die zwischen 1948 und 1952 geboren sind und alle in Hamburg leben.

3.2  Operationalisierung der Hypothesen

Strategie zur Hypothesenüberprüfung

Aus der Formulierung der Hypothesen geht hervor, daß zu ihrer Operationalisierung im wesentlichen drei Variablenkomplexe zu erfassen sind:
(1)  internalisierte Leitbilder/subjektive Situationsdefinitionen,
(2)  legitime Mittel/objektive Situationsbedingungen,
(3)  illegitime Mittel/abweichendes Verhalten.

Die einzelnen Variablen dazu werde ich jetzt erläutern, um anschließend den Zusammenhang von Variablenkomplex, Variablen und Fragen in einer Übersicht darzustellen.

Ad(1):
Zur Feststellung der ersten Komponente jeder der drei Hypothesen — der Art des internalisierten Leitbildes der weiblichen Rolle — dienen zwei Verfahren: einmal die Rangordnung vorgegebener Zielvorstellungen hinsichtlich ihrer Bevorzugung, zum anderen eine Untersuchung der Einstellungen zur weiblichen Rolle. Dem liegt die Überlegung zugrunde, daß internalisierte Leitbilder — wie wir sie gemäß These 2 als Verhaltensziele definiert haben — nicht allein anhand konkreter Zielvorstellungen ermittelt werden können.

Zielvorstellungen — in der Literatur häufig auch als Absichten oder (sekundäre) Bedürfnisse bezeichnet (vgl. Eyferth 1964, S. 349) — können definiert werden als hypothetische Zustände eines Individuums, die ein Verhalten oder dessen Wahrscheinlichkeit bedingen, das das Individuum einem Ziel näher bringt (vgl. Eyferth 1964, S. 347). Die Formulierung von Zielvorstellungen sagt noch nichts aus über deren Dauerhaftigkeit, wohingegen bei der Annahme von Leitbildern diese als konstant gekennzeichnet sind.

Einstellungen — auch Haltungen oder Attitüden genannt — können in diesem Zusammenhang definiert werden als die hypothetische Bereitschaft, konstant auf ein Bezugsobjekt zu reagieren (vgl. Eyferth 1964, S. 347). Von feststellbaren Einstellungen kann man demnach auf dauerhafte »Dispositionen« zurückschließen (vgl. Hofstätter 1963, S. 165).
Aus der Beziehung zwischen beiden Variablen — Zielvorstellungen und Einstellungen — kann auf das internalisierte Leitbild sowie auch auf Konflikte zwischen Leitbildern geschlossen werden.

Ad(2):
Wenn die objektiven Situationsbedingungen in Widerspruch zu den subjektiven Situationsdefinitionen stehen, so heißt dies, daß keine legitimen Mittel zur Realisierung internalisierter Verhaltensziele zur Verfügung stehen. Der Begriff »Mittel« war in Abschnitt 2.1 sowohl auf die habituelle Ebene (Handlungsfähigkeiten als Ergebnis spezifischer Sozialisationsprozesse) als auch auf die sozialstrukturelle Ebene bezogen worden. Daher müssen für die zweite Komponente der drei Hypothesen einmal Sozialisationsbedingungen und zum anderen sozialstrukturelle Bedingungen ermittelt werden.
Die Erfassung objektiver Situationsbedingungen ist insofern problematisch, als auf sie bei einer Befragung von Personen nur über die verbalen Aussagen der Befragten zurückgeschlossen werden kann. Hier wird versucht, aus den Fragen nach verschiedenen Einzelbedingungen im Hinblick auf relevante Situationsbereiche wie Herkunftsfamilie, Beruf und Partner — unter Einbeziehung wichtiger Ergebnisse aus anderen Untersuchungen — die objektive Situation von Mädchen zu veranschaulichen.
Aus den erhobenen diesbezüglichen Daten werden verschiedene Indices entwickelt, die Hinweise auf fehlende legitime Mittel erkennen lassen können.

Ad (3):
Die dritte Komponente der Hypothesen bezieht sich jeweils auf die Verfügbarkeit illegitimer Mittel. Hierzu wird einmal die Bewertung verschiedener devianter Akte ermittelt, zum anderen wird nach dem abweichenden Verhalten selbst gefragt und dies auch mit Informationen von der Polizei verglichen. Anhand der Fragen zur Devianz wird ermittelt, ob sich Hinweise auf Arten abweichenden Verhaltens im Sinne unserer Hypothesen — rollenstützend, rollensymbolisierend, kompensatorisch — ergeben.

Fragebogenkonstruktion

Für unser Forschungsziel erschien das standardisierte Interview wegen seiner Zuverlässigkeit und der Vergleichbarkeit der Befragungsergebnisse als das geeignetste Instrument. Es wurde ein Fragebogen mit offenen und geschlossenen Fragen entwickelt (s. Anhang); er umfaßt sechs Fragebereiche, die auch in dieser Reihenfolge den zu befragenden Mädchen vorgegeben wurden:
Teil 1: Einstellungsfragen,
Teil 2: Zielvorstellungen,
Teil 3: Fragen zur sozialen Situation,
Teil 4: Beurteilung von Delikten,
Teil 5: Delinquenzfragebogen,
Teil 6: Polaritätsprofile.

Teil 1 des Fragebogens enthält 63 stereotype Behauptungen zur Beurteilung der weiblichen Rolle, auf die mit Zustimmung oder Ablehnung reagiert werden konnte. Die Bevorzugung der dichotomen Antwortvorgabe (»stimmt" — »stimmt nicht") hat vor allem zwei Gründe: 1. Vermeidung der Kategorie »unentschieden« — die Befragten sollten sich für jeweils eine Alternative entscheiden; 2. differenziertere Auswertungsmöglichkeiten. Die einzelnen Fragen wurden so formuliert, daß eine gleiche Tendenz einmal mit Zustimmung, dann wieder mit Ablehnung bestätigt wird, um auf diese Weise eine Verzerrung der Ergebnisse durch stereotype »Ja-Sager« zu vermeiden. Von den ursprünglich 80 Fragen wurden nach dem Pretest (s. 3.3) 17 wegen ihrer nicht eindeutigen Verständlichkeit herausgenommen.

Zusätzlich wurden in diesem Teil die 30 Indikatoren für die Variablen »Selbstkritik« und »Soziale Einstellung« aus dem PIT von Mittenecker und Toman (1951) eingefügt, womit Lügetendenzen festgestellt werden sollten.

Teil 2 des Fragebogens umfaßt 12 Sätze, die Zielvorstellungen enthalten. Sie wurden nach dem Pretest, in dem die Befragten direkt nach ihren Zielvorstellungen gefragt worden waren, aufgrund der häufigsten Aussagen formuliert. Die 12 auf Kärtchen vorgegebenen Sätze sollten je nach ihrer Bevorzugung in eine Rangreihe gebracht werden.
Teil 3 des Fragebogens enthält 101 zum größten Teil offene Fragen, die sich auf die soziale Situation der Befragten bezüglich Schule, Ausbildung und Beruf, anschließend auf den Partner und schließlich auf die Elternfamilie beziehen. Hier wurden nach dem Pretest lediglich einige Fragen umformuliert.
Teil 4 umfaßt 12 Sätze, die die häufigsten Arten devianten Verhaltens von Mädchen und Jungen (jeweils 6) enthalten. Sie sollten anhand von Kärtchen je nach ihrer negativen Bewertung in eine Rangreihe gebracht werden. Die ursprünglich vorgesehene Methode des Paarvergleichs erwies sich im Pretest als zu ermüdend für die Befragten.
Teil 5 erfragt das abweichende Verhalten. Hierzu wurden analog dem von Quensel verwandten Delinquenzfragebogen (Quensel 1969, 1970) 10 von Mädchen häufig begangene abweichende Verhaltensweisen in gleicher Weise erfragt. Nach den Erfahrungen im Pretest erschien es sinnvoll, diesen Teil des Fragebogens von den Mädchen selbst ausfüllen zu lassen (währenddessen der Interviewer die Rangreihen — Anordnung der Kärtchen — in den Erhebungsbogen übertragen konnte), was weniger mit der Erwartung ehrlicherer Antworten als mit dem Unbehagen der Interviewer, diese Fragen selbst zu stellen, begründet ist.

Neben den generellen Zweifeln, auf diese Weise zu Daten über abweichendes Verhalten zu gelangen, die sich anhand der Ergebnisse ergaben (s. 4.4), stellten sich bereits in der Datenerhebungsphase Zweifel hinsichtlich der Formulierung heraus. Eine ganze Reihe von Mädchen sprach zu den Interviewern über ihr abweichendes Verhalten und erzählte Einzelheiten. Da dies nicht immer vermerkt wurde, waren hinterher allgemeine Auswertungen diesbezüglich nicht möglich. Es ist jedoch daraus zu entnehmen, daß insgesamt die Fragen wahrscheinlich zu vorsichtig (»weggenommen« für Diebstahl) und ungenau formuliert waren (vgl. zu diesem Problem auch Schwenkel 1973, S. 91 f.). Dies läßt einen in einer solchen Untersuchung recht unerwünschten Effekt vermuten: Je vorsichtiger und ungenauer ein Delikt umschrieben wird, um so eher entsteht bei dem Befragten der Eindruck einer nicht vorurteilsfreien, negativen Bewertung des erfragten Tatbestandes durch den Fragenden — zumal dann, wenn es sich um ein ohnehin sozial negativ bewertetes Verhalten handelt — und er ist um so eher geneigt, im Sinne einer sozialen Wünschbarkeit zu antworten.

Teil 6 des Fragebogens enthält Polaritätsprofile zur Ermittlung von Selbstbild und Selbstideal im Vergleich zum Bild von Mutter, Vater, Partner, idealem Mann. Es wurde das von Hofstätter (1963) entwickelte Profil benutzt.

Die Anordnung dieser Fragebereiche in der angegebenen Reihenfolge erwies sich als sehr vorteilhaft: Während des Interviews anwesende Partner oder Eltern zogen sich meist nach der Hälfte der Einstellungsfragen zurück, so daß ihre Anwesenheit die Befragten bei der Beantwortung der Fragen zur sozialen Situation nicht mehr beeinflussen konnte; zum anderen traten durch die eingeschobenen Aktivitäten der Befragten (Kärtchen ordnen, selbst ankreuzen) keine Ermüdungserscheinungen bei ihnen auf, selbst wenn die durchschnittliche Befragungsdauer von 80 Minuten gelegentlich überschritten wurde.

3.3  Pretest und Befragung

Nach dem ersten Fragebogenentwurf erfolgte im Herbst 1969 eine intensive Schulung der zehn Interviewer (Soziologie- und Psychologiestudenten/innen) bezüglich Erläuterung der Fragestellung des Fragebogens, der Fragetechnik und Verhaltensregeln in Interviewsituationen. Im Winter 1969 wurden von jedem Interviewer zwei Probeinterviews durchgeführt,, die auf Tonband aufgenommen und anschließend in der Interviewergruppe besprochen wurden. So umfaßt der Pretest 20 Interviews; befragt wurden bei der Polizei registrierte Mädchen. Die Ergebnisse des Pretests schlugen sich zum einen in der Veränderung des Fragebogens nieder, zum anderen konnten anhand der Tonbandaufnahmen die Interviewer auf Fehler in der Befragungstechnik aufmerksam gemacht werden.
Die endgültige Befragung begann im Februar 1970. Jedes zu befragende Mädchen wurde jeweils eine Woche vor dem beabsichtigten Interview vom Interviewer angeschrieben. Dies erwies sich als sehr nützlich für die Kleinhaltung der Verweigerungsquote (Kontrollgruppe 8%, Auffälligengruppe 10 %), da so nachweislich im Vorwege schon Mißtrauen abgebaut worden war; die meisten Mädchen zeigten sich ohnehin sehr interessiert an der Fragestellung, die ihnen als »Untersuchung von Verhaltensweisen und Einstellungen von modernen jungen Mädchen« vorgestellt wurde. Die Verweigerungsquote wurde auch dadurch verringert, daß bei erstmaligem Verweigern — dies geschah in der Mehrzahl der Fälle nicht durch die Mädchen selbst, sondern durch ihre Eltern, in einigen Fällen durch den Partner — der Fall einem anderen Interviewer übergeben wurde, der dann auch in drei Viertel solcher Fälle erfolgreich war.

Probleme, die in Zusammenhang mit der Befragung auftauchten, wurden regelmäßig in der Interviewergruppe besprochen — in der Anfangsphase wöchentlich. Die Interviewer wußten nicht, ob sie ein Mädchen aus der Auffälligengruppe oder der Kontrollgruppe zu befragen hatten.
Die letzten Interviews wurden im Mai 1971 durchgeführt. Die Länge der Erhebungsphase läßt sich vor allem auf zwei Ursachen zurückführen: Nach zwei Monaten trat eine gewisse Müdigkeit der Interviewer auf; 4 Interviewer konnten nicht mehr mitmachen. Außerdem war insgesamt die Kontaktaufnahme zu den zu Befragenden sehr mühselig, da die meisten Mädchen kaum zuhause anzutreffen waren — sie waren entweder noch zur Arbeit oder schon wieder ausgegangen — und da eine Reihe von ihnen kurzfristig umgezogen war. So konnten nur 30 % der Befragten auf Anhieb interviewt werden, bei allen anderen ging eine Reihe von Fehlbesuchen voraus.
Für Ausfälle (endgültige Verweigerung, Unauffindbarkeit, Wegzug aus Hamburg) waren für jede Gruppe 25 Ersatzadressen vorgesehen. Bei der Auffälligengruppe reichten sie nicht aus, da mit dieser Stichprobe einige Mädchen erfaßt worden waren, die zwar in Hamburg auffällig, jedoch nicht dort wohnhaft waren. So konnten hier nur 112 Mädchen befragt werden gegenüber 125 Mädchen der Kontrollgruppe.

3.4  Auswertungsverfahren

Der folgende Abschnitt steht unter der Frage: Was bedeutet das mit den genannten Methoden erhobene Material über die vielen Einzelinformationen hinaus? Wie kann der Untersuchungsgegenstand hinreichend und doch übersichtlich beschrieben werden? Welche Zusammenhänge lassen sich zwischen den unterschiedlichen Merkmalen auf den verschiedenen Ebenen ermitteln? Die im Forschungsprozeß verwendeten Methoden und Techniken zur Beantwortung dieser Fragen können hier nur soweit kurz umrissen werden, als es zum Verständnis der zu berichtenden Ergebnisse und Schlußfolgerungen notwendig erscheint.

Bereits in der Planungsphase mußte ich feststellen, was auch Hartmann (1970, S. 152 f.) bedauernd berichtet, daß vor allem in der deutschsprachigen Literatur die Methoden und Techniken der Datenerhebung ausführlich, die der Auswertung und Interpretation aber nur unzulänglich dargestellt sind. Besonders gilt dies für solche multivariate Methoden, die in der Lage sind, Daten geringerer Qualität zu analysieren.[2]
Als Anlage zur elektronischen Datenverarbeitung (EDV) stand zu Beginn der Auswertungsphase die TR 4 des Rechenzentrums der Universität Hamburg zur Verfügung; ab Frühjahr 1973 dann die TR 440. Erhobene Daten und gespeicherte Zwischenergebnisse ergaben einen Endbestand von 17 Lochkarten pro Fall. Die Auswertungsphase erstreckte sich von 1971 bis 1973.
Bei den Auswertungsverfahren ist zunächst auszugehen von der Unterscheidung zwischen der univariaten Analyse, die Aussagen über Häufigkeitsverteilungen bestimmter Merkmalsausprägungen innerhalb der Befragtengruppe ermöglicht, und der bivariaten Analyse, die uns Auskunft gibt über die Zusammenhänge zwischen je zwei Merkmalen oder Variablen und die nach wie vor eine Hauptstütze der Datenanalyse ist.

Um sich vor logischen Fehlschlüssen aus der Beziehung zweier Variablen z.B. A und B zu sichern, ist es angebracht, jedes der beiden Merkmale mit einer weiteren »Test«-Variablen in Verbindung zu bringen. Die Vielzahl möglicher Beziehungen zwischen dieser Testvariablen und den Variablen A und B läßt sich auf ein System dichotomer Schlußfolgerungen zurückführen. Wenn sich die Beziehungen zwischen A und B innerhalb der einzelnen Ausprägungen der konstant gehaltenen Testvariablen nicht verändern, so hat die Testvariable keinen Einfluß auf die Beziehung zwischen A und B. Ein solcher Einfluß wird der Testvariablen jedoch zugeschrieben, wenn sich das Verhältnis A und B dabei verändert. Zu den möglichen Folgerungen aus diesem oder jenem Fall, auch in bezug auf mono- und multikausale Abhängigkeiten, sei auf die übersichtliche Darstellung bei Schrader (1971, S. 208 ff.) verwiesen. Diese Kriterien galt es bei der Interpretation der bivariaten Zusammenhänge jeweils zu beachten.

Wenn eben von »Zusammenhängen« die Rede war, so war dies ein allgemeiner Ausdruck, der je nach Datenqualität der Variablen in unterschiedlichen Koeffizienten realisiert ist. Liegen Nominalskalen vor oder ist der Nachweis höherer Skalenqualität schwer zu erbringen, so handelt es sich um Chi2 (und daraus abgeleitete Koeffizienten, wie z.B. C, Kontingenzkoeffizient). Der Chi2Test gibt einen Hinweis darauf, ob eine Verteilung zufällig zustande gekommen ist, bzw. wie groß die Wahrscheinlichkeit dieses Zufalls ist. Von einem signifikanten Zusammenhang zwischen zwei Merkmalen wird hier dann gesprochen, wenn die Zufallswahrscheinlichkeit p = 0.05 und kleiner ist (von einer »Tendenz« wird gesprochen, wenn die Zufallswahrscheinlichkeit zwischen 0.10 und 0.05 liegt).[3]

Der dargestellte Fall der Einführung von einzelnen Testvariablen — die erste Stufe eines multivariaten Vorgehens —, läßt sich verallgemeinern, indem man drei oder mehr Variable simultan aufeinander bezieht. Bei den jetzt betrachteten Nominalskalen erhebt man zunächst die Häufigkeiten, mit der in einer gegebenen Stichprobe alle möglichen Kombinationen aller Merkmalsausprägungen der beteiligten Variablen besetzt sind. Am Beispiel dreier Variablen mit k, 1 und m Ausprägungen (Stufen) ergibt sich ein Quader der Größe k mal 1 mal m, in dessen Zellen sich die Häufigkeiten der Stichprobe in spezifischer Weise verteilen. Um die Zufälligkeit solcher Verteilungen in den Zellen zu testen, hat Sutcliffe (1957) ein Verfahren der allgemeinen Chi-Zerlegung geliefert, das die Effekte aller möglichen Zweier-, Dreier- usw. Effekte ermittelt und auf ihre statistische Signifikanz überprüft. Formal einer Varianz-Analyse ähnlich, die jedoch Intervalldaten verlangt, ermöglicht dieses Verfahren somit die Prüfung der wechselseitigen Bezüge zwischen Variablen und der Kombination von Variablen. Es wurde zur endgültigen Überprüfung der Hypothesen verwandt.[4]

Dieses recht brauchbare Instrument findet jedoch seine Grenze bei kleinen Stichproben im Verhältnis zur Anzahl der untersuchten Variablen, da bei wachsender Zahl von Variablen, sowie bei steigender Anzahl von Merkmalsausprägungen pro Variable die Zellenhäufigkeiten schnell sinken, und bei schwacher Besetzung einzelner Zellen (kleiner als 2) das Chi2 nur eingeschränkte Aussagekraft behält.

Die Faktorenanalyse (vgl. Überla 1971) reduziert die Vielfalt der Variablen eines bestimmten Untersuchungsbereichs und deren wechselseitige Bezüge auf eine möglichst geringe Anzahl von Faktoren, mit denen sich die Beobachtungen zumindest überschaubar beschreiben lassen und die günstigenfalls einen Rückschluß auf nicht beobachtete oder nicht beobachtbare Einflußgrößen ermöglichen. Zur Lösung der mathematischen Probleme ist eine Reihe unterschiedlicher Modelle und Verfahren entwickelt worden (s. Pawlik 1968; Uberla 1971), von denen in der vorliegenden Untersuchung die geläufigsten zur Anwendung kamen.

Zur Extraktion von Faktoren wurde die Hauptachsenmethode verwendet, die in der Regel den Zugang zu einer elektronischen Rechenanlage voraussetzt.[5] In die Hauptdiagonale der zu analysierenden Korrelationsmatrizen wurden Werte von 1 (Hauptkomponentenmodell) eingesetzt. Zur Bestimmung der Anzahl der zu interpretierenden Faktoren wurde ein kombiniertes Kriterium benutzt:

  • a) Verteilung der Varianzanteile der einzelnen Faktoren; mit möglichst wenigen Faktoren soll ein möglichst großer Anteil der Gesamtvarianz repräsentiert werden
  • b) Anzahl der Eigenwerte größer als Eins
  • c) Interpretierbarkeit.

Vor Interpretation der errechneten Faktorenstrukturen wurde in jedem Falle nach der Varimax-Methode rotiert, mit dem Ziel, das Koordinatensystem so zu lokalisieren, daß es die Variablen möglichst einfach beschreibt.

Die Anwendung faktorenanalytischer Verfahren setzt die Berechnung von Korrelationskoeffizienten voraus, die streng genommen nur zwischen Variablen mit Intervallskalen-Qualität berechnet werden dürfen. Bei den erhobenen Daten kann man das nicht immer mit Sicherheit annehmen. Trotzdem ist es, einer weitgeübten Praxis entsprechend, gerechtfertigt, mit solchen Daten zu arbeiten, wenn man annehmen kann, daß die Stufen der Variablen ordinal angeordnet sind. Man kann eine Ordinalskala als die beste Annäherung an eine Intervallskala ansehen.

Durch Modelluntersuchungen (Überla, S. 284 ff.) wurde nachgewiesen, daß die Faktorenanalyse von Alternativdaten zulässig ist; dadurch wurde es möglich, Fragen der Untersuchung, z.B. die Einstellungsitems alternativ zu formulieren.

In der üblichen R-Technik werden Gruppen von Variablen isoliert, die enger zusammengehören und einen Faktor definieren. Die erhaltene Faktorenstruktur läßt jedoch nicht zu, wie bisweilen fälschlicherweise angenommen, direkt auf Gruppen von Personen zu schließen (vgl. auch Abschnitt 6.1, wo exemplarisch die Verwendung der Faktorenanalyse dargestellt wird).

Unter der Rubrik »Cluster-Analysen« wurden Verfahren entwickelt, die danach fragen, ob und in welchen Gruppen Variablen-/Individuenpunkte dichter beieinander liegen als in der Gesamtverteilung. Diese Verfahren sehen, anders als die Faktorenanalyse,von der Reduktion auf zugrundeliegende Größen ab und bewegen sich auf der Ebene der Beobachtung, auf der sie Gruppen von Beobachtungspunkten zusammenfassen (s.a. Überla 1971, S. 307, 319 ff.).

Auf der Suche nach bedeutsamen Untergruppierungen der Befragtenstichprobe wurde in der vorliegenden Arbeit versucht, beide Verfahren, die Faktorenanalyse und die Cluster-Analyse, zu kombinieren. Dies geschah in drei Schritten.
(1)  Im ersten Schritt werden die Variablen, die einen bestimmten inhaltlichen Bereich darstellen, faktorenanalysiert; die einer Varimax-Rotation folgende Berechnung der Faktorwerte ergibt die individuellen Werte jeder befragten Person in den ermittelten Faktoren. Die Faktorwerte lassen sich vorstellen als die durch Punkte im Faktorenraum repräsentierten Individuen.
(2)  Zwischen diesen Punkten im Faktorenraum werden im zweiten Schritt alle paarweisen Distanzen berechnet. Bei den Individuen resultiert daraus eine Dreiecksmatrix mit allen (R) Paarkombinationen, ähnlich einer Korrelationsmatrix. Ein Zellenwert djj dieser Matrix gibt an, wie weit der Punkt i vom Punkt j entfernt ist; Maßfunktion ist die normale euklidische Distanz. Mit dieser Distanz zwischen Punkten im Faktorenraum haben wir ein Ähnlichkeitsmaß in der Hand, das im weiteren die Verwendung einer ClusterAnalyse zuläßt. Die Ähnlichkeit ist hierbei eine umgekehrte Funktion der Distanz: je größer der Abstand zwischen zwei Punkten, um so geringer ihre Ähnlichkeit.
(3) Im dritten Schritt wird die Matrix der Distanzen daraufhin analysiert, ob und in welcher Weise die Punkte im Faktorenraum (d.h. die Individuen) Cluster bilden.

Aus den wenigen zur Verfügung stehenden Clustertechniken (nicht immer wird in der Literatur der Nachweis von Auswertungsprogrammen mitgeliefert) wurde ein Verfahren ausgewählt, das ursprünglich im Rahmen der Taxometrie — einer mathematisch und statistisch orientierten Forschungsrichtung vor allem in Geologie und Biologie, mit dem Ziel der Gruppierung von Organismen zu höheren Einheiten oder Typen — entwickelt wurde.

Die unter dem Namen »Dendrograph« publizierte Methode (McCammon 1968) besteht aus einem Algorithmus zur Bildung hierarchischer Cluster und einem Verfahren zur graphischen Darstellung der Zusammenhänge.[6] Der Algorithmus faßt schrittweise solche Variablen oder Individuen — kurz Objekte — zusammen, die auf der jeweiligen Stufe die größte Ähnlichkeit (gleich geringster Distanz) zueinander haben. Auf der ersten Stufe des Clusterprozesses werden jeweils die zwei Objekte zu einer Gruppe zusammengefaßt, deren Distanz am geringsten ist. Als Maß der Ähnlichkeit der Elemente innerhalb einer entstandenen Gruppe wird der Mittelwert aller paarweisen Distanzen innerhalb dieses Clusters berechnet. Auf jeder folgenden Stufe werden die Gruppen oder/und Einzelobjekte zusammengefaßt, für die dieser Wert, die mittlere paarweise Distanz, ein Minimum ergibt. Im Endergebnis sind alle Objekte auf den verschiedenen Ebenen miteinander in Beziehung gebracht. Die graphische Darstellung macht den Vorgang und das Ergebnis unmittelbar anschaulich (Abbildung 2).

In der durch einen Plotter hergestellten Graphik bedeutet die Ordinate, in Einzelheiten des benutzten Ähnlichkeitsmaßes, die Enge des Zusammenhangs innerhalb von Clustern. Auf der Abszisse sind die Objekte (hier: Personen) abgetragen — in der Folge, in der sie bestimmten Clustern zugehören.

Die Ähnlichkeit zweier nebeneinanderliegender Einzelobjekte wird angezeigt durch die Höhe, in der der sie verbindende waagerechte Strich liegt (abzulesen an der Ordinate). Der Abstand auf der Abszisse drückt in diesem Fall das gleiche Maß aus, verändert um den Skalenfaktor der Abszisse. Dieses Cluster hängt mit anderen Clustern oder Einzelobjekten wiederum auf der Stufe zusammen, die durch den sie verbindenden Strich gekennzeichnet ist. Der zugehörige Wert auf der Ordinate ist der Mittelwert aller paarweisen Distanzen der diesem neuentstandenen Cluster zugehörigen Elemente. Die Enge des Zusammenhangs zwischen den zwei Teilen, die das neue Cluster konstituieren, wird auf der Abszisse dargestellt, und zwar durch den Abstand der einander am nächsten liegenden Elemente der beiden Teile. Dieser Abstand wird berechnet als Mittelwert aller paarweisen Distanzen, die sich aus der Kombination eines jeden Elementes des ersten Teils mit jedem Element des zweiten Teils bilden lassen. In der beschriebenen Weise wird so der Clusterprozeß fortgesetzt, bis alle untersuchten Objekte — auf einer Ebene relativ geringer Ähnlichkeit — zu einem Gesamtcluster vereinigt sind.

Individuen mit ähnlicher Merkmals- oder Variablenausprägung lassen sich anhand der berechneten Werte für Ähnlichkeit innerhalb und zwischen Gruppen- einfacher und anschaulicher anhand der graphischen Darstellung — zu Gruppen zusammenfassen, Mitglieder innerhalb einer Gruppe sind sich also bezüglich bestimmter Merkmale ähnlicher als die Gruppen untereinander.
Der Dendrograph fand Anwendung bei der Gruppierung der befragten Mädchen

  • anhand ihrer Einstellungen (kombiniert mit einer Faktorenanalyse),
  • anhand ihrer Zielvorstellungen (wobei direkt der Rangkorrelationskoeffizient als Ähnlichkeitsmaß benutzt werden konnte),
  • anhand ihrer Beurteilung von Delikten (ebenfalls wurden Rangkorrelationskoeffizienten als Ähnlichkeitsmaß verwandt),
  • anhand ihrer selbstberichteten Delinquenz (kombiniert mit einer Faktorenanalyse),
  • anhand ihrer tatsächlichen Delinquenz — nur bei der Auffälligengruppe möglich (kombiniert mit einer Faktorenanalyse).

 

Die Faktorenanalyse wurde immer dann vor der Berechnung des Dendrographen verwandt, wenn die Erfassung bestimmter Tatbestände (Einstellungen, Delinquenz) aufgrund ihrer Komplexität zur zuverlässigeren Messung eine Vielfalt von Indikatoren benötigte.
Auf die Daten zur sozialen Situation konnte aufgrund ihrer Skalenqualität (Nominalskala) der Dendrograph nicht angewandt werden; hier wurden additive Indices gebildet.

Tabellarische Übersicht:

Problem

1. Einstellungsfragen

Methode

Faktorenanalyse zur Ermittlung der Merkmalsstruktur;
Dendrograph zur Ermittlung von Personengruppen — anhand ihrer Ausprägung auf den Faktoren — ähnlicher Einstellungen

2. Zielvorstellungen Rangkorrelationen: Dendrograph zur Ermittlung von Personengruppen ähnlicher Zielvorstellungen
3. Fragen zur sozialen Situation Uni- und bivariate Analyse (chi2Test); Bildung additiver Indices bezüglich Sozialisationsdefizite, Unzufriedenheit im Beruf, unbefriedigende Partnerbeziehung, traditionelle bzw. emanzipatorische Einstellung
4. Bewertung abweichenden Verhaltens Rangkorrelationen; Dendrograph zur Ermittlung von Personengruppen ähnlicher Deliktsbewertung
5.  Delinquenz Faktorenanalyse zur Ermittlung der Merkmalsstruktur; Dendrograph zur Ermittlung von Personengruppen — anhand ihrer Ausprägung auf den Faktoren — ähnlichen abweichenden Verhaltens

6.  Polaritätsprofile:

Selbstbild - Selbstideal, Partner — idealer Mann, Vater — Mutter

Faktorenanalyse; Einordnung in den »semantischen Raum« / Vergleich mit einer repräsentativen Stichprobe
7.  Hypothesenüberprüfung Feststellung der Beziehungen mehrerer Variablen untereinander (Sutcliffe)