Hvordan gjennomføre faktoranalyse i statistikk. Faktoranalyse av profitt

Faktoranalyse er en statistisk metode som brukes ved behandling av store mengder eksperimentelle data. Målene med faktoranalyse er: å redusere antall variabler (datareduksjon) og bestemme strukturen av sammenhenger mellom variabler, d.v.s. klassifisering av variabler, så faktoranalyse brukes som en datareduksjonsmetode eller som en strukturell klassifiseringsmetode.

En viktig forskjell mellom faktoranalyse og alle metodene beskrevet ovenfor er at den ikke kan brukes til å behandle primære, eller, som de sier, "rå" eksperimentelle data, dvs. hentet direkte fra eksamen av emner. Materialet for faktoranalyse er korrelasjoner, eller mer presist, Pearson-korrelasjonskoeffisienter, som beregnes mellom variablene (det vil si psykologiske egenskaper) som inngår i undersøkelsen. Med andre ord blir korrelasjonsmatriser, eller, som de ellers kalles, interkorrelasjonsmatriser, utsatt for faktoranalyse. Kolonne- og radnavnene i disse matrisene er de samme fordi de representerer en liste over variabler som er inkludert i analysen. Av denne grunn er interkorrelasjonsmatriser alltid kvadratiske, dvs. antall rader i dem er lik antall kolonner, og symmetrisk, dvs. symmetriske steder i forhold til hoveddiagonalen har samme korrelasjonskoeffisienter.

Hovedkonseptet med faktoranalyse er faktor. Dette er en kunstig statistisk indikator som oppstår som et resultat av spesielle transformasjoner av tabellen med korrelasjonskoeffisienter mellom de studerte psykologiske egenskapene, eller interkorrelasjonsmatrisen. Prosedyren for å trekke ut faktorer fra en interkorrelasjonsmatrise kalles matrisefaktorisering. Som et resultat av faktorisering kan et annet antall faktorer trekkes ut fra korrelasjonsmatrisen, opp til et antall lik antall opprinnelige variabler. Imidlertid er faktorene identifisert som et resultat av faktorisering, som regel, ulik i betydning. (5)

Ved hjelp av identifiserte faktorer forklares den gjensidige avhengigheten av psykologiske fenomener. (7)

Oftest, som et resultat av faktoranalyse, bestemmes ikke én, men flere faktorer som forskjellig forklarer matrisen av interkorrelasjoner av variabler. I dette tilfellet er faktorer delt inn i generelle, generelle og individuelle. Generelle faktorer er de som alle faktorbelastninger avviker vesentlig fra null (nullbelastning indikerer at denne variabelen på ingen måte er forbundet med de andre og ikke har noen innflytelse på dem i livet). Generelt er faktorer der noen av faktorbelastningene er forskjellige fra null. Enkeltfaktorer er faktorer der kun én av belastningene skiller seg vesentlig fra null. (7)

Faktoranalyse kan være aktuelt dersom følgende kriterier er oppfylt.

  • 1. Det er umulig å faktorisere kvalitative data innhentet på en skala av navn, for eksempel som hårfarge (svart / kastanje / rød), etc.
  • 2. Alle variabler må være uavhengige, og deres fordeling må nærme seg normalen.
  • 3. Relasjoner mellom variabler bør være tilnærmet lineære, eller i det minste ikke tydelig krumlinjede.
  • 4. Den initiale korrelasjonsmatrisen bør inneholde flere korrelasjoner med en modul høyere enn 0,3. Ellers er det ganske vanskelig å trekke ut noen faktorer fra matrisen.
  • 5. Utvalget av fag skal være stort nok. Ekspertanbefalingene varierer. Det strengeste synspunktet anbefaler ikke å bruke faktoranalyse hvis antallet forsøkspersoner er mindre enn 100, siden standard korrelasjonsfeil i dette tilfellet vil være for store.

Men hvis faktorene er godt definert (for eksempel med belastninger på 0,7 i stedet for 0,3), trenger eksperimentatoren en mindre prøve for å isolere dem. I tillegg, hvis dataene som er oppnådd er kjent for å være svært pålitelige (for eksempel brukes gyldige tester), kan data analyseres på et mindre antall emner. (5).

Hvis verdiene til den predikerte parameteren ikke avhenger av tid, men av noen andre faktorer, brukes faktoriell statistisk analyse. Vanligvis, for dette formålet, ved bruk av en PC, velges en tilnærmet funksjon av en eller flere variabler ved bruk av kjent statistikk, som fungerer som en modell for å utvikle en prognose. La oss se på denne prosedyren med et eksempel.

Eksempel.

En gründer selger iskrem i nærheten av Politekhnicheskaya t-banestasjon. Han må legge inn en bestilling for neste uke, fordelt på dag. Hver morgen leveres den bestilte varemengden til deres salgssteder. Hvis ordren (prognosen) er feil, på slutten av dagen kan det hende at det ikke er nok iskrem, så er det tap av fortjeneste, eller en del av den vil forbli usolgt og da vil det være problemer med å lagre den til i morgen tidlig . Det er nødvendig å identifisere faktorene som bestemmer salget, samle inn salgsstatistikk og verdiene av disse faktorene, og deretter utvikle en prognose for iskremsalg for neste uke. Det antas at dette skjer midt på sommeren.

Løsning.

Blant faktorene som påvirker iskremsalget på høysommeren, er de to mest betydningsfulle valgt ut: lufttemperatur og ukedag. Merk at den andre faktoren er logisk, noe som skaper ytterligere problemer med å løse. Statistikken samlet over tre uker er presentert i tabell 3.1. Vi vil anta at når salgsvolumet er varslet, er værmeldingen (temperatur) for neste uke kjent.

Det er flere måter å løse dette problemet på. Tenk først på den vanligste klassiske metoden.

For å eliminere innflytelsen på salgets avhengighet av temperaturen til den logiske variabelen - ukedag, beregner vi reduksjonskoeffisientene for hver ukedag til gjennomsnittlig daglig salg (tabell 3.2). Deretter, ved å bruke disse koeffisientene, beregner vi de første salgsdataene på nytt (vi får det faktiske salget vist i tabell 3.3

og i fig. 3.2). Tilnærmingen til denne avhengigheten er rett, beskrevet av ligningen 0=4,1 t 0 +23,76. gir svært gode resultater (korrelasjonskoeffisient 0,9). Tabell 3.3 viser også resultatene av salgsberegninger basert på det resulterende lineære trendforholdet. Ved å bruke samme modell kan du forutsi det justerte salget for neste uke, og deretter, ved hjelp av reduksjonskoeffisienter, lese dem om til individuelle prognoser for hver ukedag (tabell 3.4).



Verdiene av koeffisientene a og b for lineær tilnærming kan beregnes både på en PC og manuelt ved å bruke formlene

Et forsøk på kun å relatere salgsvolumet til temperatur, og ignorere ukedagens innflytelse på dem, er uholdbart. Dette fremgår tydelig av grafen (Fig. 3.1) og verdien av korrelasjonskoeffisienten.

En annen, mindre nøyaktig tilnærming til løsningen er å kombinere data fra mandag til torsdag i en enkelt statistisk matrise uten å dele den inn i ukedager. Gjør det samme med dataene for fredag, lørdag og søndag. For hver av matrisene, velg en tilnærmet kurve for avhengigheten av salgsvolumer av temperatur og lag en prognose basert på den.

Hvis det er mer statistikk tilgjengelig enn nå, kan denne prosedyren utføres separat for hver ukedag, noe som vil forenkle og gjøre løsningen på dette problemet mer nøyaktig. Det eneste dårlige er at etter hvert som statistikkvolumet vokser, vil prognosen i økende grad bli påvirket av sesongfaktoren, som vi så langt har ignorert.

Jae-On Kim, Charles W. Mueller. Faktoranalyse: Statistiske metoder og praktiske problemstillinger (Eleventh Printing, 1986).

FORORD

Dette arbeidet er en fortsettelse av boken «Introduction to Factor Analysis: What It Is and How to Use It» av Jae-On Kim og Charles W. Mueller, også utgitt i serien Quantitative Applications in the Social Sciences. Sistnevnte er en introduksjon til metoden for faktoranalyse; den svarer på leserens spørsmål: "Hva brukes faktoranalyse til?" og "Hvilke forutsetninger gjøres ved bruk av denne metoden?", men tar ikke for seg anvendelsen av faktoranalyse på spesifikke data. Faktoranalyse: Statistiske metoder og praktiske problemstillinger diskuterer mer detaljert spesifikke eksempler på dataanalyse, ulike typer faktoranalyser og situasjoner der bruken er mest nyttig. Skillet mellom bekreftende og utforskende faktoranalyse diskuteres her mer detaljert enn i Introduksjon til faktoranalyse. For eksempel vurderes ulike kriterier for faktorrotasjon. Spesielt nyttig er diskusjonen om de ulike formene for skrårotasjoner og tolkningen av koeffisienter i faktoranalyse. Joe. Kim og C.W. Mueller reiser også spørsmålet om antall faktorer som opptrer i eksplorativ faktoranalyse, undersøker metoder for å teste hypoteser i bekreftende analyse, og vurderer problemet med å beregne faktorverdier. Det tilbys en ordbok med spesielle termer, samt svar på spørsmål som oftest dukker opp blant brukere av faktoranalyse, som kan hindre dem i å gjøre mange feil. Det matematiske apparatet er ganske beskjedent - kun informasjon fra matrisealgebra er gitt.

Faktoranalyse har blitt brukt i økonomiske problemer der tilstedeværelsen av høyt korrelerte parametere førte til feil resultater i regresjonsanalyse. Forskere som arbeider med sosiopolitiske problemer har sammenlignet alle slags egenskaper ved nasjoner med forskjellige politiske og sosioøkonomiske egenskaper, og forsøkt å finne ut hvilke av dem som er viktigst for å klassifisere nasjoner (for eksempel rikdom og tall); Sosiologer definerte "vennlige grupper" ved å studere grupper av mennesker som sympatiserte med hverandre (og ikke med andre individer). Psykologer har brukt faktoranalyse for å bestemme hvordan folk oppfatter ulike «stimuli» og klassifiserer folk i grupper som tilsvarer ulike svar, og utgivere har brukt faktoranalyse for å studere måter å assosiere individuelle elementer i språket.

Ifølge forfatterne dekker ikke arbeidet deres alle aspekter ved faktoranalyse, siden det er i stadig utvikling. Men dersom leseren får tilstrekkelig forståelse for hvordan denne metoden kan brukes, så kan forfatterne anses å ha fullført oppgaven sin.

E. M. Aslaner, serieredaktør

Så fra betingelsene for problemet presentert ovenfor følger det at vi har en datamatrise bestående av 24 uavhengige variabler (utsagn), i ulike aspekter som beskriver den nåværende tilstanden til flyselskapet X i det internasjonale lufttransportmarkedet. Hovedoppgaven til faktoranalysen er å gruppere utsagn av lignende betydning i makrokategorier for å redusere antall variabler og optimere datastrukturen.

Åpne vinduet Faktoranalyse ved å bruke menyen Analyser > Datareduksjon > Faktor. Flytt variablene for analyse (ql-q24) fra venstre liste til høyre, som vist i fig. 5,32. Feltet Utvalgsvariabel lar deg velge en variabel som analysen skal utføres på (for eksempel flyklasse). I vårt tilfelle lar du dette feltet stå tomt.

Klikk på Descriptives-knappen og i dialogboksen som åpnes (Fig. 5.33), velg KMO og Barletts test av sfærisitet. Dette vil avgjøre hvor egnet de tilgjengelige dataene er for faktoranalyse. Vinduet Descriptives lar deg vise annen nødvendig beskrivende statistikk Men i de fleste eksempler fra markedsundersøkelser blir disse mulighetene vanligvis ikke brukt.

Ris. 5,32.

Ris. 5,33.

Lukk beskrivelsesvinduet ved å klikke på Fortsett-knappen. Deretter åpner du ekstraksjonsvinduet (fig. 5.34) ved å klikke på den tilsvarende knappen i hoveddialogboksen for faktoranalyse. Dette vinduet er ment for å velge en metode for å danne en faktormodell; gjør følgende i den.

Ris. 5,34.

Først, i Metode-feltet, velg faktorekstraksjonsmetoden (formasjon). Den generelle anbefalingen for valg av metode er som følger. Det er nødvendig å velge en faktorekstraksjonsmetode som lar deg entydig klassifisere så mange variabler som mulig. Dermed er hovedhensynene her antall faktorer klassifisert og entydigheten i klassifiseringen (det vil si at hver variabel skal tilhøre kun én faktor). Som du vil se nedenfor, lar standard hovedkomponentmetoden i SPSS i vårt tilfelle oss entydig klassifisere 22 variabler av 24 tilgjengelige (92%), noe som er en veldig god indikator. Basert på eksisterende erfaringer kan forfatteren hevde at et godt resultat av faktoranalyse er andelen entydig klassifiserte variabler på minst 90 %. Velg metoden Hovedkomponenter. Denne metoden er den mest egnede for å løse de fleste problemer med markedsundersøkelser ved hjelp av faktoranalyse.

For det andre, angi antall faktorer som dannes (ekstrahere gruppe). Som standard er metoden for å bestemme antall faktorer som skal trekkes ut satt basert på verdiene til karakteristiske tall (Eigenvalues ​​over). Uten å gå inn på statistiske detaljer, legger vi merke til at karakteristiske tall brukes av SPSS for å bestemme den kvantitative og kvalitative sammensetningen av ekstraherte faktorer. Med en forhåndsinnstilt verdi av denne indikatoren lik 1, vil antallet dannede faktorer være lik antallet variabler der verdien av karakteristiske tall er større enn eller lik 1.

Det er også mulig å manuelt spesifisere til programmet hvor mange faktorer som skal trekkes ut (Antall faktorer). Denne funksjonen er gitt i SPSS slik at hvis det er for mange variabler med et karakteristisk tall større enn 1, kan du manuelt redusere antall faktorer. Et stort antall faktorer er vanskelig å tolke, derfor, hvis metoden for karakteristiske tall ikke klarer å trekke ut et akseptabelt antall faktorer for tolkning (jo færre, jo bedre), bør du uavhengig angi antall faktorer til programmet. Dette problemet løses av analytikeren i hvert enkelt tilfelle individuelt. En mulig løsning vil være å øke antallet egenverdier fra den forhåndsinnstilte verdien på 1, for eksempel, til 1,5 eller mer. Dette vil hjelpe hvis du har oppnådd et stort antall faktorer med et karakteristisk tall omtrent lik 1, og flere (2-3 eller flere) faktorer med et karakteristisk tall på mer enn 1,5 eller en annen verdi. Når han manuelt bestemmer antall faktorer, kan analytikeren også ta en relevant beslutning basert på sin erfaring eller andre forutsetninger. Til slutt bør det bemerkes at når man manuelt spesifiserer antall ekstraherte faktorer, viser seg noen ganger antallet unikt klassifiserte variabler å være mindre enn med ekstraksjonsmetoden basert på verdien av karakteristiske tall. Dette negative punktet oppveies imidlertid av den økte klarheten i resultatene av faktoranalyse - tross alt lar dette deg bli kvitt faktorer som ikke inneholder variabler med en signifikant korrelasjonskoeffisient (i vårt tilfelle 0,5).

Lukk uttrekksdialogboksen ved å klikke på Fortsett-knappen. Velg type koeffisientmatriserotasjon (Rotasjonsknapp i hoveddialogboksen Faktoranalyse). Koeffisientmatrisen roteres for å bringe faktormodellen så nært som mulig til idealet: evnen til entydig å klassifisere alle variabler. Velg en bestemt rotasjonsmetode i dialogboksen Rotasjon (Figur 5.35). I de fleste tilfeller er Varimax-metoden det mest passende alternativet. Det letter faktortolkning ved å minimere antall variabler med høy faktorbelastning. Velg denne rotasjonstypen og lukk dialogboksen ved å klikke på Fortsett-knappen.

Ris. 5,35.

Deretter åpner du Factor Scores-dialogboksen (Figur 5.36) ved å klikke på Scores-knappen. Dette vinduet tjener til å lage nye variabler i kildedatafilen, som deretter vil tillate hver respondent å bli tildelt en bestemt gruppe (faktor). Antallet nyopprettede variabler er lik antall ekstraherte faktorer. Nedenfor vil vi vise hvordan du bruker disse variablene. Velg Lagre som variabler i dialogboksen Faktorscore og velg Regresjon som metode for å bestemme verdiene for disse nye variablene. Etter dette lukker du dialogboksen ved å klikke på Fortsett-knappen.

Ris. 5,36.

Det siste trinnet før du starter faktoranalyseprosedyren er å velge noen ekstra parametere (Alternativer-knappen). I dialogboksen som åpnes (fig. 5.37), velg to elementer: Sortert etter størrelse og Undertrykk absolutte verdier mindre enn. Det første alternativet lar deg vise variablene som er inkludert i hver faktor i synkende rekkefølge av faktorkoeffisientene deres (størrelsen på variabelens bidrag til dannelsen av faktoren). Det andre viser seg å være veldig nyttig, da det letter oppgaven med entydig tolkning av de oppnådde faktorene. Verdien til denne parameteren spesifisert i det tilsvarende feltet (i vårt tilfelle 0,5) avskjærer variabler med faktorkoeffisienter mindre enn denne verdien. Dette gjør det mulig å forenkle den roterte faktormatrisen, siden ikke-signifikante variabler inkludert i hver ekstraherte faktor forsvinner fra den. Hvis du ikke aktiverer dette alternativet, vil hver variabel vise en faktorkoeffisient for hver faktor, noe som vil unødvendig overbelaste faktormodellen og gjøre det vanskelig for forskere å forstå.

Parameteren Undertrykk absolutte verdier mindre enn er introdusert for å lette den praktiske tolkningen av resultatene av faktoranalyse. Siden faktorkoeffisientene i den resulterende roterte koeffisientmatrisen er korrelasjonskoeffisienter mellom de tilsvarende variablene og faktorene, er det i de fleste praktiske tilfeller tilrådelig å sette startgrenseverdien for ikke-signifikante variabler til 0,5. Hvis faktoranalysen resulterer i mindre enn et akseptabelt antall klassifiserte variabler (for eksempel hvis datastrukturen ikke er godt egnet for faktoranalyse; se nedenfor), kan du beregne faktormodellen på nytt med en lavere grenseverdi (for eksempel 0,4) ). I motsatt situasjon, dersom variabelen inngår i flere faktorer, kan det foreslås å øke utvinningsnivået fra 0,5 til 0,6. Dette vil eliminere variabler som er inkludert i flere faktorer samtidig, og øker den praktiske egnetheten til resultatene av faktoranalyse.

Så, etter å ha spesifisert alle nødvendige parametere i Alternativer-vinduet, lukk det (Fortsett-knappen) og start faktoranalyseprosedyren ved å klikke på 0K-knappen i hoveddialogboksen Faktoranalyse.

Ris. 5,37.

Etter at programmet har gjort alle nødvendige beregninger, åpnes SPSS Viewer-vinduet med resultatene av konstruksjonen av faktormodellen. Det første vi er interessert i er egnetheten til de tilgjengelige dataene for faktoranalyse generelt. La oss se på KMO og Barletts testtabell (Fig. 5.38) Den har to indikatorer som er av interesse for oss: KMO-testen og betydningen av Barlett-testen Resultatene av KMO-testen lar oss trekke en konklusjon angående den generelle egnetheten til tilgjengelige data for faktoranalyse, det vil si hvor godt konstruert faktormodellen beskriver strukturen til respondentenes svar på de analyserte spørsmålene Resultatene av denne testen varierer fra 0 (faktormodellen er absolutt ubrukelig) til 1 (den faktormodellen beskriver strukturen til dataene perfekt. Faktoranalyse bør vurderes som egnet hvis KMO er i området 0,5 til 1. I vårt tilfelle er dette tallet 0,9, som er et meget godt resultat.

Barletts sfærisitetstest tester hypotesen om at variablene som er involvert i faktoranalyse er ukorrelerte med hverandre. Dersom denne testen gir et positivt resultat (variabler er ukorrelerte), bør faktoranalyse anses som uegnet for bruk av andre statistiske metoder (for eksempel klyngeanalyse). Statistikken som bestemmer egnetheten av faktoranalyse i henhold til Barlett-testen er signifikans (linje Sig.). På et akseptabelt nivå

signifikans (under 0,05), anses faktoranalyse som egnet for å analysere utvalgspopulasjonen som studeres. I vårt tilfelle viser testen under vurdering en svært lav signifikans (mindre enn 0,001), hvorfra konklusjonen følger om anvendbarheten av faktoranalyse.

Så, basert på KMO- og Barlett-testene, kom vi til den konklusjonen at dataene vi hadde var nesten ideelt egnet for forskning ved hjelp av faktoranalyse.

Ris. 5,38.

Det neste trinnet i å tolke resultatene av faktoranalysen er å vurdere den resulterende roterte matrisen av faktorkoeffisienter: tabellen Rotert komponentmatrise (fig. 5.39). Denne tabellen er hovedresultatet av faktoranalyse. Den gjenspeiler resultatene av å klassifisere variabler i faktorer. I vårt tilfelle, ved å bruke en automatisk metode for å bestemme antall faktorer (basert på karakteristiske tall større enn 1), ble det bygget en praktisk akseptabel faktormodell, der 22 av 24 variabler entydig kunne klassifiseres i et lite antall faktorer (5 ). Dette resultatet kan anses som bra.

Du kan håndtere uklassifiserte variabler som følger. Du trenger ganske enkelt å beregne faktormodellen på nytt ved å fjerne den tidligere innstilte grenseverdien på 0,5 i dialogboksen Alternativer. Deretter vil det bli konstruert en faktormatrise (fig. 5.40), hvor analytikeren selvstendig må bestemme tilknytningen av uklassifiserte variabler til en bestemt faktor basert på kriteriet om høyeste korrelasjonskoeffisient mellom variablene og de fem faktorene. I vårt tilfelle ser du at variabel ql6 er høyest korrelert med faktor 1 (faktorkoeffisient 0,468) og derfor bør tilordnes denne faktoren, og variabel q24 bør tilordnes faktor 4 (0,474).

Etter at vi entydig har klassifisert alle variablene, la oss gå tilbake til tabellen i fig. 5,40. Vi mottok fem grupper av variabler (faktorer) som beskriver den nåværende konkurranseposisjonen til flyselskap X fra fem ulike aspekter. Dette er gruppene.

q2. Airline X kan konkurrere med de beste flyselskapene i verden. q3. Jeg tror at Airline X har en lovende fremtid innen global luftfart. q23. Flyselskap X er bedre enn mange tror det er. q!4. Flyselskap X er Russlands ansikt utad.

Ris. 5,39.

qlO. Flyselskap X bryr seg virkelig om passasjerene sine.

ql. Airline X har et rykte for utmerket passasjerservice.

q21. Airline X er et effektivt flyselskap. q5. Jeg er stolt over å jobbe for X Airline.

ql6. Airline Xs tjeneste er konsekvent og gjenkjennelig over hele verden.

ql2. Jeg tror at seniorledere jobber hardt for å gjøre flyselskapet vellykket.

qll. Det er høy grad av arbeidstilfredshet blant ansatte i flyselskapene.

q6. Innen flyselskap X er det god kommunikasjon mellom avdelingene.

q8. Nå forbedrer flyselskapet X seg raskt.

q7. Hver ansatt i flyselskapet jobber hardt for å sikre suksessen.

q4. Jeg vet hva utviklingsstrategien til flyselskapet X vil være i fremtiden.

ql7. Jeg ville ikke at flyselskapet X skulle bytte.

q20. Endringer hos flyselskap X vil være en positiv utvikling.

ql8. Flyselskap X må endre seg for å utnytte sitt fulle potensial.

q9. Vi har en lang vei å gå før vi kan hevde å være et flyselskap i verdensklasse.

q22. Jeg skulle gjerne sett at flyselskapet Xs image forbedres fra utenlandske passasjerers synspunkt.

q24. Det er viktig at folk over hele verden vet at vi er et russisk flyselskap.

ql9. Jeg tror flyselskapet X må presentere seg på en mer moderne måte visuelt.

ql3. Jeg liker måten Airline X for tiden presenteres visuelt på for allmennheten (når det gjelder fargevalg og merkevarebygging).

ql5. Vi ser ut som i går sammenlignet med andre flyselskaper.

Den vanskeligste oppgaven når man utfører faktoranalyse er tolkningen av de resulterende faktorene. Det er ingen universell løsning her: i hvert enkelt tilfelle bruker analytikeren eksisterende praktisk erfaring for å forstå hvorfor faktormodellen tildeler en bestemt variabel til denne bestemte faktoren. Det er tilfeller (spesielt med et lite antall velformaliserte variabler) når de dannede faktorene er åpenbare og forskjellene mellom variablene er synlige for det blotte øye. I en slik situasjon kan man klare seg uten faktoranalyse og dele variablene inn i grupper manuelt. Effektiviteten og kraften til faktoranalyse viser seg imidlertid i komplekse og ikke-trivielle tilfeller når variabler ikke kan klassifiseres på forhånd, og deres formuleringer er forvirrende. Da vil klassifiseringen av variabler basert på respondentenes meninger være av stor forskningsinteresse, noe som vil gjøre det mulig å identifisere hvordan respondentene selv har forstått denne eller hin problemstillingen.

Når det er mulig og hensiktsmessig for formålet med studien, bør variabler formaliseres før faktoranalyse utføres. Dette vil tillate analytikeren å gjøre forhåndsantakelser om å dele settet med tilgjengelige variabler i grupper. Forskerens oppgave ved å tolke resultatene av faktormatrisen i dette tilfellet vil bli forenklet, siden han ikke lenger vil starte "fra scratch." Dens oppgave vil bli redusert til å teste tidligere fremsatte hypoteser om tilhørigheten til en bestemt variabel til en spesifikk gruppe.

Noen ganger oppstår tilfeller når en variabel som er tilordnet en bestemt faktor av SPSS, logisk sett ikke er relatert på noen måte til de andre variablene som utgjør den samme faktoren. Du kan beregne faktormodellen på nytt uten å kutte av ubetydelige koeffisienter (som i eksempelet i fig. 5.40) og se med hvilken annen faktor denne ulogiske variabelen korrelerer med nesten samme styrke som med faktoren den automatisk ble tildelt. For eksempel har variabel Z en korrelasjonskoeffisient med faktor 1 på 0,505, og med faktor 2 korrelerer den med en koeffisient på 0,491. SPSS tilordner denne variabelen automatisk til den faktoren som den største korrelasjonen identifiseres med, uten å ta hensyn til at denne variabelen korrelerer med nesten samme styrke med en annen faktor. Det er i en slik situasjon (med en liten forskjell i korrelasjonskoeffisientene) du kan prøve å tilordne variabelen Z til faktor 2, og hvis dette viser seg å være logisk, vurdere det i gruppen av variabler fra den andre faktoren.

Det er mulig å manuelt redusere antall faktorer som skal trekkes ut, noe som vil gjøre forskerens oppgave lettere ved tolkning av resultatene av faktoranalyse. Det må imidlertid tas i betraktning at en slik reduksjon vil redusere fleksibiliteten til faktormodellen og til og med føre til en situasjon der variablene feilaktig deles inn i ukorrekte, fra et praktisk synspunkt, grupper. Dessuten vil reduksjon av antall ekstraherte faktorer uunngåelig redusere andelen entydig klassifiserte faktorer.

Som en variant av den forrige løsningen er det mulig å foreslå å kombinere to eller flere faktorer med små mengder av deres konstituerende variabler. En slik gruppering vil på den ene siden redusere antall tolkbare faktorer, og på den andre siden lette forståelsen av små faktorer.

Hvis forskeren har kommet til en blindvei og ingen midler hjelper til med å forklare tilknytningen til en bestemt variabel til en bestemt faktor, gjenstår det å bruke en annen statistisk prosedyre (for eksempel klyngeanalyse).

La oss gå tilbake til våre fem faktorer. Oppgaven med å beskrive og forklare dem virker ikke veldig vanskelig. Dermed kan det bemerkes at utsagnene som inngår i den første faktoren (q2, q3, q23, ql4, qlO, ql, q21, q5 og ql6) er generelle, det vil si at de relaterer seg til hele flyselskapet og beskriver holdningen til det fra flypassasjerenes side. Det eneste unntaket var variabelen q5, som er mer relatert til den andre faktoren. Korrelasjonskoeffisienten med faktor 2 er 0,355 (se fig. 5.40), som av logiske grunner gjør at den kan inkluderes i denne gruppen. Faktor 2 (ql2, qll, q6, q8, q7 og q4) beskriver holdningen til flyselskap X fra ansattes side. Den tredje faktoren (ql7, q20 og ql8) beskriver respondentenes holdning til endringer i flyselskapet (den inkluderte alle utsagn med roten "menn" - fra ordet "endring"). Den fjerde faktoren (q9, q22 og q24) beskriver respondentenes holdning til flyselskapets image. Til slutt kombinerer den femte faktoren (ql9, ql3 og ql5) utsagn som karakteriserer respondentenes holdning til det visuelle bildet til flyselskapet X.

Dermed har vi fått fem grupper av utsagn som beskriver den nåværende konkurranseposisjonen til selskapet X i det internasjonale lufttransportmarkedet. Basert på den fortolkende (semantiske) analysen kan følgende definisjoner tilordnes disse gruppene (faktorene).

¦ Faktor 1 karakteriserer flyselskapets generelle posisjon i kundenes øyne.

¦ Faktor 2 karakteriserer den interne tilstanden til flyselskapet X fra de ansattes synspunkt.

¦ Faktor 3 karakteriserer endringene som skjer i flyselskapet X.

¦ Faktor 4 karakteriserer bildet av flyselskapet X.

¦ Faktor 5 karakteriserer det visuelle bildet til flyselskapet X.

Etter at vi har tolket alle de oppnådde faktorene, kan vi vurdere faktoranalysen som komplett og vellykket. Deretter skal vi vise hvordan resultatene av faktoranalyse kan brukes til å konstruere tverrsnitt.

Husk at vi lagret faktorvurderingene (det vil si hver respondents medlemskap i en bestemt faktor) i den opprinnelige datafilen som nye variabler. Disse variablene har navn som: facX_Y, hvor X er faktornummeret, og Y er serienummeret til faktormodellen. Hvis vi bygget en faktormodell to ganger og endte opp med tre faktorer hentet ut første gang og to faktorer andre gang, ville variabelnavnene vært som følger:

¦ facl_l, fac2_l, fac3_l (for tre faktorer fra den første modellen som ble bygget);

¦ facl_2, fac2_2 (for to faktorer fra den andre modellen).

I vårt tilfelle vil det bli opprettet fem nye variabler (i henhold til antall ekstraherte faktorer). Disse faktorvurderingene kan brukes i fremtiden, for eksempel til å konstruere tverrsnitt. Så hvis det er nødvendig å finne ut hvordan respondenter – menn og kvinner – vurderer ulike aspekter ved virksomheten til flyselskapet X, kan dette gjøres ved å analysere faktorvurderinger.

Den vanligste måten å bruke faktorvurderinger på i videre beregninger er å rangere og deretter dele de nyopprettede variablene som representerer de ekstraherte faktorene i fire kvartiler (25 % persentiler). Denne tilnærmingen gjør det mulig å lage nye ordinalskalavariabler som beskriver de fire nivåene til hver faktor. I vårt tilfelle, for utsagnene som utgjør faktor 2, vil disse nivåene være: uenig (tilstanden i selskapets interne anliggender tilfredsstiller ikke ansatte), snarere uenig (vurderingen av den interne situasjonen i selskapet er under gjennomsnittet) , heller enig (vurdering over gjennomsnittet), enig (vurdering Flott).

For å lage variabler som respondentene skal grupperes videre etter, kall menyen Transformer > Ranger saker. I dialogboksen som åpnes (Fig. 5.41), velg variabelen som inneholder faktorvurderinger for faktor 2 (fac2_l) fra venstre liste og plasser den i Variabler-feltet. Deretter, i området Tildel rangering I til, velger du elementet med minste verdi, i vårt tilfelle betyr dette at den første gruppen (uenig) vil bestå av respondenter som vurderer tilstanden til flyselskapets interne forhold som dårlig. Følgelig vil gruppe 2, 3 og 4 bli definert for kategoriene ganske uenig, heller enig og enig.

Ris. 5,41.

Klikk Rangeringstyper > Typer, avbryt standardrangeringsalternativet og velg i stedet Ntiles med antall grupper forhåndsinnstilt til 4 (Figur 5.42). Klikk på Fortsett-knappen og deretter på OK i hoveddialogboksen. Denne prosedyren vil opprette en ny variabel nfac2_l (2 betyr andre faktor) i datafilen, og klassifisere respondentene i fire grupper.

Ris. 5,42.

Alle respondentene i utvalget er preget av en positiv, ganske positiv, heller negativ eller negativ holdning til dagens tilstand hos flyselskap X. For å øke klarheten anbefales det å tildele etiketter til hvert av de fire identifiserte nivåene; Du kan også gi nytt navn til selve variabelen. Du kan nå utføre tverrsnittsanalyser ved å bruke den nye ordinalvariabelen, samt bygge andre statistiske modeller i SPSS. Nedenfor vil vi vise hvordan man kan bruke resultatene av å konstruere en faktormodell i klyngeanalyse.

For å illustrere mulighetene for praktisk bruk av den nye variabelen, vil vi gjennomføre en tverrsnittsanalyse av påvirkningen av respondentenes kjønn på deres vurdering av dagens tilstand hos flyselskap X (Figur 5.43). Som det følger av tabellen presentert, har mannlige respondenter generelt en tendens til å gi lavere rangeringer til flyselskapsparameteren som vurderes sammenlignet med kvinner. I strukturen av vurderinger som er svært dårlige, dårlige og tilfredsstillende, dominerer andelen menn; vurderingene er svært gode, tvert imot er det kvinner som dominerer. Når man går over til hver påfølgende (høyere) vurderingskategori, synker andelen menn jevnt, og andelen kvinner øker følgelig. %2-testen viser at den identifiserte sammenhengen er statistisk signifikant.

Ris. 5,43. Kryssfordeling: påvirkningen av respondentenes kjønn på deres vurdering av dagens tilstand hos flyselskap X