Pääkomponenttianalyysi (PCA) ja tekijäanalyysi (FA) ovat tilastollisia tekniikoita, joita käytetään datan vähentämiseen tai rakenteen havaitsemiseen. Näitä kahta menetelmää sovelletaan yhteen muuttujien joukkoon, kun tutkija on kiinnostunut selvitetään, mitkä muuttujat joukossa muodostavat yhtenäisiä alajoukkoja, jotka ovat suhteellisen riippumattomia yhdestä toinen. Muuttujat, jotka korreloivat keskenään, mutta ovat suurelta osin riippumattomia muista muuttujasarjoista, yhdistetään tekijöiksi. Näiden tekijöiden avulla voit tiivistää analyysisi muuttujien määrän yhdistämällä useita muuttujia yhdeksi tekijäksi.
PCA: n tai FA: n erityistavoitteina on yhteenveto PCA: n malleista korrelaatiot havaittujen muuttujien joukossa pienentää suuri määrä havaittuja muuttujia pienemmäksi tekijöiksi, jotta saadaan a regressioyhtälö taustalla olevalle prosessille käyttämällä havaittuja muuttujia, tai testatakseen teoria taustalla olevien prosessien luonteesta.
esimerkki
Sano esimerkiksi, että tutkija on kiinnostunut tutkimaan jatko-opiskelijoiden ominaisuuksia. Tutkija tutkii suurta osaa jatko-opiskelijoista persoonallisuusominaisuuksien kuten motivaatio, älylliset kyvyt, opillinen historia, sukuhistoria, terveys, fyysiset ominaisuudet, jne. Jokainen näistä alueista mitataan useilla muuttujilla. Sitten muuttujat syötetään analyysiin erikseen ja tutkitaan niiden välisiä korrelaatioita. Analyysi paljastaa korrelaatiomallit muuttujien välillä, joiden uskotaan heijastavan jatko-opiskelijoiden käyttäytymiseen vaikuttavia prosesseja. Esimerkiksi, useita muuttujia älyllisten kykyjen mittauksista yhdistyvät joihinkin oppilaitoksen historiallisten mittareiden kanssa älykkyyttä mittaavaksi tekijäksi. Samoin persoonallisuusmittareiden muuttujat voivat yhdistyä joihinkin muuttujiin motivaatiosta ja oppilaista historian mitat muodostavat tekijän, jolla mitataan, missä määrin opiskelija haluaa työskennellä itsenäisesti - itsenäisyyttä tekijä.
Pääkomponenttien ja tekijäanalyysien vaiheet
Pääkomponenttianalyysin ja tekijäanalyysin vaiheet sisältävät:
- Valitse ja mitata joukko muuttujia.
- Valmistele korrelaatiomatriisi suorittamaan joko PCA tai FA.
- Pura joukko tekijöitä korrelaatiomatriisista.
- Määritä tekijöiden lukumäärä.
- Käännä tarvittaessa tekijöitä tulkittavuuden lisäämiseksi.
- Tulkitse tulokset.
- Varmista tekijärakenne määrittämällä tekijöiden rakenteellisuus.
Ero pääkomponenttianalyysin ja tekijäanalyysin välillä
Pääkomponenttianalyysi ja tekijäanalyysi ovat samankaltaisia, koska molempia menettelytapoja käytetään muuttujasarjan rakenteen yksinkertaistamiseen. Analyysit eroavat kuitenkin useista tärkeistä tavoista:
- PCA: ssa komponentit lasketaan lineaarisina yhdistelminä alkuperäisistä muuttujista. FA: ssa alkuperäiset muuttujat määritellään tekijöiden lineaarisina yhdistelminä.
- PCA: ssa tavoitteena on kattaa yhtä suuri osuus kokonaismäärästä vaihtelu muuttujissa kuin mahdollista. FA: n tavoitteena on selittää muuttujien väliset kovarianssit tai korrelaatiot.
- PCA: ta käytetään vähentämään tiedot pienemmäksi komponenttimäärään. FA: ta käytetään ymmärtämään, mitkä rakenteet perustuvat tietoihin.
Pääkomponenttianalyysin ja tekijäanalyysin ongelmat
Yksi PCA: n ja FA: n ongelma on, että ratkaisun testaamiseksi ei ole kriteerimuuttujaa. Muissa tilastollisissa tekniikoissa, kuten syrjivän toiminnan analyysi, logistinen regressio, profiilianalyysi ja monimuuttuja varianssianalyysi, ratkaisu arvioidaan sen perusteella, kuinka hyvin se ennustaa ryhmän jäsenyyttä. PCA: ssa ja FA: ssa ei ole ulkoista kriteeriä, kuten ryhmäjäsenyyttä, jota vastaan voitaisiin testata ratkaisu.
PCA: n ja FA: n toinen ongelma on, että uuton jälkeen on käytettävissä ääretön määrä kierroksia, kaikki muodostavat saman määrän varianssia alkuperäisissä tiedoissa, mutta kertoimen ollessa hiukan määritelty eri. Lopullinen valinta jätetään tutkijalle sen tulkittavuuden ja tieteellisen hyödyllisyyden arvioinnin perusteella. Tutkijoiden mielipiteet eroavat usein siitä, mikä valinta on paras.
Kolmas ongelma on, että FA: ta käytetään usein "pelastaa" huonosti suunniteltu tutkimus. Jos mikään muu tilastollinen menetelmä ei ole tarkoituksenmukainen tai soveltuva, tiedot voidaan ainakin analysoida tekijällä. Tämä antaa monien uskoa, että FA: n eri muodot liittyvät huolimattomaan tutkimukseen.