Applied multivariate data analysis

1277 mots 6 pages
資料整理來源:陳順宇著,多變量分析

第七章 因素分析(Factor Analysis):
起源於心理學上的研究。在心理學上常會遇到一些不能直接量測的因素,例如: 人的智力、EQ、人格特質、食物偏好、消費者的購買行為等。對於這些無法明 確表示(抽象的)或無法測量的因素,希望可以經由一些可以測量的變數,加以訂 定出這些因素。 因素分析的主要目的是對資料找出其結構,以少數幾個因素來解釋一群相互有關 係存在的變數,而又能到保有原來最多的資訊,再對找出因素的進行其命名,如 此方可達到因素分析的兩大目標:資料簡化和摘要。 相互有關係存在的變數受共同因素(Common Factor)及獨特因素(Specific Factor) 的影響。 因素分析分成探索性因素分析(Exploratory Factor Analysis)與驗證性因素分析 (Confirmatory Factor Analysis)。探索性因素分析是在沒有任何限制之下,找出因 素的結構。驗證性因素分析是在已知可能的結構下,驗證是否仍適用,如線性結 構方程式(LISREL)。

因素分析的應用
1. 找出潛在因素 2. 篩選變數 3. 對資料做摘要 4. 由變數中選取代表性變數 (在因素中挑選一個變數使用) 5. 建構效度 6. 做資料簡化 (相關性高的變數,僅需選取一個做代表)

因素分析與主成分分析的比較
1. 主成分分析是以變異數為導向。因素分析是以共變異數為導向,關心每個變 數與其他變數共同享有部分的大小。 2. 主成分分析是選擇一組成份(Component),盡可能的解釋原變數的變異數。因 素分析是選取少數因素(Factor),解釋原變數的相關情形。 3. 主成分分析是所有變數的變異都考慮在內。因素分析只考慮每一變數與其他 變數共同享有的變異。
1

4. 主成分分析較適合做資料(變數)的簡化。因素分析較適合做偵測資料結構。 5. 主成分分析不需要旋轉。因素分析可能需要旋轉才能對因素命名與解釋。 6. 主成分分析是資料(變數)做變換(線性組合),對資料(變數)不需要任何假設。 因素分析是假設資料(變數)滿足某些結構而得到的結果。

因素分析的應用
經因素分析將資料(變數)簡化成少數幾個因素,可對個體分群(群集分析),或進 行 ANOVA 、 MDS( 多 元 尺 度 ) , 或 畫 因 素 得 點 的 散 佈 圖 找 出 異 常 點 , 或 做 LISREL(線性結構方程式)的構面中測量變數指標。

因素分析模式架構
設有 p 個變數,每個變數可分解成少數 q 個共同因素(Common Factor) fj (q < p) 及獨特因素(Specific Factor) εi 的線性組合。

x1 = µ1 + l11 f1 + l12 f 2 + Ll1q f q + ε 1 x 2 = µ 2 + l 21 f 1 + l 22 f 2 + L l 2 q f q + ε 2
… x p = µ1 + l p1 f 1 + l p 2 f 2 + L l pq f q + ε p f 1 , f 2 , L , f q 在每個變數中都擁有。 ε i 只在第 i 個變數中擁有。 l ij 為第 i 個變數在第 j 個共同因素的權重或因素負荷(Factor Loading)。

矩陣表示法 X = µ + Lf + ε => X − µ = Lf + ε
⎡ x1 ⎤ ⎡ µ1 ⎤ ⎡ l11 ⎢x ⎥ ⎢µ ⎥ ⎢ ⎢ 2 ⎥ , µ = ⎢ 2 ⎥ , L = ⎢l 21 其中 X = ⎢M⎥ ⎢ M ⎥ ⎢M ⎢ ⎥ ⎢ ⎥ ⎢ ⎢x p ⎥ ⎢µ q ⎥ ⎢l p1 ⎣ ⎦ ⎣ ⎦ ⎣ l12 l 22 M l p2 L l1q ⎤ ⎡ f1 ⎤ ⎡ε1 ⎤ ⎥ ⎢f ⎥ ⎢ ⎥ L l2q ⎥ ⎢ 2 ⎥ , ε = ⎢ε 2 ⎥ ,f = ⎢M⎥ ⎢M⎥ O M ⎥ ⎥ ⎢ ⎥ ⎢ ⎥ L l pq ⎥ ⎢ fq ⎥ ⎢ε p ⎥ ⎦ ⎣ ⎦ ⎣ ⎦

(基本假設) E ( f ) = 0 , Cov( f ) = Φ , E (ε ) = 0 , Cov(ε ) = Ψ , Cov( f , ε ) = 0

L 稱為負荷矩陣或圖案矩陣(Pattern matrix)

因素分析模式的基本假設
2

1. 獨特因素 ε 1 , ε 2 , L , ε p 是相互獨立的且是平均數為 0,變異數為ψ i 的常態分 配。

⎛ ⎡0 ⎤ ⎡ψ 1 0 K 0 ⎤ ⎞ ⎡ε1 ⎤ ⎜⎢ ⎥ ⎢ 0 ψ L 0 ⎥⎟ ⎢ε ⎥ ⎜ ⎢0 ⎥ 2⎥ 2 ⎥⎟ ~ MN ⎜ , Ψ = ⎢

en relation

  • DataMining Partie1 Introduction
    1978 mots | 8 pages
  • Analyse multivariée
    3349 mots | 14 pages
  • Analyse des données
    2285 mots | 10 pages
  • Chef de produit
    12001 mots | 49 pages
  • Purchasing power parity and the impact of the east asian currency crisis
    10150 mots | 41 pages
  • Out-of-sample extensions for lle, isomap, mds, eigenmaps, and spectral clustering
    4239 mots | 17 pages
  • Performance achats
    10068 mots | 41 pages
  • Les ports d'afrique
    4067 mots | 17 pages
  • Hyperréalité
    14154 mots | 57 pages
  • cours1 ISFA2013 2014
    7101 mots | 29 pages