關(guān)于主成分分析的常用改進方法論文
針對傳統(tǒng)主成分分析方法的缺點和應(yīng)用當(dāng)中可能出現(xiàn)的誤區(qū),總結(jié)幾種常用的主成分分析改進方法。是一種化繁為簡,將指標(biāo)數(shù)盡可能壓縮的降維(即空間壓縮)技術(shù),也是一種綜合評價方法。
關(guān)鍵詞:主成分改進,綜合評價
0. 引言
主成分分析是一種常用的多元統(tǒng)計分析(即多指標(biāo)的統(tǒng)計方法)方法。是一種化繁為簡,將指標(biāo)數(shù)盡可能壓縮的降維(即空間壓縮)技術(shù),也是一種綜合評價方法。免費論文。目前已廣泛應(yīng)用于許多領(lǐng)域,如:城市生態(tài)系統(tǒng)可持續(xù)發(fā)展的分析,工業(yè)企業(yè)經(jīng)濟效益的分析,公司財務(wù)評價,學(xué)習(xí)成績的比較評價等等。但是,傳統(tǒng)的主成分分析法在綜合評價當(dāng)中已暴露出很多缺陷,很多學(xué)者也提出了不同的.改進方法,這些改進方法是與一定的現(xiàn)實條件相關(guān)聯(lián)的,因此也不乏出現(xiàn)誤用。本文將對常用的改進方法作進一步探討。
1.傳統(tǒng)PCA評價模型的算法:
1.1 輸入樣本觀測值:
1.2 計算各指標(biāo)的樣本均值和樣本標(biāo)準(zhǔn)差:
1.3 對標(biāo)準(zhǔn)化,計算樣本相關(guān)陣:
1.4 求的特征值及對應(yīng)的特征向量
1.5 建立主成分。
按累積方差貢獻率
1.6 計算前個主成分的樣本值
2.運用傳統(tǒng)主成分分析方法易出現(xiàn)的誤區(qū)及改進方法
在實際應(yīng)用中,為了消除變量量綱的影響,往往對原始數(shù)據(jù)標(biāo)準(zhǔn)化,但是標(biāo)準(zhǔn)化在消除量綱或數(shù)量級影響的同時,也抹殺了各指標(biāo)變異程度的差異信息,在此種情況下,我們通?刹捎脤υ紨(shù)據(jù)進行均值化處理 [2],該方法已得到廣泛采用。另外,主成分分析對于處理線性結(jié)構(gòu)有很好的效果,然而對于許多實際問題,其觀測數(shù)據(jù)陣并非線性結(jié)構(gòu)而呈非線性結(jié)構(gòu)。這時,若采用線性方法,效果往往很差。這就需要進一步的改進。本文將介紹幾種簡單的對原始數(shù)據(jù)進行處理的方法以及“對數(shù)—線性比”[1]主成分方法。
改進方法操作如下:
2.1 對原始數(shù)據(jù)的處理
2.1.1 數(shù)據(jù)的均值化
2.1.2 對數(shù)變換法
描繪原始數(shù)據(jù)的散點圖,若散點圖呈現(xiàn)對數(shù)曲線特征時,令
2.1.3 平方根變換法
若散點圖呈現(xiàn)拋物線特征時,令
然后以作為新的數(shù)據(jù)代替原始數(shù)據(jù)進行分析即可。
當(dāng)上述三種變換仍然不能很好的解決問題,而原始數(shù)據(jù)又明顯呈現(xiàn)非線性特征時,還可以采用下述方法。免費論文。
2.2“對數(shù)—線性比”主成分方法
原香港大學(xué)統(tǒng)計系主任Aitchison教授(1981年)提出用對數(shù)—比(logratio)變換
亦即 其中為成分向量的任一恒正函數(shù)。為簡便起見,一般可取
相應(yīng)的
可以證明為奇異陣,至多有個非零特征值。免費論文。對其作譜分解:
便可以求得其廣義主成分
3.其它改進方法
除了上述改進方法之外,近來不少學(xué)者又提出了新的改進方法,如主成分聚類法。主成分聚類即先做主成分分析,再取若干主成分對樣品進行聚類分析,結(jié)合第一主成分得分排序?qū)悠愤M行分類排名。由此得到一種新的綜合評價方法,具體操作方法詳見文獻[2]。另外還有分組主成分分析方法 [5] 等。在實際應(yīng)用當(dāng)中,如果不考慮具體問題條件,一味采取同一個模式,難免有失偏頗,甚至與現(xiàn)實大相徑庭。因此,根據(jù)不同的問題采用不同的改進方法,對解決具體問題是很有必要的。
【主成分分析的常用改進方法論文】相關(guān)文章:
區(qū)間主成分分析方法的比較11-03
主成分分析及算法07-03
sas主成分分析07-16
海水富營養(yǎng)化評價的主成分-聚類分析方法07-16
海洋經(jīng)濟與環(huán)境發(fā)展的主成分分析01-18
基于Matlab的陀螺經(jīng)緯儀穩(wěn)定性主成分分析方法07-07