簡介
評價是現代社會各領域的一項經常性的工作,是科學做出管理決策的重要依據。随着人們研究領域的不斷擴大,所面臨的評價對象日趨複雜,如果僅依據單一指标對事物進行評價往往不盡合理,必須全面地從整體的角度考慮問題,多指标綜合評價方法應運而生。所謂多指标綜合評價方法,就是把描述評價對象不同方面的多個指标的信息綜合起來,并得到一個綜合指标,由此對評價對象做一個整體上的評判,并進行橫向或縱向比較。
而在多指标評價體系中,由于各評價指标的性質不同,通常具有不同的量綱和數量級。當各指标間的水平相差很大時,如果直接用原始指标值進行分析,就會突出數值較高的指标在綜合分析中的作用,相對削弱數值水平較低指标的作用。因此,為了保證結果的可靠性,需要對原始指标數據進行标準化處理。
目前數據标準化方法有多種,歸結起來可以分為直線型方法(如極值法、标準差法)、折線型方法(如三折線法)、曲線型方法(如半正态性分布)。不同的标準化方法,對系統的評價結果會産生不同的影響,然而不幸的是,在數據标準化方法的選擇上,還沒有通用的法則可以遵循。
方法
在數據分析之前,通常需要先将數據标準化(normalization),利用标準化後的數據進行數據分析。數據标準化也就是統計數據的指數化。數據标準化處理主要包括數據同趨化處理和無量綱化處理兩個方面。數據同趨化處理主要解決不同性質數據問題,對不同性質指标直接加總不能正确反映不同作用力的綜合結果,須先考慮改變逆指标數據性質,使所有指标對測評方案的作用力同趨化,再加總才能得出正确結果。
數據無量綱化處理主要解決數據的可比性。數據标準化的方法有很多種,常用的有“最小—最大标準化”、“Z-score标準化”和“按小數定标标準化”等。經過上述标準化處理,原始數據均轉換為無量綱化指标測評值,即各指标值都處于同一個數量級别上,可以進行綜合測評分析。
一、Min-max标準化
min-max标準化方法是對原始數據進行線性變換。設minA和maxA分别為屬性A的最小值和最大值,将A的一個原始值x通過min-max标準化映射成在區間[0,1]中的值x',其公式為:
新數據=(原數據-最小值)/(最大值-最小值)
二、z-score标準化
這種方法基于原始數據的均值(mean)和标準差(standard deviation)進行數據的标準化。将A的原始值x使用z-score标準化到x'。
z-score标準化方法适用于屬性A的最大值和最小值未知的情況,或有超出取值範圍的離群數據的情況。
新數據=(原數據-均值)/标準差
spss默認的标準化方法就是z-score标準化。
用Excel進行z-score标準化的方法:在Excel中沒有現成的函數,需要自己分步計算,其實标準化的公式很簡單。
步驟如下:
1.求出各變量(指标)的算術平均值(數學期望)xi和标準差si;
2.進行标準化處理:
zij=(xij-xi)/si
其中:zij為标準化後的變量值;xij為實際變量值。
3.将逆指标前的正負号對調。
标準化後的變量值圍繞0上下波動,大于0說明高于平均水平,小于0說明低于平均水平。
三、Decimal scaling小數定标标準化
這種方法通過移動數據的小數點位置來進行标準化。小數點移動多少位取決于屬性A的取值中的最大絕對值。将屬性A的原始值x使用decimal scaling标準化到x'的計算方法是:
x'=x/(10^j)
其中,j是滿足條件的最小整數。
例如假定A的值由-986到917,A的最大絕對值為986,為使用小數定标标準化,用每個值除以1000(即,j=3),這樣,-986被規範化為-0.986。
注意,标準化會對原始數據做出改變,因此需要保存所使用的标準化方法的參數,以便對後續的數據進行統一的标準化。
除了上面提到的數據标準化外還有對數Logistic模式、模糊量化模式等等。
對數Logistic模式:新數據=1/(1+e^(-原數據))。
模糊量化模式:新數據=1/2+1/2sin[派3.1415/(極大值-極小值)*(X-(極大值-極小值)/2)]X為原數據。



















