什么是相關分析
相關分析就是對總體中確實具有聯系的標志進行分析,其主體是對總體中具有因果關系標志的分析。它是描述客觀事物相互間關系的密切程度并用適當的統計指標表示出來的過程。在一段時期內出生率隨經濟水平上升而上升,這說明兩指標間是正相關關系;而在另一時期,隨著經濟水平進一步發展,出現出生率下降的現象,兩指標間就是負相關關系。
為了確定相關變量之間的關系,首先應該收集一些數據,這些數據應該是成對的。例如,每人的身高和體重。然后在直角坐標系上描述這些點,這一組點集稱為“散點圖”。
根據散點圖,當自變量取某一值時,因變量對應為一概率分布,如果對于所有的自變量取值的概率分布都相同,則說明因變量和自變量是沒有相關關系的。反之,如果,自變量的取值不同,因變量的分布也不同,則說明兩者是存在相關關系的。
兩個變量之間的相關程度通過相關系數r來表示。相關系數r的值在-1和1之間,但可以是此范圍內的任何值。正相關時,r值在0和1之間,散點圖是斜向上的,這時一個變量增加,另一個變量也增加;負相關時,r值在-1和0之間,散點圖是斜向下的,此時一個變量增加,另一個變量將減少。r的絕對值越接近1,兩變量的關聯程度越強,r的絕對值越接近0,兩變量的關聯程度越弱。
相關分析的種類
1、按相關的程度分為完全相關、不完全相關和不相關
1)兩種依存關系的標志,其中一個標志的數量變化由另一個標志的數量變化所確定,則稱完全相關,也稱函數關系。
2)兩個標志彼此互不影響,其數量變化各自獨立,稱為不相關。
3)兩個現象之間的關系,介乎完全相關與不相關之間稱不完全相關。
2、按相關的方向分為正相關和負相關
1)正相關指相關關系表現為因素標志和結果標志的數量變動方向一致。
2)負相關指相關關系表現為因素標志和結果標志的數量變動方向是相反的。
3、按相關的形式分為線性相關和非線性相關
一種現象的一個數值和另一現象相應的數值在指教坐標系中確定為一個點,稱為線性相關。
4、按影響因素的多少分為單相關和復相關
1)如果研究的是一個結果標志同某一因素標志相關,就稱單相關。
2)如果分析若干因素標志對結果標志的影響,稱為復相關或多元相關。
相關分析的主要內容
1、確定相關關系的存在,相關關系呈現的形態和方向,相關關系的密切程度。其主要方法是繪制相關圖表和計算相關系數。
1)相關表
編制相關表前首先要通過實際調查取得一系列成對的標志值資料作為相關分析的原始數據。
相關表的分類:簡單相關表和分組相關表。
單變量分組相關表:自變量分組并計算次數,而對應的因變量不分組,只計算其平均值;該表特點:使冗長的資料簡化,能夠更清晰地反映出兩變量之間相關關系。雙變量分組相關表:自變量和因變量都進行分組而制成的相關表,這種表形似棋盤,故又稱棋盤式相關表。
2)相關圖
利用直角坐標系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量相對應的變量值用坐標點形式描繪出來,用以表明相關點分布狀況的圖形。相關圖被形象地稱為相關散點圖。
因素標志分了組,結果標志表現為組平均數,所繪制的相關圖就是一條折線,這種折線又叫相關曲線。
3)相關系數
相關系數是按積差方法計算,同樣以兩變量與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變量之間相關程度;著重研究線性的單相關系數。
2、確定相關關系的數學表達式。
3、確定因變量估計值誤差的程度。