(一)整理資料
整理資料的過程一般包括:①對原始資料進行審核,訂正。審核所有被調查單位的資料是否齊全,有無差錯,并對差錯進行審核訂正。②編碼。將問卷的信息(包括調查問題和答案)轉化為同一設計的計算機可識別的代碼。③數據的錄人。對于計算機輔助電話調查,計算機輔助面訪以及網絡調查,數據的收集與錄人可以同時進行,無須再進行數據的錄人。對于面訪,郵寄調查等,還需要對數據進行錄人。④數據的清潔和預處理。在調查的清潔和預處理階段,主要的工作是進行一致性檢查和邏輯檢查,以及缺失數據的處理,而對于缺失數據的處理方法主要有刪除個案,刪除缺失值,插補法以及加權組調整法等。
對原始資料進行了上述整理之后,便可以開始進行資料統計分析了。統計分析是運用統計學的方法對調查所得的數據資料進行定量分析,以揭示事物內在的數量關系、規律和發展趨勢的一種資料分析方法。常用的統計方法有很多,主要有描述分析、推理分析、多元統計等。
(二)描述分析
描述分析主要著重于對數量水平或其他特征的描述,通過具體指標反映某一方面的特征。
1。單變量集中趨勢分析
集中趨勢就是一組數據的代表值,它能說明一組數據的一部分全貌,即它們的典型情況。它用一個典型值來代表變量所擁有的所有數據。這樣一個典型值就叫做集中趨勢統計量。常用的指標有:平均數、中位數和眾數。
平均數適用于定距或定比變量,其優點是資料利用率比較高。受每個觀察值影響比較穩定,而缺點是容易受極端數值的影響,如果觀測值中有明顯的極端值,則平均數的代表性較差。
中位數適用于定序、定距、定比變量。特別是分布不規則的數據,其優點是不受極端數值的影響,而缺點是沒有充分利用資料的全部信息,穩定性差于平均數,優于眾數。
眾數主要適用于定類、定序變量,其優點是不受極端值的影響,尤其是分布明顯呈偏態時,眾數的代表性更好,而缺點是沒有充分利用資料的全部信息,缺乏敏感性和穩定性。
2。離散趨勢分析
集中趨勢反映了一組數據的典型情況。但是各個數據之間仍然存在著差異,還不足以反映這組數據的全貌。因此,要全面反映數據的規律性,除了反映數據的一般水平之外,還要反映數據的離散水平。所謂的離散水平是指數據對集中趨勢的偏離程度,如果數據的離散程度越大,則集中趨勢對該組數據的代表性越差。如果離散程度越小,則集中趨勢的代表性越好。常用的反映離散程度的指標主要有異眾比率、四分位差、標準差等。
3。多變量相關分析
相關就是指變量與變量之間的相互關系。有的關系是確定性的,也就是說當一個變量確定之后,另一個變量也就完全確定了,比如圓的面積與半徑的關系,當半徑知道了,圓的面積也就知道了。這種關系稱之為函數關系。
而有的關系卻不那么明確。一個變量確定了,但另一個變量卻不確定。比如農作物的產量除了施肥量的影響外,還受氣候、土壤等許多因素的影響。在收人確定的情況下,消費者的購買行為還與商場促銷、購物環境、同事的評價等息息相關。這些現象表面上看起來并不相關,但是通過大量的調查研究還是可以發現其中某些變量之間是有
規律可循的。
把這些變量之間的相互關系稱之為相關關系,而對于這類相關關系的研究理論和方法稱之為相關分析。
變量之間的相關關系主要有線性相關和非線性相關、正相關和負相關等。如果變量之間的關系近似的表現為一條直線,則稱之為線性相關。在線性相關中,如果兩個變量的變化關系相同,當一個變量增大或減小時。另一個變量的數值也隨著增大或減小,則稱之為正相關。如果變化關系相反,稱之為負相關。
(三)推理分析
在市場調研中,通常很少做普查,更多地是進行抽樣調查。這樣,必須除了對樣本數據的特征進行描述之外,還需要根據樣本的特征對總體作出推斷,這就是推理分析。推理分析主要包括參數估計和假設檢驗。
參數估計是根據樣本的情況來枯計總體的情況。而假設檢驗是先假設總體的情況,然后以一個隨機樣本的統計值來檢驗這個假設是否正確,二者在邏輯上略有不同。