(一)整理資料
整理資料的過(guò)程一般包括:①對(duì)原始資料進(jìn)行審核,訂正。審核所有被調(diào)查單位的資料是否齊全,有無(wú)差錯(cuò),并對(duì)差錯(cuò)進(jìn)行審核訂正。②編碼。將問(wèn)卷的信息(包括調(diào)查問(wèn)題和答案)轉(zhuǎn)化為同一設(shè)計(jì)的計(jì)算機(jī)可識(shí)別的代碼。③數(shù)據(jù)的錄人。對(duì)于計(jì)算機(jī)輔助電話調(diào)查,計(jì)算機(jī)輔助面訪以及網(wǎng)絡(luò)調(diào)查,數(shù)據(jù)的收集與錄人可以同時(shí)進(jìn)行,無(wú)須再進(jìn)行數(shù)據(jù)的錄人。對(duì)于面訪,郵寄調(diào)查等,還需要對(duì)數(shù)據(jù)進(jìn)行錄人。④數(shù)據(jù)的清潔和預(yù)處理。在調(diào)查的清潔和預(yù)處理階段,主要的工作是進(jìn)行一致性檢查和邏輯檢查,以及缺失數(shù)據(jù)的處理,而對(duì)于缺失數(shù)據(jù)的處理方法主要有刪除個(gè)案,刪除缺失值,插補(bǔ)法以及加權(quán)組調(diào)整法等。
對(duì)原始資料進(jìn)行了上述整理之后,便可以開(kāi)始進(jìn)行資料統(tǒng)計(jì)分析了。統(tǒng)計(jì)分析是運(yùn)用統(tǒng)計(jì)學(xué)的方法對(duì)調(diào)查所得的數(shù)據(jù)資料進(jìn)行定量分析,以揭示事物內(nèi)在的數(shù)量關(guān)系、規(guī)律和發(fā)展趨勢(shì)的一種資料分析方法。常用的統(tǒng)計(jì)方法有很多,主要有描述分析、推理分析、多元統(tǒng)計(jì)等。
(二)描述分析
描述分析主要著重于對(duì)數(shù)量水平或其他特征的描述,通過(guò)具體指標(biāo)反映某一方面的特征。
1。單變量集中趨勢(shì)分析
集中趨勢(shì)就是一組數(shù)據(jù)的代表值,它能說(shuō)明一組數(shù)據(jù)的一部分全貌,即它們的典型情況。它用一個(gè)典型值來(lái)代表變量所擁有的所有數(shù)據(jù)。這樣一個(gè)典型值就叫做集中趨勢(shì)統(tǒng)計(jì)量。常用的指標(biāo)有:平均數(shù)、中位數(shù)和眾數(shù)。
平均數(shù)適用于定距或定比變量,其優(yōu)點(diǎn)是資料利用率比較高。受每個(gè)觀察值影響比較穩(wěn)定,而缺點(diǎn)是容易受極端數(shù)值的影響,如果觀測(cè)值中有明顯的極端值,則平均數(shù)的代表性較差。
中位數(shù)適用于定序、定距、定比變量。特別是分布不規(guī)則的數(shù)據(jù),其優(yōu)點(diǎn)是不受極端數(shù)值的影響,而缺點(diǎn)是沒(méi)有充分利用資料的全部信息,穩(wěn)定性差于平均數(shù),優(yōu)于眾數(shù)。
眾數(shù)主要適用于定類、定序變量,其優(yōu)點(diǎn)是不受極端值的影響,尤其是分布明顯呈偏態(tài)時(shí),眾數(shù)的代表性更好,而缺點(diǎn)是沒(méi)有充分利用資料的全部信息,缺乏敏感性和穩(wěn)定性。
2。離散趨勢(shì)分析
集中趨勢(shì)反映了一組數(shù)據(jù)的典型情況。但是各個(gè)數(shù)據(jù)之間仍然存在著差異,還不足以反映這組數(shù)據(jù)的全貌。因此,要全面反映數(shù)據(jù)的規(guī)律性,除了反映數(shù)據(jù)的一般水平之外,還要反映數(shù)據(jù)的離散水平。所謂的離散水平是指數(shù)據(jù)對(duì)集中趨勢(shì)的偏離程度,如果數(shù)據(jù)的離散程度越大,則集中趨勢(shì)對(duì)該組數(shù)據(jù)的代表性越差。如果離散程度越小,則集中趨勢(shì)的代表性越好。常用的反映離散程度的指標(biāo)主要有異眾比率、四分位差、標(biāo)準(zhǔn)差等。
3。多變量相關(guān)分析
相關(guān)就是指變量與變量之間的相互關(guān)系。有的關(guān)系是確定性的,也就是說(shuō)當(dāng)一個(gè)變量確定之后,另一個(gè)變量也就完全確定了,比如圓的面積與半徑的關(guān)系,當(dāng)半徑知道了,圓的面積也就知道了。這種關(guān)系稱之為函數(shù)關(guān)系。
而有的關(guān)系卻不那么明確。一個(gè)變量確定了,但另一個(gè)變量卻不確定。比如農(nóng)作物的產(chǎn)量除了施肥量的影響外,還受氣候、土壤等許多因素的影響。在收人確定的情況下,消費(fèi)者的購(gòu)買行為還與商場(chǎng)促銷、購(gòu)物環(huán)境、同事的評(píng)價(jià)等息息相關(guān)。這些現(xiàn)象表面上看起來(lái)并不相關(guān),但是通過(guò)大量的調(diào)查研究還是可以發(fā)現(xiàn)其中某些變量之間是有
規(guī)律可循的。
把這些變量之間的相互關(guān)系稱之為相關(guān)關(guān)系,而對(duì)于這類相關(guān)關(guān)系的研究理論和方法稱之為相關(guān)分析。
變量之間的相關(guān)關(guān)系主要有線性相關(guān)和非線性相關(guān)、正相關(guān)和負(fù)相關(guān)等。如果變量之間的關(guān)系近似的表現(xiàn)為一條直線,則稱之為線性相關(guān)。在線性相關(guān)中,如果兩個(gè)變量的變化關(guān)系相同,當(dāng)一個(gè)變量增大或減小時(shí)。另一個(gè)變量的數(shù)值也隨著增大或減小,則稱之為正相關(guān)。如果變化關(guān)系相反,稱之為負(fù)相關(guān)。
(三)推理分析
在市場(chǎng)調(diào)研中,通常很少做普查,更多地是進(jìn)行抽樣調(diào)查。這樣,必須除了對(duì)樣本數(shù)據(jù)的特征進(jìn)行描述之外,還需要根據(jù)樣本的特征對(duì)總體作出推斷,這就是推理分析。推理分析主要包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。
參數(shù)估計(jì)是根據(jù)樣本的情況來(lái)枯計(jì)總體的情況。而假設(shè)檢驗(yàn)是先假設(shè)總體的情況,然后以一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)檢驗(yàn)這個(gè)假設(shè)是否正確,二者在邏輯上略有不同。