將定量調查或者其他消費者數據進行聚類分析,再通過交叉分析描述細分市場輪廓是我們常用的方法。 聚類分析可以作為其他多元統計分析的預備過程,先聚類,然后再利用判別分析進一步研究各個群體之間的差異。先通過聚類分析達到簡化數據的目的,將眾多的個體先聚集成比較好處理的幾個類別或子集,然后再進行后續的多元分析。它也可以用于抽樣設計中的分層抽樣。
對一個數據,既可以對變量(指標)進行分類,也可以對觀測值來分類。分類的時候,不一定要事先假定有多少類,也可以完全根據數據自身的規律來分類。一般將變量的聚類分析稱為R型聚類,而對觀測值聚類稱為Q型聚類。
聚類分析中,比較重要的概念涉及到對兩個距離概念的認識。搞清楚這兩個距離概念對于聚類分析本身具有很大的幫助。按照遠近程度來聚類是聚類分析法的要義,那么這個遠近究竟指什么呢?一指點與點之間的距離,二是類和類之間的距離。點間距離本身有多個定義方式也即多種運算方法。因此,你只要選擇一種算法即可。由一個點組成的類是最基本的類;如果每一類都由一個點組成,那么點間距離就是類間距離。但是如果一個類包含不止一個點,那么就需要確定類間距離。類間距離是基于點間距離定義的。如兩類之間最近點之間的距離可以作為兩類間距離,也可以選用最遠點的距離,還可以選擇各類之間的中心距離。