廣東策智市場信息咨詢股份有限公司
        公司地址:廣州市天河區(qū)林和中路188號附樓三樓A之D08
        其它地址:湖南省長沙市天心區(qū)勞動西路293號嘉盛奧美城1708室 ;湖北省武漢市建設(shè)大道538號同城廣場A棟1202;
        聯(lián)系電話:13148420404
        公司傳真:020-29819059
        辦公手機:18620250304
        官方網(wǎng)址:http://m.phosphatechemical.com/
        企業(yè)郵箱:guangdongcezhi@163.com
        行業(yè)動態(tài)
        您當(dāng)前位置:首頁 > 行業(yè)動態(tài)
        市場研究方法之聚類分析
        信息來源:   發(fā)布時間:2016-4-25   瀏覽:

        什么是聚類分析


        聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。

        聚類與分類的不同在于,聚類所要求劃分的類是未知的。

        聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。

        聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。聚類源于很多領(lǐng)域,包括數(shù)學(xué),計算機科學(xué),統(tǒng)計學(xué),生物學(xué)和經(jīng)濟學(xué)。在不同的應(yīng)用領(lǐng)域,很多聚類技術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類到不同的簇中。

        從統(tǒng)計學(xué)的觀點看,聚類分析是通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法。傳統(tǒng)的統(tǒng)計聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。采用k-均值、k-中心點等算法的聚類分析工具已被加入到許多著名的統(tǒng)計分析軟件包中,如SPSS、SAS等。

        從機器學(xué)習(xí)的角度講,簇相當(dāng)于隱藏模式。聚類是搜索簇的無監(jiān)督學(xué)習(xí)過程。與分類不同,無監(jiān)督學(xué)習(xí)不依賴預(yù)先定義的類或帶類標(biāo)記的訓(xùn)練實例,需要由聚類學(xué)習(xí)算法自動確定標(biāo)記,而分類學(xué)習(xí)的實例或數(shù)據(jù)對象有類別標(biāo)記。聚類是觀察式學(xué)習(xí),而不是示例式的學(xué)習(xí)。

        從實際應(yīng)用的角度看,聚類分析是數(shù)據(jù)挖掘的主要任務(wù)之一。而且聚類能夠作為一個獨立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇數(shù)據(jù)的特征,集中對特定的聚簇集合作進一步地分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。


        聚類分析的主要應(yīng)用


        在商業(yè)上

        聚類分析被用來發(fā)現(xiàn)不同的客戶群,并且通過購買模式刻畫不同的客戶群的特征。

        聚類分析是細(xì)分市場的有效工具,同時也可用于研究消費者行為,尋找新的潛在市場、選擇實驗的市場,并作為多元分析的預(yù)處理。

        在生物上

        聚類分析被用來動植物分類和對基因進行分類,獲取對種群固有結(jié)構(gòu)的認(rèn)識

        在地理上

        聚類能夠幫助在地球中被觀察的數(shù)據(jù)庫商趨于的相似性

        在保險行業(yè)上

        聚類分析通過一個高的平均消費來鑒定汽車保險單持有者的分組,同時根據(jù)住宅類型,價值,地理位置來鑒定一個城市的房產(chǎn)分組

        在因特網(wǎng)應(yīng)用上

        聚類分析被用來在網(wǎng)上進行文檔歸類來修復(fù)信息

        在電子商務(wù)上

        聚類分析在電子商務(wù)中網(wǎng)站建設(shè)數(shù)據(jù)挖掘中也是很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,可以更好的幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。


        聚類分析的主要步驟


        1.數(shù)據(jù)預(yù)處理,

        2.為衡量數(shù)據(jù)點間的相似度定義一個距離函數(shù),

        3.聚類或分組,

        4.評估輸出。

        數(shù)據(jù)預(yù)處理包括選擇數(shù)量,類型和特征的標(biāo)度,它依靠特征選擇和特征抽取,特征選擇選擇重要的特征,特征抽取把輸入的特征轉(zhuǎn)化為一個新的顯著特征,它們經(jīng)常被用來獲取一個合適的特征集來為避免“維數(shù)災(zāi)”進行聚類,數(shù)據(jù)預(yù)處理還包括將孤立點移出數(shù)據(jù),孤立點是不依附于一般數(shù)據(jù)行為或模型的數(shù)據(jù),因此孤立點經(jīng)常會導(dǎo)致有偏差的聚類結(jié)果,因此為了得到正確的聚類,我們必須將它們剔除。

        既然相類似性是定義一個類的基礎(chǔ),那么不同數(shù)據(jù)之間在同一個特征空間相似度的衡量對于聚類步驟是很重要的,由于特征類型和特征標(biāo)度的多樣性,距離度量必須謹(jǐn)慎,它經(jīng)常依賴于應(yīng)用,例如,通常通過定義在特征空間的距離度量來評估不同對象的相異性,很多距離度都應(yīng)用在一些不同的領(lǐng)域,一個簡單的距離度量,如Euclidean距離,經(jīng)常被用作反映不同數(shù)據(jù)間的相異性,一些有關(guān)相似性的度量,例如PMC和SMC,能夠被用來特征化不同數(shù)據(jù)的概念相似性,在圖像聚類上,子圖圖像的誤差更正能夠被用來衡量兩個圖形的相似性。

        將數(shù)據(jù)對象分到不同的類中是一個很重要的步驟,數(shù)據(jù)基于不同的方法被分到不同的類中,劃分方法和層次方法是聚類分析的兩個主要方法,劃分方法一般從初始劃分和最優(yōu)化一個聚類標(biāo)準(zhǔn)開始。CrispClustering,它的每一個數(shù)據(jù)都屬于單獨的類;FuzzyClustering,它的每個數(shù)據(jù)可能在任何一個類中,CrispClustering和FuzzyClusterin是劃分方法的兩個主要技術(shù),劃分方法聚類是基于某個標(biāo)準(zhǔn)產(chǎn)生一個嵌套的劃分系列,它可以度量不同類之間的相似性或一個類的可分離性用來合并和分裂類,其他的聚類方法還包括基于密度的聚類,基于模型的聚類,基于網(wǎng)格的聚類。

        評估聚類結(jié)果的質(zhì)量是另一個重要的階段,聚類是一個無管理的程序,也沒有客觀的標(biāo)準(zhǔn)來評價聚類結(jié)果,它是通過一個類有效索引來評價,一般來說,幾何性質(zhì),包括類間的分離和類內(nèi)部的耦合,一般都用來評價聚類結(jié)果的質(zhì)量,類有效索引在決定類的數(shù)目時經(jīng)常扮演了一個重要角色,類有效索引的最佳值被期望從真實的類數(shù)目中獲取,一個通常的決定類數(shù)目的方法是選擇一個特定的類有效索引的最佳值,這個索引能否真實的得出類的數(shù)目是判斷該索引是否有效的標(biāo)準(zhǔn),很多已經(jīng)存在的標(biāo)準(zhǔn)對于相互分離的類數(shù)據(jù)集合都能得出很好的結(jié)果,但是對于復(fù)雜的數(shù)據(jù)集,卻通常行不通,例如,對于交疊類的集合。


        聚類分析的算法


        聚類分析是數(shù)據(jù)挖掘中的一個很活躍的研究領(lǐng)域,并提出了許多聚類算法。傳統(tǒng)的聚類算法可以被分為五類:劃分方法、層次方法、基于密度方法、基于網(wǎng)格方法和基于模型方法。


        相關(guān)熱點
        版權(quán)所有  廣東策智市場信息咨詢股份有限公司 http://m.phosphatechemical.com/ 
        公司地址:廣州市天河區(qū)林和中路188號附樓三樓A之D08 分公司地址:湖南省長沙市天心區(qū)勞動西路293號嘉盛奧美城1708室 ;湖北省武漢市建設(shè)大道538號同城廣場A棟1202; 
        電話:13148420404  手機:18620250304  傳真:020-29819059 聯(lián)系人:胡先生 
        網(wǎng)站ICP備案號:粵ICP備2023013887號-1  術(shù)支持:斌網(wǎng)網(wǎng)絡(luò)
        在線客服 資深顧問

        亚洲午夜福利精品久久| 2021日韩麻豆| 911精品国产亚洲日本美国韩国| 手机在线观看精品国产片| 麻豆精品一区二区综合av| 日韩日韩日韩手机看片自拍| 免费看国产精品3a黄的视频| 老司机在线精品视频| 麻豆国产精品无码视频| 久久66热这里只会有精品| 亚洲精品夜夜夜妓女网| 91国在线啪精品一区| 国产精品天干天干在线综合| 午夜精品久久久久久影视777 | 国产精品久久久久久无毒不卡| 日韩精品一卡2卡3卡4卡新区乱码 日韩精品一线二线三线优势 | 国产日韩视频在线观看| 国产成人精品无缓存在线播放| 国产精品videossexohd| 人妻少妇精品无码专区漫画| 无码成人精品区在线观看 | 日韩高清免费观看| 日韩午夜理论免费TV影院| 国产乱人伦真实精品视频| 国产精品免费视频网站| 国产精品最新资源网| 尤物在线观看精品国产福利片 | 日韩高清在线日韩大片观看网址| 日韩一区二区三区在线观看| 国产伦精品一区二区| 国产精品午夜福利在线观看地址| 麻豆国产VA免费精品高清在线| 尤物国午夜精品福利网站| 成人无码精品一区二区三区| 国内精品福利在线视频| 日本久久中文字幕精品| 国产精品另类激情久久久免费| 日韩毛片一区视频免费| 久久亚洲日韩精品一区二区三区| 日韩欧毛片免费视频| 人妻精品久久久久中文字幕 |