網(wǎng)站制作最便宜比較靠譜的推廣公司
福爾克斯–馬洛斯指數(shù)(Fowlkes–Mallows Index, FMI)是一種用于評(píng)估聚類結(jié)果與實(shí)際標(biāo)簽之間一致性的指標(biāo)。FMI 值可以用于衡量聚類的準(zhǔn)確性,特別是在有真值標(biāo)簽的監(jiān)督評(píng)估場(chǎng)景中。
計(jì)算公式
FMI 的計(jì)算基于以下公式:
其中:
- TP(True Positive):聚類中正確地將同一類別的樣本分到同一簇的對(duì)數(shù)。
- FP(False Positive):聚類中錯(cuò)誤地將不同類別的樣本分到同一簇的對(duì)數(shù)。
- FN(False Negative):聚類中錯(cuò)誤地將同一類別的樣本分到不同簇的對(duì)數(shù)。
FMI 是基于樣本對(duì)(pairwise)的評(píng)價(jià)方法,它考慮了聚類結(jié)果與實(shí)際標(biāo)簽在配對(duì)樣本之間的一致性。
FMI 的取值范圍
- FMI∈[0,1]
- 值越接近 1,表示聚類結(jié)果與實(shí)際標(biāo)簽越一致。
- 值越接近 0,表示聚類結(jié)果與實(shí)際標(biāo)簽基本無(wú)關(guān)。
優(yōu)點(diǎn)
- 平衡性:FMI 通過(guò)結(jié)合精確率(Precision)和召回率(Recall)的平方根,能夠綜合反映聚類的性能。
- 可解釋性強(qiáng):與常見(jiàn)的分類指標(biāo)類似,易于理解和分析。
- 適用于有標(biāo)簽數(shù)據(jù):特別適用于監(jiān)督學(xué)習(xí)場(chǎng)景下的聚類結(jié)果評(píng)估。
缺點(diǎn)
- 對(duì)類別不平衡敏感:當(dāng)數(shù)據(jù)的類別分布不均衡時(shí),FMI 的結(jié)果可能會(huì)受到影響。
- 計(jì)算成本較高:在大規(guī)模數(shù)據(jù)集上,由于需要計(jì)算所有樣本對(duì)之間的關(guān)系,計(jì)算開(kāi)銷可能較大。
應(yīng)用場(chǎng)景
- 聚類性能評(píng)估:用于評(píng)價(jià)聚類算法在有真值標(biāo)簽數(shù)據(jù)集上的性能。
- 多模態(tài)數(shù)據(jù)對(duì)齊:在多模態(tài)單細(xì)胞分析中,FMI 可用于衡量不同模態(tài)數(shù)據(jù)對(duì)齊結(jié)果的優(yōu)劣。
- 模型比較:在聚類算法的對(duì)比實(shí)驗(yàn)中,FMI 常作為關(guān)鍵評(píng)估指標(biāo)之一。
常見(jiàn)的有監(jiān)督評(píng)價(jià)方式
以下是一些典型的有監(jiān)督聚類評(píng)價(jià)指標(biāo)及其特點(diǎn):
-
調(diào)整蘭德指數(shù)(ARI, Adjusted Rand Index): 衡量?jī)蓚€(gè)聚類(算法結(jié)果 vs. 真值標(biāo)簽)的一致性,調(diào)整了隨機(jī)聚類帶來(lái)的影響。
-
歸一化互信息(NMI, Normalized Mutual Information): 測(cè)量聚類結(jié)果與真值標(biāo)簽之間的信息共享,值越大表明聚類質(zhì)量越高。
-
聚類準(zhǔn)確率(CA, Clustering Accuracy): 簡(jiǎn)單地計(jì)算聚類結(jié)果與真值標(biāo)簽匹配的準(zhǔn)確率。
-
福爾克斯–馬洛斯指數(shù)(FMI, Fowlkes-Mallows Index): 衡量聚類中同類點(diǎn)和異類點(diǎn)的正確劃分比例,尤其對(duì)簇大小不平衡問(wèn)題敏感。
聚類評(píng)價(jià)中的注意事項(xiàng)
-
真值標(biāo)簽的質(zhì)量: 如果“真值”標(biāo)簽本身不可靠(如細(xì)胞類型標(biāo)簽的分類標(biāo)準(zhǔn)主觀性較強(qiáng)),則評(píng)價(jià)結(jié)果可能存在偏差。
-
不依賴標(biāo)簽的無(wú)監(jiān)督評(píng)價(jià): 除了上述有監(jiān)督指標(biāo),還可以采用無(wú)監(jiān)督指標(biāo),如輪廓系數(shù)(Silhouette Coefficient)或聚類內(nèi)的平方誤差(SSE),來(lái)評(píng)價(jià)聚類效果。
-
真實(shí)應(yīng)用場(chǎng)景: 在實(shí)際無(wú)標(biāo)注場(chǎng)景中,我們無(wú)法依賴有監(jiān)督指標(biāo),這時(shí)需要結(jié)合領(lǐng)域知識(shí)或其他方式驗(yàn)證聚類的意義。