上海設(shè)計(jì)網(wǎng)站baidu百度
代碼地址:https://github. com/TopoXLab/MCSpatNet
摘要
在數(shù)字病理學(xué)中,細(xì)胞的檢測(cè)與分類對(duì)于自動(dòng)化的診斷和預(yù)后任務(wù)都至關(guān)重要。將細(xì)胞劃分為不同亞型(如腫瘤細(xì)胞、淋巴細(xì)胞或基質(zhì)細(xì)胞)尤其具有挑戰(zhàn)性。現(xiàn)有方法多側(cè)重于單個(gè)細(xì)胞的形態(tài)特征,而在實(shí)際操作中,病理學(xué)家常常依賴細(xì)胞的空間上下文來推斷其類別。本文提出了一種新穎的方法,能夠同時(shí)實(shí)現(xiàn)細(xì)胞的檢測(cè)與分類,并明確引入空間上下文信息。我們采用空間統(tǒng)計(jì)函數(shù),從多類別和多尺度的角度描述局部密度。通過表征學(xué)習(xí)與深度聚類技術(shù),我們獲得了融合形態(tài)特征與空間上下文的高級(jí)細(xì)胞表示。在多個(gè)基準(zhǔn)數(shù)據(jù)集上,我們的方法在性能上優(yōu)于現(xiàn)有的先進(jìn)方法,尤其在細(xì)胞分類任務(wù)中表現(xiàn)更為出色。
引言
我們提出了首個(gè)聯(lián)合細(xì)胞檢測(cè)與分類的方法,該方法首次顯式學(xué)習(xí)了細(xì)胞的空間上下文感知表示。我們證明,引入空間上下文可以顯著提升性能,尤其是在細(xì)胞分類任務(wù)中。
在數(shù)字病理學(xué)中,從全片組織切片圖像中識(shí)別各種類型的細(xì)胞(如腫瘤細(xì)胞、淋巴細(xì)胞和基質(zhì)細(xì)胞)是實(shí)現(xiàn)自動(dòng)診斷和預(yù)后的關(guān)鍵步驟。不同類型細(xì)胞的空間分布模式能夠全面表征腫瘤與免疫細(xì)胞間的相互作用,并與臨床結(jié)果密切相關(guān) [29, 48, 23]。一個(gè)典型的例子是腫瘤浸潤(rùn)性淋巴細(xì)胞(TILs)的檢測(cè)與量化,即分布在侵襲性腫瘤邊緣內(nèi)部的淋巴細(xì)胞 [36]。研究表明,TILs 的豐富程度與更好的臨床結(jié)果相關(guān) [37, 38, 41]。除了淋巴細(xì)胞之外,在侵襲性腫瘤前沿出現(xiàn)的孤立或小簇腫瘤細(xì)胞(稱為腫瘤芽生)也是一種預(yù)后生物標(biāo)志物,與結(jié)直腸癌及其他實(shí)體瘤中淋巴結(jié)轉(zhuǎn)移風(fēng)險(xiǎn)增加有關(guān) [28]。其他示例還包括對(duì)淋巴血管侵犯和神經(jīng)周圍侵犯的評(píng)估 [27],以及在乳糜瀉診斷中對(duì)上皮內(nèi)淋巴細(xì)胞的識(shí)別與量化 [34]。所有這些研究都需要一種高效算法,來準(zhǔn)確識(shí)別不同類型的細(xì)胞。
多類別細(xì)胞識(shí)別任務(wù)既包含細(xì)胞檢測(cè),也包含細(xì)胞分類。過去幾十年,細(xì)胞檢測(cè)已經(jīng)得到了廣泛研究 [40, 21, 45]?,F(xiàn)有方法主要分為兩類:一類是借用計(jì)算機(jī)視覺中的目標(biāo)檢測(cè)算法 [20, 47],另一類是將其視為實(shí)例分割問題,對(duì)細(xì)胞核逐個(gè)分割 [18, 19, 32, 25, 30]。盡管分割方法能提供詳細(xì)的細(xì)胞核形態(tài),但訓(xùn)練這些方法需要高度精細(xì)的細(xì)胞核掩膜標(biāo)注,耗時(shí)耗力。為了解決這一瓶頸問題,研究者提出了弱監(jiān)督方法 [31, 46, 43, 11],僅依賴于點(diǎn)注釋(即標(biāo)注在細(xì)胞核中心的點(diǎn))來進(jìn)行分割。點(diǎn)注釋是一種更具成本效益的大規(guī)模訓(xùn)練標(biāo)注形式。
盡管在細(xì)胞檢測(cè)方面取得了顯著進(jìn)展,細(xì)胞分類的研究進(jìn)展卻相對(duì)緩慢。實(shí)際上,即便對(duì)于人類專家而言,細(xì)胞分類仍是一項(xiàng)頗具挑戰(zhàn)的任務(wù)。不同類型的細(xì)胞可能具有相似的外觀特征;而同類型細(xì)胞在腫瘤或炎癥區(qū)域中可能在形態(tài)和紋理上存在很大差異。要在如此復(fù)雜的背景下實(shí)現(xiàn)準(zhǔn)確分類,病理學(xué)家不僅依賴細(xì)胞外觀,還依賴于其周圍細(xì)胞的上下文信息、空間關(guān)系和組織結(jié)構(gòu)。例如,退變或凋亡細(xì)胞往往聚集在形成腺體的腫瘤的腔隙中,即便它們呈現(xiàn)多種不同的形態(tài)特征,也能在這種空間結(jié)構(gòu)中被識(shí)別;類似地,當(dāng)反應(yīng)性基質(zhì)細(xì)胞與腫瘤細(xì)胞的形態(tài)和染色質(zhì)模式難以區(qū)分時(shí),組織結(jié)構(gòu)模式也可輔助其鑒別。
因此,設(shè)計(jì)理想的分類算法,關(guān)鍵在于模仿病理學(xué)家的診斷邏輯,將空間上下文納入決策過程。與僅隱式學(xué)習(xí)上下文的方法不同 [19, 40],我們提出了一種新型算法,明確利用空間上下文進(jìn)行學(xué)習(xí)。為建??臻g上下文,我們引入了經(jīng)典的空間統(tǒng)計(jì)學(xué)函數(shù)——Ripley 的 K 函數(shù) [15]。K 函數(shù)能夠以多類別、多尺度的方式編碼細(xì)胞之間的空間關(guān)系,被證明是刻畫細(xì)胞結(jié)構(gòu)的有力工具 [48, 7]。但現(xiàn)有研究大多僅將 K 函數(shù)用于下游分析,而非用于提升細(xì)胞識(shí)別性能。
本研究的一個(gè)核心挑戰(zhàn)在于:空間上下文在推理階段是不可直接獲得的——因?yàn)樵谖醋R(shí)別出細(xì)胞及其類別之前,無法計(jì)算 K 函數(shù)。為此,我們假設(shè)深度神經(jīng)網(wǎng)絡(luò)具有足夠的學(xué)習(xí)能力,并提出通過多任務(wù)學(xué)習(xí)框架來學(xué)習(xí)空間上下文感知的表示。我們訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò),聯(lián)合完成細(xì)胞檢測(cè)、細(xì)胞分類和空間上下文預(yù)測(cè)(即預(yù)測(cè) K 函數(shù))。在訓(xùn)練過程中,網(wǎng)絡(luò)能夠?qū)W習(xí)融合了外觀特征與空間上下文的細(xì)胞表示。在推理階段,僅使用檢測(cè)與分類模塊即可獲得優(yōu)異表現(xiàn),得益于訓(xùn)練時(shí)學(xué)到的空間感知能力。圖1展示了該過程的示意。
在多任務(wù)框架下進(jìn)行學(xué)習(xí)具有一定挑戰(zhàn)性,因?yàn)檫@些任務(wù)本質(zhì)上差異較大。細(xì)胞檢測(cè)與分類模塊輸出的是類別標(biāo)簽,而空間上下文預(yù)測(cè)模塊則需輸出高維連續(xù)值向量(K 函數(shù))。為更好地融合這些任務(wù),我們引入了一個(gè)深度聚類模塊,靈感來自無監(jiān)督和弱監(jiān)督學(xué)習(xí)的相關(guān)研究 [10, 13]。該模塊中,我們對(duì)深度表示進(jìn)行聚類,生成偽標(biāo)簽,這些偽標(biāo)簽在細(xì)胞類別標(biāo)簽與 K 函數(shù)之間建立了連接,促進(jìn)了各模塊的協(xié)同與外觀信息與空間信息的融合。圖2展示了我們模型的整體結(jié)構(gòu)。
我們將所提出的方法命名為 MCSpatNet,并應(yīng)用于細(xì)胞聯(lián)合檢測(cè)與分類任務(wù)。我們?cè)谌齻€(gè)多類別點(diǎn)注釋基準(zhǔn)數(shù)據(jù)集(乳腺癌、結(jié)直腸癌和肺癌)上對(duì)該方法進(jìn)行了評(píng)估。結(jié)果表明,我們的方法在性能上超越了多種現(xiàn)有先進(jìn)方法,驗(yàn)證了空間上下文感知表示的有效性。
綜上所述,我們的主要貢獻(xiàn)如下:
-
提出了一種新穎的細(xì)胞檢測(cè)與分類方法,首次通過多任務(wù)學(xué)習(xí)顯式學(xué)習(xí)細(xì)胞的空間上下文感知表示;
-
引入空間統(tǒng)計(jì)函數(shù)(K 函數(shù))作為細(xì)胞空間上下文的有效描述方式;
-
引入空間上下文預(yù)測(cè)模塊與深度聚類模塊,促進(jìn)空間與外觀特征的融合學(xué)習(xí)。
模型
我們提出了一種用于 H&E 染色圖像中細(xì)胞聯(lián)合檢測(cè)與分類 的方法。模型的預(yù)測(cè)結(jié)果和真實(shí)標(biāo)注都是多類別的點(diǎn)標(biāo)注形式:每個(gè)點(diǎn)位于細(xì)胞核的近似中心位置,并附帶細(xì)胞的類別標(biāo)簽,包括 炎性細(xì)胞(inflammatory)、上皮細(xì)胞(epithelial) 和 基質(zhì)細(xì)胞(stromal)。如圖3所示提供了示意。
我們模型由多個(gè)執(zhí)行不同任務(wù)的模塊組成。這些模塊共享相同的輸入和特征提取器,但各自擁有獨(dú)立的卷積層塊,用于完成其特定的預(yù)測(cè)任務(wù)。通過這種方式,各模塊可以在共享表示的基礎(chǔ)上協(xié)同學(xué)習(xí)而不會(huì)互相干擾。
模型架構(gòu)如圖2所示。除了細(xì)胞檢測(cè)與分類模塊外,我們的方法還引入了兩個(gè)額外模塊:
-
空間分布預(yù)測(cè)模塊(Spatial Distribution Prediction Module):該模塊學(xué)習(xí)預(yù)測(cè)細(xì)胞相關(guān)的空間統(tǒng)計(jì)函數(shù),從而具備了匯聚描述空間上下文信息的能力。
-
基于細(xì)胞級(jí)別的深度聚類模塊(Cell-level Deep Clustering Module):該模塊根據(jù)細(xì)胞的特征表示進(jìn)行迭代聚類,并預(yù)測(cè)聚類結(jié)果,融合了細(xì)胞的外觀特征和空間上下文,以獲取更優(yōu)的特征表達(dá)。
注:我們的圖像塊選自癌變區(qū)域,因此上皮細(xì)胞均為腫瘤細(xì)胞。
2.1 細(xì)胞的空間上下文建模(Cellular Spatial Context)
我們將一個(gè)細(xì)胞的空間上下文定義為其鄰域中不同類別細(xì)胞的分布情況。為此,我們引入了 Ripley 的 K 函數(shù) ——一種描述點(diǎn)模式的空間統(tǒng)計(jì)函數(shù) [15, 5]。
對(duì)于一個(gè)被關(guān)注的細(xì)胞(稱為“源點(diǎn)”),我們可以統(tǒng)計(jì)其一定距離 r 范圍內(nèi)的鄰居細(xì)胞數(shù)(稱為“目標(biāo)點(diǎn)”)。將所有觀測(cè)點(diǎn)匯總后,K函數(shù)就成為一個(gè)累計(jì)分布函數(shù),表示源點(diǎn)在不斷增大的距離 ri?內(nèi)所預(yù)期的鄰居數(shù)。如圖4所示。
形式上,給定一個(gè)大小為 n 的二維點(diǎn)集 X,K函數(shù)定義如下:
其中:
-
d(s,t)是源點(diǎn) s 與目標(biāo)點(diǎn) t的歐氏距離;
-
???是 Iverson 括號(hào),條件為真時(shí)值為 1,否則為 0;
-
λ是歸一化的強(qiáng)度函數(shù),用于調(diào)整源點(diǎn)密度的影響。
根據(jù)建模假設(shè),λ 可以是常數(shù)(即 \frac{\text{Area}}{n},均質(zhì)情形),也可以依賴于位置(非均質(zhì)情形)。
我們可以將計(jì)算出的 K 函數(shù)與基線進(jìn)行比較,例如與泊松隨機(jī)點(diǎn)過程(Poisson Point Process)對(duì)應(yīng)的 K 函數(shù)比較:
-
當(dāng)目標(biāo) K 函數(shù)高于基線時(shí),表示鄰域中的目標(biāo)點(diǎn)比隨機(jī)分布中期望的更多,說明 存在聚類;
-
當(dāng)目標(biāo) K 函數(shù)低于基線時(shí),說明鄰域中目標(biāo)點(diǎn)比隨機(jī)期望的更少,表現(xiàn)為 離散。
對(duì)于多類別點(diǎn)集,我們將 K 函數(shù)擴(kuò)展為支持源點(diǎn)和目標(biāo)點(diǎn)來自不同類別的情況,此時(shí)該函數(shù)被稱為 K-交叉函數(shù)(K-cross function)。
特異性細(xì)胞的 K 函數(shù)及其向量化
在細(xì)胞檢測(cè)與分類任務(wù)中,我們關(guān)注的是單個(gè)細(xì)胞,而非整個(gè)細(xì)胞群體的空間關(guān)系。對(duì)于給定的源細(xì)胞s,我們限制在其周圍的一個(gè)固定大小區(qū)域內(nèi)進(jìn)行空間上下文分析,僅考慮落在該局部區(qū)域(patch)內(nèi)的目標(biāo)細(xì)胞。我們對(duì)不同類別的目標(biāo)細(xì)胞逐一計(jì)算其空間關(guān)系。對(duì)于類別 c,記 Xsc為以 s 為中心的局部區(qū)域內(nèi)所有類別為 c 的細(xì)胞集合。類別 c 的 K 函數(shù)定義如下:
其中, 表示所有局部區(qū)域內(nèi)目標(biāo)細(xì)胞的最大數(shù)量,用于歸一化處理。
在實(shí)際操作中,我們?cè)O(shè)定局部 patch 的大小為 180 × 180 像素,并在一組有限的半徑值上對(duì) K 函數(shù)進(jìn)行均勻采樣,半徑值為:15, 30, 45, ..., 90 像素。由于我們處理三類細(xì)胞,每類采樣 6 個(gè)半徑,共得到一個(gè) 18 維的向量。我們將其稱為細(xì)胞 sss 的 K 函數(shù)向量(K-function vector)。通過學(xué)習(xí)預(yù)測(cè)這個(gè) K 函數(shù)向量,模型能夠?qū)W習(xí)細(xì)胞的空間表示能力。
K 函數(shù)與細(xì)胞的空間行為
我們通過真實(shí)示例進(jìn)一步說明 K 函數(shù)如何幫助細(xì)化細(xì)胞的空間表示。在圖 5 中,我們可視化了不同類別細(xì)胞及其對(duì)應(yīng)的 K 函數(shù)表現(xiàn)。由于 K 函數(shù)是高維數(shù)據(jù),無法直接可視化其數(shù)值,因此我們將每類細(xì)胞按照其 K 函數(shù)向量進(jìn)行聚類,并使用不同顏色對(duì)不同子類細(xì)胞進(jìn)行可視化(炎性細(xì)胞為深藍(lán)到淺藍(lán),間質(zhì)細(xì)胞為深綠到淺綠,上皮細(xì)胞為深紅到淺紅/粉紅)。
我們觀察到,不同子類細(xì)胞呈現(xiàn)出明顯不同的空間行為特征。例如,上皮細(xì)胞中聚集于腫瘤巢中的細(xì)胞通常屬于粉紅子類,而那些較分散且靠近間質(zhì)細(xì)胞的細(xì)胞屬于紅色子類。間質(zhì)細(xì)胞中,淺綠色子類通??拷渌悇e細(xì)胞(如炎性或上皮細(xì)胞),而深綠色子類則往往遠(yuǎn)離其他細(xì)胞。炎性細(xì)胞也表現(xiàn)出類似趨勢(shì):淺藍(lán)子類較為聚集,深藍(lán)子類較為分散。
此外,圖 6 顯示了不同類別細(xì)胞對(duì)之間的平均 K 函數(shù)結(jié)果,明顯表明不同類別對(duì)的空間行為各不相同。
這些發(fā)現(xiàn)表明,K 函數(shù)可以有效地將細(xì)胞劃分為具有不同空間行為的子類,從而進(jìn)一步推動(dòng)我們通過 K 函數(shù)來學(xué)習(xí)細(xì)胞的空間表示能力。
2.2 空間上下文感知表示的多任務(wù)學(xué)習(xí)
我們提出的模型包含四個(gè)用于不同任務(wù)的模塊:細(xì)胞檢測(cè)、細(xì)胞分類、深度聚類和空間上下文預(yù)測(cè)。這四個(gè)模塊共享一個(gè)特征提取器,該提取器學(xué)習(xí)通用的特征表示。其中,深度聚類模塊和空間上下文預(yù)測(cè)模塊僅在訓(xùn)練階段使用,其目的是學(xué)習(xí)一個(gè)具備空間上下文感知能力的表示,從而提升細(xì)胞檢測(cè)和分類的性能。請(qǐng)參見圖2了解模型架構(gòu)。
特征提取器
特征提取器是一個(gè)U-Net變體,其編碼器采用VGG-16結(jié)構(gòu)。提取器輸出96通道的特征圖,空間分辨率與輸入圖像相同。這一特征表示被四個(gè)任務(wù)模塊共享。
每個(gè)任務(wù)模塊都有其專屬的卷積層塊。這些塊的輸入輸出分辨率與原圖一致,但輸出通道數(shù)因任務(wù)而異。這種設(shè)計(jì)允許各任務(wù)根據(jù)自身需求調(diào)整特征,不會(huì)發(fā)生沖突。因?yàn)檫@些任務(wù)的性質(zhì)差異較大,既包括分類任務(wù),也包括回歸任務(wù)。尤其是深度聚類任務(wù)具有很強(qiáng)的動(dòng)態(tài)性,若不使用單獨(dú)的模塊,可能會(huì)導(dǎo)致特征提取器不穩(wěn)定,進(jìn)而影響其他任務(wù)的性能。
接下來,我們介紹每個(gè)任務(wù)模塊的細(xì)節(jié)。
細(xì)胞檢測(cè)與分類模塊
在細(xì)胞檢測(cè)任務(wù)中,模型對(duì)每個(gè)像素預(yù)測(cè)一個(gè)單通道的置信度圖,并與二值真值掩膜進(jìn)行比較。該真值掩膜是對(duì)細(xì)胞點(diǎn)注釋進(jìn)行適度膨脹得到的。對(duì)于靠得較近的細(xì)胞,我們使用更小的膨脹半徑以避免重疊。掩膜中的每個(gè)連通區(qū)域?qū)?yīng)一個(gè)細(xì)胞,見圖3。該模塊的輸出是單通道圖像,使用Sigmoid激活函數(shù),并采用DICE損失函數(shù)進(jìn)行訓(xùn)練,以更好地保留圖像中的小目標(biāo)。
在分類任務(wù)中,我們構(gòu)建了類似的真值掩膜,但每個(gè)連通區(qū)域內(nèi)的像素標(biāo)記為特定的細(xì)胞類別。分類模塊的輸出具有三個(gè)通道,對(duì)應(yīng)三種細(xì)胞類別,使用Softmax激活并同樣采用DICE損失函數(shù)訓(xùn)練。
推理階段,僅使用檢測(cè)與分類模塊。我們對(duì)檢測(cè)模塊的輸出進(jìn)行閾值處理,并提取每個(gè)連通區(qū)域的質(zhì)心作為預(yù)測(cè)的細(xì)胞位置。隨后,在預(yù)測(cè)位置上從分類模塊的輸出中提取類別標(biāo)簽。
空間上下文預(yù)測(cè)模塊
空間上下文預(yù)測(cè)模塊用于預(yù)測(cè)每個(gè)細(xì)胞的K函數(shù)向量(如公式(2)所定義)。其直覺是:通過預(yù)測(cè)空間上下文信息,所學(xué)習(xí)的特征表示能具備空間上下文感知能力,從而輔助檢測(cè)與分類模塊。我們將在實(shí)驗(yàn)部分通過消融實(shí)驗(yàn)驗(yàn)證這一點(diǎn)。
對(duì)于每個(gè)細(xì)胞,我們預(yù)測(cè)一個(gè)18維的K函數(shù)向量。其真值由細(xì)胞檢測(cè)任務(wù)生成的真值掩膜得出。對(duì)于每個(gè)陽性像素(即膨脹區(qū)域內(nèi)的像素),我們計(jì)算其K函數(shù)向量。該模塊的輸出具有與輸入圖像相同的空間分辨率,并包含18個(gè)通道,對(duì)應(yīng)K函數(shù)向量的18個(gè)維度。無需額外激活函數(shù),僅比較陽性像素處的預(yù)測(cè)與真實(shí)向量。
比較兩個(gè)K函數(shù)向量時(shí),可使用Kolmogorov–Smirnov檢驗(yàn)(用于比較累積分布函數(shù))。其形式為預(yù)測(cè)與真實(shí)向量之間的最大差值:
但在實(shí)際中,我們發(fā)現(xiàn)最大范數(shù)效率較低,故改用L1范數(shù)作為代理損失。
深度聚類模塊
盡管空間上下文預(yù)測(cè)模塊可學(xué)習(xí)空間上下文表示,但實(shí)踐中我們發(fā)現(xiàn)它與檢測(cè)和分類模塊協(xié)同效果較差。我們推測(cè),外觀特征與空間特征融合效果不佳,可能是因?yàn)樗鼈內(nèi)蝿?wù)本質(zhì)差異太大:檢測(cè)與分類是小類別的像素級(jí)分類任務(wù),而空間上下文預(yù)測(cè)是高維回歸問題。
為此,我們引入深度聚類模塊,用于重新校準(zhǔn)外觀與空間特征。該模塊本質(zhì)上是一個(gè)具有大量偽類別的像素級(jí)分類任務(wù),偽類別由外觀和空間信息聯(lián)合生成。深度聚類在弱監(jiān)督與無監(jiān)督任務(wù)中已被證實(shí)可增強(qiáng)特征表示,符合我們的場(chǎng)景需求:我們沒有細(xì)胞子類別的金標(biāo)準(zhǔn),而是動(dòng)態(tài)生成這些子類別,并訓(xùn)練模型去預(yù)測(cè)它們。
具體而言,我們對(duì)中間特征表示進(jìn)行K-means聚類,得到每類細(xì)胞的5個(gè)偽子類別。深度聚類模塊的結(jié)構(gòu)與分類模塊類似,用于預(yù)測(cè)這些偽標(biāo)簽。聚類所用的特征為深度聚類模塊與空間上下文預(yù)測(cè)模塊的特征拼接,確保融合空間與外觀信息。
每個(gè)訓(xùn)練周期開始時(shí),重新生成聚類與偽標(biāo)簽,且使用前一周期的聚類中心初始化以避免劇烈變化。訓(xùn)練方法與分類任務(wù)類似,使用DICE損失。
總體損失函數(shù)
模型的總損失是四個(gè)模塊損失的加權(quán)和:
在實(shí)踐中,我們將所有權(quán)重均設(shè)為1。
實(shí)驗(yàn)
我們?cè)谌N不同癌癥類型的數(shù)據(jù)集上評(píng)估了我們的方法 MCSpatNet:乳腺癌、肺癌和結(jié)直腸癌。
-
乳腺癌數(shù)據(jù)集(BRCA-M2C) 包含來自 TCGA 數(shù)據(jù)庫 [42] 的 113 位患者的 120 個(gè)圖像塊。
-
肺癌數(shù)據(jù)集(SEER-Lung) 來自 SEER 隊(duì)列 [16],包含 57 個(gè)圖像塊。
-
結(jié)直腸癌數(shù)據(jù)集(Consep) 是一個(gè)公開可用的數(shù)據(jù)集 [19],共包含 41 個(gè)圖像塊。
每個(gè)圖像塊均從不同的全切片圖像或組織樣本中采樣,以最大化泛化能力。所有三個(gè)數(shù)據(jù)集中的圖像塊大小均約為 500×500 像素,在 20 倍放大倍率下獲取,足以提供豐富的空間上下文信息。
乳腺癌和肺癌數(shù)據(jù)集由病理學(xué)專家進(jìn)行注釋,給出了細(xì)胞近似中心點(diǎn)的真實(shí)標(biāo)簽,并標(biāo)注了所屬類別:炎性細(xì)胞(inflammatory)、上皮細(xì)胞(epithelial) 或 基質(zhì)細(xì)胞(stromal)。需要指出的是,這些圖像塊中的所有上皮細(xì)胞均為腫瘤細(xì)胞。
Consep 數(shù)據(jù)集還額外提供了細(xì)胞核輪廓的掩膜信息。
畫的圖很喜歡,學(xué)習(xí)