論文選讀

機器學習可區分 High-Risk Breast Lesion 惡性度以減少不必要的手術

原始論文:Bahl M, et al. High-risk Breast lesions: A Machine Learning Model to PredictPathologic Upgrade and ReduceUnnecessary Surgical Excision. Radiology 2017.

註:這是個 MGH 和哈佛共同合作的研究,主要是在討論已知 breast 切片病理後要不要進一步手術的問題,而不是從影像來區分是否該不該切片,老實說和影像診斷的關係不大。

實務上如果 breast lesion core biopsy 出來的結果是 high risk lesion (HRL),一般而言都會建議再做 surgical excision,但其實真正是 malignancy 的機率並不高(約 10%),會有 over treatment 的情形。他們 training 了一個 machine learning model,可以從病人的基本資料、core biopsy 的病理報告推算出之後做 surgical excision 而升級為 malignancy 的機率。

他們將 1006 個 core biopsy 為 HRL (包含 ADH, atypical lobular hyperplasia, LCIS, papilloma, radial scar …) 的病人資料,例如 age, drinking, family history …, 影像資料,例如 breast density, BI-RADS category …, 和 core-biopsy 的病理報告資料,例如 pathology, prior biopsy, 或是有沒有 severely 這類的形容詞,用 random forest classifier 這個 machine learning 的 model,做出了一個預測系統,如果系統判定惡性的可能性 > 5%,則會建議後續手術 excision,否則繼續追蹤。

經 test 組 (約佔所有 data 的三分之一) 的驗證,這個系統的 cancer detection rate 為 97.4% (sensitivity) ,而 benign lesion 也建議去手術的比率是 69.4% (false positive rate),這個數值看起來好像不怎麼樣,但它代表的是,如果每個 HRL (100%) 都建議去開刀,而這個系統可以避免 30.6% 的 case 開出來其實是 benign 的情形。

這個機制提供的是一種有點像是在病理層面 BI-RADS 3 – probably benign 的概念,如果 core biopsy 的結果可以再細分,的確有一部份人是可以考慮追蹤而不必每個都去手術的。

蔡依達

正職是放射診斷科的醫師,喜歡玩電腦或被電腦耍,手邊有幾台慢慢被時代遺忘的底片相機,總愛邊出遊邊透過鏡頭看世界,也對追求音樂、藝術一類美的事物充滿熱情