昨(16),由史隆·凱特琳癌症研究中心(MSKCC)研究團隊,完成40,000張前列腺癌、基底細胞癌和乳腺癌轉移至腋窩淋巴結的病理切片辨識,該臨床應用使病理學家排除65-75%非疾病表現的切片,並表現100%的靈敏度與98%的準確率。相關研究已發表在《Nature Medicine》期刊上。
專科病理醫師對送檢組織進行專業的疾病分類,可說是現代癌診的基礎,但由於需要大量手動標示數據,也阻礙了病理學決策支持系統的開發與部屬,為了克服這個問題,MSKCC,開發一種多實例學習的深度學習系統,該系統僅使用報告的診斷作為訓練,避免了昂貴與費時的手動標註。
MSKCC研究團隊,從3個來自44個國家和地區的15187名癌症患者數據集,收集了44732個病理切片進行判斷,包括24859個前列腺癌、9962個基底细胞癌、9894個淋巴结轉移乳腺癌,且這些切片皆未接受任何標記,數據量堪稱史上之最。
MSKCC研究團隊開發的新AI系統建構在多實例學習(MIL)和循環神經網絡(RNN),在不同大小的數據集中進行了訓練。根據研究者的觀察,一般需要至少接受1萬張切片訓練後才能夠獲得良好的性能,而且累積更多的數據集後才能提升更高的準確度。
但MSKCC的研究結果顯示前列腺癌、基底細胞癌和淋巴結轉移乳腺癌三個癌種的模型評估曲線(AUC)分別可達到0.991、0.989、0.965。研究者也對誤差進行分析,發現切片的掃描技術、色彩會影響判讀,但經過設備微調後,最終AUC可達0.98以上。
另外,研究者也與目前擁有最多數據標示的AI模型CAMELYON16進行比對,雖然套用新的AI數據集之後AUC下降了20%,但在透過兩者數據交叉訓練後,使新的AI系統表現更加。
近一個世紀以來病理醫師的工作模式沒有太大改變,但隨著人工智慧、深度學習的技術崛起,輔助判斷的工具大大減少病理醫師的工作量。論文通訊作者也是AI診療公司Paige的創辦人Thomas J. Fuchs表示,希望能儘快在臨床上使用這種AI系統。
圖文參考:環球生技月刊