陳穎志博士 香港理工大學 醫療科技及資訊學系
2020-04-21
計算機視覺(Computer Visions)是訓練人工智能以數據來解釋和理解視覺世界。它的原理是鏈接具有接近像素值的相鄰像素,使其能夠準確地識別和分類數字圖像中的事物,然後對內容進行解釋和做出反應。這個技術可以應用在腫瘤圖像方面,以多層次漸進方法來認知不同大小的器官和組織。
計算機視覺(Computer Visions)是一個人工智能領域,方法是根據數據來訓練計算機,使它能夠解釋和理解視覺世界。借助深度學習模型,計算機可以準確地識別和分類數字圖像中的事物,然後對其所看到的內容進行解釋和做出反應。自動駕駛汽車和人臉識別是現今計算機視覺的主要應用場景。隨著醫學大數據的增長,生物醫學圖像已成為新興的應用場景。
數字醫學圖像由像素組成。每個像素代表一個數字(灰度)或三個數字(紅色,綠色,藍色)。圖1示範從腹部計算機斷層掃描(Computed Tomography, CT)圖像中提取一個像素塊(代表腫瘤和正常肝組織之間的邊界區域),及其計算機視覺分析。
圖1 右上圖顯示病人腹部的計算機斷層掃描(Computed Tomography, CT);左上圖紅框內顯示腫瘤和正常肝組織邊界區域;左下圖顯示此邊界區域中的10×10像素塊;中間矩陣顯示其相應像素值;右下圖為計算機視覺分析結果
計算機視覺的原理是鏈接具有接近像素值的相鄰像素。在像素矩陣中,我們可以找到具有以下相同數值的相鄰像素對:41, 27, 30, 60, 81, 86。算法將每些相鄰像素鏈接形成多組物件,完成第一次鏈接。第二次鏈接將差異等於1的像素對鏈接在一起:(13,12), (29,28)。通過兩次鏈接,我們可以獲得如圖1矩陣中被圈起來的組件。多次鏈接後就可以得到右下圖的分析結果,綠色代表正常肝組織,藍色代表腫瘤。
由於腫瘤在整幅圖像中相對比較細小,未必能夠一次性探測出來。因此,我們可以利用多層次漸進方法來認知不同大小的器官和組織。如圖2所示,我們首先考慮全圖為第一層次,以計算機視覺分析找出身體部分,然後把背景移除。第二層次是只覆蓋身體的圖像,以計算機視覺分析找出器官,如肝臟和腎臟。第三層次是覆蓋肝右葉的圖像,以計算機視覺分析找出腫瘤和鄰近正常組織。
圖2 左上圖顯示病人腹部的計算機斷層掃描(Computed Tomography, CT);中上圖為計算機視覺分析結果:身體(紫色)和背景;右上圖顯示只覆蓋身體的圖像;右下圖為計算機視覺分析結果:肝右葉(黑色)和右腎;中下圖顯示覆蓋肝右葉的圖像;左下圖為計算機視覺分析結果:腫瘤(棕色)和鄰近組織
至於分辨在同一層次的器官或組織,我們利用放射組學特徵上的差異來辨別。有關放射組學的詳情,可參考本系列文章“放射組學:醫學圖像的高通量測序”。
特別鳴謝 Dr. Keith Chiu (香港大學醫學院放射診斷學臨床助理教授趙允恒醫生) 對此研究所作出的貢獻。
相關文章:
1. Uijlings, et al. International Journal of Computer Vision, 104(2):154-171, 2013.
2. Forsyth. Computer, 47(2):6-7, 2014.
陳穎志博士
香港理工大學醫療科技及資訊學系副教授
浙江大學核醫學與分子影像研究所客席教授
港澳抗癌協會常務理事
「健康及醫療人工智能」系列:
1.「健康及醫療人工智能」系列(1):人工智能於臨床和研究應用中的卓越特性
2.「健康及醫療人工智能」系列(2):人工智能基礎知識及醫學分析模型
5.「健康及醫療人工智能」系列(5):搜索引擎輔助製定放射治療計劃
6.「健康及醫療人工智能」系列(6): 搜索類似放射治療計劃的算法
7.「健康及醫療人工智能」系列(7): 基於功能性磁力共振數據的神經元連接模型
8.「健康及醫療人工智能」系列(8): 使用遺傳算法和GPU改善神經元連接模型
9.「健康及醫療人工智能」系列(9): 放射組學:醫學圖像的高通量測序
10.「健康及醫療人工智能」系列(10): 輔助醫學圖像分析的計算機視覺