陳穎志博士  香港理工大學   醫療科技及資訊學系

2019-10-22

人工智能(AI)近年於臨床和醫學研究領域中已被廣泛應用,原因不僅是領域的可數字化,還在於其高性能的機器學習技術及分析模型。許多研究人員聲稱他們已經在臨床環境中開發了AI模型應用,但很少有人真正知道如何選擇合適的模型種類和機器學習方法,從而在臨床環境中實現真正的卓越性能。
人工智能應用的開發程序分為三個階段:訓練,測試和運作。訓練和測試數據集是從臨床應用場景中收集的基本事實,包含大量的輸入/輸出對。輸入數據通常代表臨床樣本或患者自身的可數字化特徵,可以簡稱為特徵。輸出數據通常是臨床結果或風險指標,簡稱為結果。訓練階段通過機器學習算法調整模型,以滿足輸入/輸出對的邏輯。例如,輸入/輸出對{x,y}為{10,20}並且模型為 y=mx,經過訓練,我們得到 y=2x。

在測試階段,只有特徵(即輸入)將被傳送到模型。經過訓練的模型根據輸入的特徵預測結果。測試階段的目標是要檢查預測結果與真實結果之間的偏差。如果偏差不可接受,我們將返回訓練階段並優化模型架構及所選特徵。儘管訓練數據集和測試數據集必須互不包含,訓練和測試階段之間需要緊密合作。因此,研究人員開發了交叉驗證方法,將模型的檢查過程和總體性能評估系統化。

運作階段直接將模型投入使用。特徵提交給模型,然後讓模型預測結果。進入這個階段後,已無需進一步訓練和測試。

本文將以一項獲得專利的發明為例(CN101645142B),簡要演繹以上提及的三個人工智能開發階段。該發明涉及一種基於相關風險因素的心血管疾病和中風風險評估系統。風險因素包括年齡,性別,收縮壓,舒張壓,體重指數,腰圍,脂質分佈和其他新興診斷指標等等。

風險因素具有不同的單位和數值範圍。根據已發布的統計數據模型,我們將風險因素轉換為相應的風險統計指標,例如:

  • 風險概率(risk)
  • 比值比(odds ratio)
  • 相對風險(relative risk)
  • 風險比(hazard ratio)
延伸閱讀  亞太電子健康紀錄論壇2019 - 健康及醫學人工智能工作坊

為了減低輸入的數量和模型複雜性,該發明利用弗雷明漢心臟研究發布的統計模型來整合多種患者資料, 和臨床測量指標, 並將其轉化為單一風險概率。風險因素的統計指標就成為輸入人工智能模型(即風險融合模塊)的特徵。而模型輸出的結果是一個風險評分,代表在患者的頸動脈中發現動脈粥樣硬化斑塊的可能性,是心血管疾病和中風的早期指標。風險融合模塊使用上述的特徵(即風險因素的統計指標)和結果(即風險評分)進行訓練和測試。當模型運作時,我們只需要提供風險因素,該系統將預測心血管疾病和中風的風險。

CN101645142B, 發明人: 陳穎志,彭雅詩; 發明名稱: 用於心血管疾病和中風的風險評估的模糊系統

 

陳穎志博士
香港理工大學醫療科技及資訊學系副教授
浙江大學核醫學與分子影像研究所客席教授
港澳抗癌協會常務理事

「健康及醫療人工智能」系列:

1.「健康及醫療人工智能」系列(1):人工智能於臨床和研究應用中的卓越特性

2.「健康及醫療人工智能」系列(2):人工智能基礎知識及醫學分析模型

延伸閱讀  認清癌症基因變異 罕見癌症解困局 

3.「健康及醫療人工智能」系列(3):電子病歷搜索引擎

4.「健康及醫療人工智能」系列(4):醫學文件搜索算法

5.「健康及醫療人工智能」系列(5):搜索引擎輔助製定放射治療計劃

6.「健康及醫療人工智能」系列(6): 搜索類似放射治療計劃的算法

7.「健康及醫療人工智能」系列(7): 基於功能性磁力共振數據的神經元連接模型

8.「健康及醫療人工智能」系列(8): 使用遺傳算法和GPU改善神經元連接模型

9.「健康及醫療人工智能」系列(9): 放射組學:醫學圖像的高通量測序

10.「健康及醫療人工智能」系列(10): 輔助醫學圖像分析的計算機視覺