在醫學影像技術及其交叉學科領域,有許多問題需要借助高性能計算才能得到解決,如醫學影像重建、放療劑量評估、影像基因組學等。中國科學院蘇州生物醫學工程技術研究所醫學影像室研究員高欣帶領的數字介入診療課題組,從2014年開展了云計算技術在醫學影像計算領域的應用研究,取得了進展,并已應用于醫學影像的數據處理。以放療劑量評估為例,課題組成員劉仰川等針對在本地計算機上進行放療劑量評估耗時嚴重的問題,開展了基于云計算加速的放療劑量評估研究。研究人員提出了利用在云計算平臺Amazon EC2上構建Hadoop集群(見圖1),實現基于MapReduce的GATE仿真加速的方案(見圖2)。在該方案中,GATE是一款Monte Carlo仿真軟件,具備完善的放療劑量評估功能;Hadoop是一款開源軟件,它提供了分布式計算框架MapReduce,還提供了大數據儲存框架HDFS。
在云端Hadoop集群中,節點(又稱主機、實例)均來自同一個機器鏡像(Amazon Machine Image,AMI),且被分配了不同的角色,其中一個Master節點負責計算任務的分配、一個Secondary NameNode節點負責對Master節點進行備份、多個Slave節點負責計算。本地計算機通過SSH通訊協議實現跟云端集群之間的數據上傳與下載。
在MapReduce框架中,包含Map和Reduce兩種任務,它們均在worker節點內運行,分別負責計算和合并。Map任務首先從HDFS中下載仿真代碼文件(sub-macro),再調用GATE進行仿真,并將中間結果(sub-dose、sub-dose uncertainty)以鍵值對(key-value pairs)的形式發送出去。Reduce任務將具有相同鍵(key)的中間結果合并,并將最終結果傳輸至HDFS。
為了驗證基于MapReduce的GATE仿真加速方案的有效性,科研人員構建了18MeV的X光束入射水模實驗,分別進行了本地單線程仿真、云端多集群仿真、云端多光束強度仿真、以及集群可靠性仿真。實驗中,作為云計算加速的典型結果,含有64個worker節點的集群,相對單個worker節點集群和本地計算機,分別取得了41倍和32倍的加速比。該方案除了能應用于醫學影像領域外,還可應用于生物醫學領域的諸多方面,如基因測序、蛋白質分析等。
上述研究成果發表在Australasian Physical & Engineering Sciences in Medicine上。
該研究工作得到了國家自然科學基金、中科院科研裝備研制項目及蘇州科技計劃項目的資助。
圖1.云端Hadoop集群構建示意圖
圖2.基于MapReduce的GATE仿真加速方案