在以斑馬魚為模式生物的毒理學(xué)研究過程中,形態(tài)分析(morphometric analysis)是快速篩查新污染物、化學(xué)品、藥品等物質(zhì)對生物造成異常影響過程或探究致病機理的重要分析手段。除胚胎致死率和孵化率外,污染物對斑馬魚幼魚所產(chǎn)生的多種毒性終點和亞致死影響等是探索該物質(zhì)毒性作用模式的有效途徑。
近日,同濟大學(xué)林思劼團隊在Environmental Science & Technology上在線發(fā)表了題為“Deep Learning-Enabled Morphometric Analysis for Toxicity Screening Using Zebrafish Larvae”的科學(xué)論文。該研究創(chuàng)新發(fā)展了一種基于深度學(xué)習的斑馬魚仔魚形態(tài)分析方法(Deep Learning-enabled Morphometric Analysis,DLMA),該方法基于高通量篩選(High Throughput Screening, HTS)和深度學(xué)習技術(shù)實現(xiàn)客觀且高效地分析毒性物質(zhì)對斑馬魚幼魚生長發(fā)育的影響(圖1)。

圖1 DLMA工作流程
研究選用包括重金屬、內(nèi)分泌干擾物以及代表性新污染物等九種化學(xué)物質(zhì)(PFOS,BPA,CdCl2,PbI2,APAP,27-DBCZ,36-DBCZ,3-BCZ,1368-TBCZ)進行斑馬魚胚胎的暴露實驗,并采用自動化成像裝置(EVOS M5000, Thermo Fisher Scientific)采集并構(gòu)建了超過2500張具有最普遍代表性的仔魚(120 hours post-fertilization)表型畸形數(shù)據(jù)庫。隨后,利用AI輔助標注Labelbox對其中1328張圖像標注了具有16種類別的實例,其中包括8種經(jīng)典畸形形貌:頭部出血、下顎畸形、魚鰾未膨起、心包水腫、卵黃囊水腫、脊柱彎曲、死亡和未孵化;以及8種重要器官:眼睛、下顎、卵黃囊、心臟、頭部、脊柱、魚鰾和尾部。研究基于兩種深度學(xué)習視覺模型,Mask R-CNN和TensorMask,以Res-Net 50/101為主干網(wǎng)絡(luò),對上述數(shù)據(jù)集在開源深度學(xué)習目標檢測框架Detectron2上進行訓(xùn)練并優(yōu)化,經(jīng)過3萬次迭代得到的預(yù)訓(xùn)練模型的全類平均準確率(mAP,mean average precision)高于95%。與傳統(tǒng)機器學(xué)習模型相比,基于Mask R-CNN建立的DLMA方法能夠同時處理斑馬魚仔魚的畸形檢測和分類以及重要器官的語義分割,因此在對上述16種類別進行分類和檢測的同時,能夠?qū)崿F(xiàn)對每個類別的精確分割,得到每個重要器官的量化數(shù)據(jù)(如眼睛大小,心包面積等),其檢測速率利用NVIDIA RTX 2080 GPU能夠達到13 FPS(0.075s每張)。此外,該方法分別在未訓(xùn)練過的120 hpf的斑馬魚圖像(1080張)和公開數(shù)據(jù)集斑馬魚仔魚圖像(870張)進行了統(tǒng)計學(xué)驗證,分別達到了93%和86%的正確率,且量化數(shù)據(jù)的誤差均低于10%(圖2)。

圖2 模型訓(xùn)練,器官分類和量化參數(shù)
該方法的建立還使構(gòu)建物質(zhì)種類與畸形表型和重要器官受影響程度的構(gòu)效關(guān)系成為可能(圖3)。研究發(fā)現(xiàn)APAP和PbI2分別誘導(dǎo)產(chǎn)生了色素缺失和頭部出血,被單獨分為一簇;BPA和PFOS兩種內(nèi)分泌污染物產(chǎn)生了明顯的發(fā)育延遲效應(yīng),被分為一個子簇;PHCZs(polyhalogenated carbazoles)系列化學(xué)物質(zhì)由于具有與二惡英(TCDD)類似的化學(xué)結(jié)構(gòu)而產(chǎn)生了相似的心臟毒性效應(yīng),誘導(dǎo)產(chǎn)生了明顯的心包水腫畸形,包括3-BCZ、27-DBCZ、36-DBCZ和1368-TBCZ等四種新污染物被分類在一個父簇之下。

圖3 化學(xué)物質(zhì)與表型終點之間聯(lián)系的關(guān)系圖
這項研究通過發(fā)展DLMA分析方法和實例驗證了深度學(xué)習在傳統(tǒng)毒理學(xué)篩選領(lǐng)域的應(yīng)用潛力,結(jié)合人工智能領(lǐng)域的技術(shù)有助于加速環(huán)境毒理學(xué)研究的進展。考慮到大量層出不窮的人工化學(xué)品和新污染物種類,利用深度學(xué)習及其他自動化裝置構(gòu)建篩選和評估物質(zhì)毒性的自動化平臺具有重大意義。DLMA工作流程能夠作為高通量分析的基礎(chǔ)框架,推動構(gòu)建一個可以快速評估并預(yù)測新污染物毒性作用的環(huán)境健康評價系統(tǒng),從而更好地了解化學(xué)物質(zhì)對環(huán)境和生物健康的影響,并制定更恰當?shù)墓芸刂卫聿呗浴?/p>
同濟大學(xué)環(huán)境科學(xué)與工程學(xué)院碩士研究生董公卿為該論文的第一作者,同濟大學(xué)環(huán)境科學(xué)與工程學(xué)院林思劼教授為該論文的通訊作者。本研究獲得了國家自然科學(xué)基金(No. 21777116;No.22176150)和中央高校基本科研業(yè)務(wù)費專項資金等項目的資助。