摘要 自动图像采集和分析的发展已经牢牢确立了高通量筛选(HCS)作为一种药物发现工具的地位。虽然高通量筛选在细胞检验中具有广泛的应用,但整个生物体(如斑马鱼)的全自动化图像分析,如果没有用户深入介入,目前尚不能实现。其主要障碍包括方位的变化,样本的高变异性,每个样本特征的复杂性。因此,目前还没有方法能实现斑马鱼幼虫的无监督检测和特征定量。目前,一种在计算机环境中模拟人的认知过程的人工智能方法能克服这些障碍。
高通量筛选是当代药物发现的主要技术手段,但它的普遍使用并没有增加新上市药物的数量。因此普遍认为需要更好的模型来提高候选药物的质量,而整个生物体可以提供这样的模型[1]。虽然整体有机体在药物发现过程中具有重要作用,但由于逻辑及伦理原因并未发现其在高通量化学遗传学中的广泛应用。具有个体小、繁殖力强、透光性特性的斑马鱼可以填补这个空白[2,3]。许多实验组报道了斑马鱼的化学筛选[4,5],但是其通量低且需人工处理分析每条斑马鱼。在利用斑马鱼进行筛选时的一个主要限制因素是无法自动分析复杂的、不均匀的、低对比率的、依赖标本定位的整体生物图像。这对基于像素亮度和分割阈值的传统图像分析程序提出了挑战。即使使用最尖端的图像分析软件,图像分析仍需要视觉检验和手动预处理每条幼虫[6]。
在此,笔者假定基于人工智能图像分析可以解决这个问题。他们探索了一种模仿人类认知过程面向对象的图像分析方法——认知网络技术(CNT)(DefiNIens,Munich,Germany)[7]。CNT通过专家用户对图像对象赋予特征和属性来仿真人类视觉感知。图1说明了CNT的基本前提。图1a显示了一个Tg(fli 1 :EGFP)y1斑马鱼幼虫的荧光显微照片,表现了在fli 1促进剂的控制下增强的绿色荧光蛋白(EGFP)[8]。在这个模式下,所有的血管被荧光标记。对于一个熟悉斑马鱼形态学的人(甚至一个外行)来说,可以看到显微照片显示了在侧视图方向上的单个幼虫,头部向上,卵黄囊和腹部区向左,含有体节间血管的背部区向右侧。通过观察图像中的区域特征,如亮度、尺寸、形状等,获得最初的认知。基于对幼虫形态学的知识,观察者直接对目标对象赋予背景信息,如相对位置、边界、邻近对象,从而从这些最初区域特征中识别头部、尾部、卵黄、大血管、背部这些具有生物学意义的区域(图1b)。

虽然人脑可以简单直观地实现这个分析过程,但对于缺乏上下文背景知识的电脑,这一图像分析过程是个很大的挑战。CNT通过允许用户赋予目标图像相关的信息提供了上下文内容。通过上下文相关的分类和分割的用户监督迭代循环,一个递阶网状结构的图像进化为一个附着属性的对象与关系的网络(见图2)。这个交替分类和分割的逐步过程称为规则集。这种方法应用于Developer软件(Definiens),此软件为CNT规则集的构建提供了一个高水平的程序语言环境。其关联对象相关的特征。规则集可以在Developer软件上执行,也可以通过集成的作业调度程序而在并联分布的多个微处理机上执行。附加的Cellenger应用模块对从多孔板上得到的数据进行处理、提取及视觉显示。


图4 使用已知的抗血管生成剂处理的Tg(fli 1 :EGFP)y1幼虫的ISV定量。用媒介物(二甲亚砜(DMSO))或SU11652——一种血管内皮生长因子受体阻断剂处理受精后24 h的幼虫。然后转移至384孔板上,在ArrayScan Ⅱ上进行扫描,利用CNT规则集进行分析。a)媒介物处理的幼虫,其ISV(红色)复杂、有组织、形状不规则。b)药物处理的幼虫,其ISV仍可被检测,但是丢失了组织性,并且尺寸变小。c)ISV的定量结构。对ISV的主要曲线长度和形状进行定量分析,将长度及形状的数值量绘制成ISV的累积分布函数。药物处理幼虫的ISV具有较小的主线长度和较高的椭圆拟合值。

1 斑马鱼幼虫特定区域血管的识别
使用CNT规则集分析Tg(fli l :EGFP)y1幼虫血管。体节间血管(ISV)垂直出芽于躯干部大血管(见图2中的原始照片(original image),且此血管生成过程与人类血管生成模式相近[9],因此笔者对体节间血管的定量特别感兴趣。在ArrayScan Ⅱ高容量阅读器(Thermo Scientific Cellomics , Pittsburgh, PA)中得到胚胎发育48 h的幼虫图像。图2显示了CNT对递阶式网状结构的成功组合。CNT规则集从原始显微照片成功地检测和完善了整体轮廓及整个幼虫(绿色)。通过对作为最高级对象的幼虫的进一步处理,规则集识别了卵黄、大躯干及头部血管、背部区域(分别为黄色、紫色、粉色、灰色)。对较低级子域的指认使作者无干扰地识别出背部的ISV(红色)。
2 小分子血管形成抑制剂的CNT量化
利用CNT规则集测量了已知小分子血管生长抑制剂对血管生长的抑制[10]。受精卵发育24 h后的幼虫分别用媒介物及不同浓度的SU11652(Sigma, St.Louis,MO)处理8 h。SU11652为一种血管内皮生长因子(VEGF)受体阻断剂。去除绒毛膜然后将幼虫移入384孔板的样孔中。在ArrayScan Ⅱ高容量阅读器上获得所有孔板中幼虫的图像,并使用CNT规则集对图像进行分析。CNT规则集采用可以对从多孔样板中得到的数据进行分析、处理和输出的CellengerTM应用模板(Definiens)(见图3)。较之培养介质,用SU11652处理过的幼虫在形态复杂度及长度上有所减少(见图4a和图4b)。CNT规则集分别检测了媒介物及SU11652处理的幼虫,发现了ISV的长度及形状上的量化差异(见图4c)。最近有报道将这一方法应用到另一种VEGF受体阻断剂和两种微管扰乱因子。实验表明,此分析方法可以获得统计水准,从而使其适用于中等尺寸化合物样品库的筛选[11]。
3 实验过程
3.1 斑马鱼培养及化学处理
Tg(fli 1 :EGFP)y1获取自Brant Weinstein博士(Laboratory of Molecular Genetics, National Institute ofChild Health & Human Development [Bethesda, MD])[10]。受精卵发育24 h转基因斑马鱼幼虫在200 μL含有媒介物或者SU11652的E3介质(5 mmol/L NaCl, 0.33 mmol/LCaCl2, 0.17 mmol/L KCl, 0.33 mmol/L MgSO4)中处理8 h。人工去除绒毛膜后,将单个幼虫移入384孔板低容量、洁净的微板上。E3介质含有40 μg/mLMS222(三卡因甲磺酸盐, Sigma)以进行成像。
3.2 图像获取及分析
荧光斑马鱼幼虫的图像获取自使用低放大倍数物镜和GFP兼容滤光镜套件的ArrayScan Ⅱ高容量阅读器。详细信息见文献[11]。
3.3 数据产生及分析
选择经处理的受精后48 h幼虫进行初步实验,建立检测整个幼虫及具有生物学意义的子域的方法提纲。在Developer软件上应用此方法进行检测。Cellenger模板从Cellomics Store数据库中提取原始的、可获得的图像进行分析。详细信息请见文献[11]。
4 结论
整体生物图像的分析目前仅依据专家的目测评估。使用基于人工智能的CNT方法,笔者发展了一种自动对荧光斑马鱼显型的体系,它可以对多孔板上的生物进行识别且无需考虑样本定位及用户监督。这样,人工智能分析可以从复杂的整体生物图像中提取和量化具有生物学意义的特征。
参考文献
[1] Walker M J A, Barrett T, Guppy L J. Functional pharmacology:the drug discovery bottleneck Drug Discov Today: Targets,2005, 3: 208–15.
[2] MacRae C A, Peterson R T. Zebrafishbased small moleculediscovery. Chem Biol, 2003, 10: 901–8.
[3] Zon L I, Peterson R T. In vivo drug discovery in the zebrafish.Nat Rev Drug Discov, 2005, 4: 35–44.
[4] Peterson R T, Shaw S Y, Peterson T A, Milan D J, ZhongT P, Schreiber S L, MacRae C A, Fishman M C. Chemicalsuppression of a genetic mutation in a zebrafish model ofaortic coarctation. Nat.Biotechnol, 2004, 22: 595–9.
[5] Yu P B, Hong C C, Sachidanandan C, Babitt J L, Deng D Y,Hoyng S A, Lin H Y, Bloch K D, Peterson RT. Dorsomorphininhibits BMP signals required for embryogenesis and ironmetabolism. Nat Chem Biol, 2008, 4: 33–41.
[6] Tran T C, Sneed B, Haider J, Blavo D, White A, AiyejorunT, Baranowski T C, Rubinstein A L, Doan T N, DingledineR, Sandberg E M. Automated, quantitative screening assay forantiangiogenic compounds using transgenic zebrafish. CancerRes, 2007, 67 (11): 386–92.
[7] Binning G, Baatz M, Klenk J, Schmidt G. Will machines startto think like humans Europhys News, 2002, 33: 45–53.
[8] Lawson N D, Weinstein B M. In vivo imaging of embryonicvascular development using transgenic zebrafish. Dev Biol,2002, 248: 307–18.
[9] Childs S, Chen J N, Garrity D M, Fishman M C. Patterning ofangiogenesis in the zebrafish embryo. Development,2002,129:973–82.
[10] Molina G A, Watkins S C, Tsang M. Generation of FGFreporter transgenic zebrafish and their utility in chemicalscreens. BMC Dev Biol, 2007, 7: 62–76.
[11] Vogt A, Cholewinski A, Shen X, Nelson S G, Lazo J S, TsangM, Hukriede N A. Automated image-based phenotypicanalysis in zebrafish embryos. Dev Dyn, 2009, 238: 656–63.
作者简介:
Dr.VogtisAssociateDirector,UniversityofPittsburghDrugDiscoveryInstitute,10047BiomedicalScienceTower3,UniversityofPittsburgh,Pittsburgh,PA15260,U.S.A.;tel.:412-383-5856;fax:412-6489009;email:avogt@pitt.edu,andResearchAssistantProfessor,Departmentof Pharmacology and Chemical Biology. Drs. Tsang and Hukriede are Assistant Professors, Department of Microbiology and MolecularGenetics, University of Pittsburgh. This work was funded by the U.S. National Institutes of Health (NIH)grantsHD053287,DK069403,DK079307,HL088016,andCA78039.TheauthorsthankG.Molinaforassistancewithzebrafishmaintenanceandbreeding.




