传统的蛋白鉴定方法,如免疫印迹法、内肽的化学测序、已知或未知蛋白的comigration分析,或者在一个有机体中有意义的基因的过表达通常耗时、耗力,不适合高流通量的筛选。 目前,所选用的技术包括对于蛋白鉴定的图象分析、微量测序、进一步对肽片段进行鉴定的氨基酸组分分析和与质谱相关的技术。
1 图象分析技术(Image analysis)
“满天星”式的2-DE图谱分析不能依靠本能的直觉,每一个图象上斑点的上调、下调及出现、消失,都可能在生理和病理状态下产生,必须依靠计算机为基础的数据处理,进行定量分析。 在一系列高质量的2-DE凝胶产生(低背景染色,高度的重复性)的前提下,图象分析包括斑点检测、背景消减、斑点配比和数据库构建。 首先,采集图象通常所用的系统是电荷耦合CCD(charge coupled device)照相机;激光密度仪(laser densitometers)和Phospho或Fluoroimagers,对图象进行数字化。 并成为以象素(pixels)为基础的空间和网格。 其次,在图象灰度水平上过滤和变形,进行图象加工,以进行斑点检测。 利用Laplacian,Gaussian,DOG(difference of Gaussians) opreator使有意义的区域与背景分离,精确限定斑点的强度、面积、周长和方向。
图象分析检测的斑点须与肉眼观测的斑点一致。 在这一原则下,多数系统以控制斑点的重心或最高峰来分析,边缘检测的软件可精确描述斑点外观,并进行边缘检测和邻近分析,以增加精确度。 通过阈值分析、边缘检测、销蚀和扩大斑点检测的基本工具还可恢复共迁移的斑点边界。 以PC机为基础的软件Phoretix-2D正挑战古老的Unix为基础的2-D分析软件包。 第三,一旦2-DE图象上的斑点被检测,许多图象需要分析比较、增加、消减或均值化。 由于在2-DE中出现100%的重复性是很困难的,由此凝胶间的蛋白质的配比对于图象分析系统是一个挑战。 IPG技术的出现已使斑点配比变得容易。 因此,较大程度的相似性可通过斑点配比向量算法在长度和平行度观测。 用来配比的著名软件系统包括Quest,Lips,Hermes,Gemini等,计算机方法如相似性、聚类分析、等级分类和主要因素分析已被采用,而神经网络、子波变换和实用分析在未来可被采用。 配比通常由一个人操作,其手工设定大约50个突出的斑点作为“路标”,进行交叉配比。 之后,扩展至整个胶。
例如:精确的PI和MW(分子量)的估计通过参考图上20个或更多的已知蛋白所组成的标准曲线来计算未知蛋白的PI和MW。 在凝胶图象分析系统依据已知蛋白质的pI值产生PI网络,使得凝胶上其它蛋白的PI按此分配。 所估计的精确度大大依赖于所建网格的结构及标本的类型。 已知的未被修饰的大蛋白应该作为标志,变性的修饰的蛋白的PI估计约在±0。25个单位。 同理,已知蛋白的理论分子量可以从数据库中计算,利用产生的表观分子量的网格来估计蛋白的分子量。 未被修饰的小蛋白的错误率大约30%,而翻译后蛋白的出入更大。 故需联合其他的技术完成鉴定。
2 微量测序(microsequencing)
蛋白质的微量测序已成为蛋白质分析和鉴定的基石,可以提供足够的信息。 尽管氨基酸组分分析和肽质指纹谱(PMF)可鉴定由2-DE分离的蛋白,但最普通的N-末端Edman降解仍然是进行鉴定的主要技术。 目前已实现蛋白质微量测序的自动化。 首先使经凝胶分离的蛋白质直接印迹在PVDF膜或玻璃纤维膜上,染色、切割,然后直接置于测序仪中,可用于subpicomole水平的蛋白质的鉴定。 但有几点需注意:Edman降解很缓慢,序列以每40 min 1个氨基酸的速率产生;与质谱相比,Edman降解消耗大;试剂昂贵,每个氨基酸花费3~4$。 这都说明泛化的Edman降解蛋白质不适合分析成百上千的蛋白质。 然而,如果在一个凝胶上仅有几个有意义的蛋白质,或者如果其他技术无法测定而克隆其基因是必需的,则需要进行泛化的Edman降解测序。
近来,应用自动化的Edman降解可产生短的N-末端序列标签,这是将质谱的序列标签概念用于Edman降解,业已成为一种强有力的蛋白质鉴定。 当对Edman的硬件进行简单改进,以迅速产生N-末端序列标签达10~20个/d,序列检签将适于在较小的蛋白质组中进行鉴定。若联合其他的蛋白质属性,如氨基酸组分分析、肽质质量、表现蛋白质分子量、等电点,可以更加可信地鉴定蛋白质。 选择BLAST程序,可与数据库相配比。 目前,采用一种Tagldent的检索程序,还可以进行种间比较鉴定,又提高了其在蛋白质组研究中的作用。
3 与质谱(mass spectrometry)相关的技术