Zujia.W
摘要:
随着新一代测序技术、蛋白质谱技术等高通量技术的快速发展,生命科学领域进入了“后基因组时代”,进入了以海量多元组学数据为特征的大数据时代。组学大数据在研究基因功能、疾病机制、精准医疗等方面具有重要意义。在疾病研究领域中,跨组学研究是一个明确的发展趋势。 借助生物信息学分析方法进行多组学整合研究, 能更加系统地阐释疾病的发生及发展机理, 为疾病的诊断治疗提供强有力的工具。
关键词:组学 基因组学 转录组学 蛋白质组学 代谢组学 生物信息学
Abstract:
With the rapid development of new-generation high-throughput technologies, including next-generation sequencing technology and mass spectrometry method,the field of life sciences has entered the "post-genomic era",a large data age characterized by massive multivariate data.Large data of Omics has set great significance in the study of gene function, disease mechanisms, precision medical and so on. In the field of disease research, cross-omics research is a clear development trend in future. With the help of bioinformatics analysis method and multi-omics integration, researchers can explain the occurrence and development of diseases more systematically, providing powerful tools for the diseases diagnosis and treatment .
Key words: Omics Genomics Transcriptomics Proteomics Metabolomics Bioinformatics
在后基因组时代, 系统生物学研究逐渐成为人们关注的焦点。系统生物学研究的目的是根据细胞内基因、蛋白质、代谢物以及细胞器等组分间的时空相互关系构建生物网络,了解生物行为。
组学(Omics)概念出现于21世纪初期,随着生物技术的不断更新与蓬勃发展,如今已拓展到不同的研究领域。组学主要包括基因组学(Genomics),蛋白组学(Proteinomics),代谢组学(Metabolomics),转录组学(transcriptomics),脂类组学(lipidomics), 免疫组学(Immunomics),糖组学(glycomics )和 RNA组学(RNomics)学等。
在本文中,主要介绍基因组学,转录组学,蛋白组学以及代谢组学的研究进展和应用。帮助读者了解组学研究的重要意义,认识到熟悉组学数据库对于生物信息学研究工作的开展至关重要。
基因组学(Genomics)
基因组是人类疾病研究的核心与基础, 借助高通量基因组测序技术, 研究者可以更加快速准确的找到与疾病相关的基因组序列与结构的异常变化,从而确定致病基因或易感位点。目前利用第二代测序研究疾病在 DNA 水平的技术策略主要有外显子组测序、全基因组重测序和目标基因组区域测序等[1]。
一.药物基因组学
根据世界卫生组织调查发现药物安全性问题是住院病人致死最重要的原因之一。药物反应个体差异所致不良反应已成为危害人类健康的重要公共卫生问题。现代医学和药学研究已经表明, 遗传因素是造成药物反应个体差异的主要原因[2]。
药物基因组学(pharmacogenomic)研究的一个长期目标是了解遗传差异(基因多态性)导致不同个体间药物代谢能力的差异, 以及药物在不同个体间作用效果及副作用的差异, 从而实现根据个体情况进行个体化用药。
应用药物基因组学技术和遗传药理学的知识,指导新药物的研发,可以减少对用药者的毒害副作用,节省高昂的临床研究成本, 缩短上市所需时间及保证上市后的安全性和有效性[2]。
二.肿瘤基因组学
大量的研究资料表明,肿瘤的发生、发展是一个多基因变异累积的过程。人们对肿瘤发病机制的研究也慢慢地从鉴定癌基因发展到肿瘤基因组学研究[3]。
肿瘤基因组学就是通过大规模的测序来建立肿瘤基因组图谱,从而阐明各类肿瘤的基因组变异规律及其在肿瘤发生发展过程中的作用。
肿瘤细胞具有高度特异性,同一种肿瘤在不同患者具有不同的基因突变谱,在同一肿瘤的不同部位、甚至不同的细胞群都有不同的基因突变谱。因此,利用肿瘤基因组学技术去发现更多的肿瘤驱动基因,建立相关的分子诊断技术,并开发出相应的靶向药物是目前亟待解决的问题,也是未来肿瘤研究的主要方向[4]。
随着基因组学技术的不断发展,人们将会对基因变异与疾病之间关系有更深入、更系统的理解,并将其高效地转化到临床应用中,最终造福于人类的健康。
转录组学(transcriptomics)
转录组是指某一生物或细胞所有基因表达的 RNA。转录组学是一门对某一生物或细胞所有基因表达的 RNA ( 如 m RNA)进行全面分析的科学。从广义上讲,转录组的研究对象为特定细胞在某一生理状态下所转录加工的RNA分子,包括信使RNA、核糖体RNA、转运RNA及非编码。RNA等功能单元[5]。
近年来,第二代测序技术凭借高准确性、高通量、高灵敏度和低运行成本等优势逐渐成为 RNA水平研究疾病的重要手段。目前, 基于第二代测序技术的 RNA 水平研究疾病的方法包括:转录组测序、数字基因表达谱测序和小 RNA 测序等。
转录组是连接基因组遗传信息与生物功能的必然纽带, 转录组研究已经成为揭示疾病的基因突变规律、疾病发生发展的重要机制、发现致病基因的关键靶点等领域的最佳研究手段, 广泛应用于疾病预防、诊断、个性化治疗和预后等领域。
蛋白组学(Proteinomics)
蛋白质作为生命体中最终发挥基因功能的活性大分子, 其多样性决定了细胞功能的多态性, 在众多生物功能中, 例如疾病的发生和发展过程, 发挥着举足轻重的作用。
蛋白质组包括某特定时间内一种细胞乃至一种生物所表达的全部蛋白质,不仅包含直接从基因序列上翻译的,也包括剪接,翻译后的修饰及两者结合的蛋白与蛋白相互作用。
蛋白质组学是研究生物体、组织、细胞中所有蛋白质的组成、结构、功能及其蛋白相互作用的一门科学。其技术主要包括质谱
技术、蛋白质芯片技术、双向电泳、表面等离子体共振技术、蛋白质复合物纯化技术和生物信息学分 析等,近年来飞行质谱联用技术,具有大规模、高通量和系统化等特点及优势,在蛋白质组学研究中发挥着重要作用[6]。
在恶性肿瘤研究中,蛋白质组学技术发挥了重要的作用。一方面,能筛选出相关的血清蛋白标志物,并建立相关疾病的诊断模型,提供一种全新的血清学诊断方法;另一方面,可通过这些特异性标志物,为易感人群的筛查、早期诊断、治疗选择和随访提供参考依据[7]。
在遗传性疾病研究中,蛋白质组学具有良好的应用前景。可通过蛋白质组学的技术,深入剖析这些遗传病的病理生理机制。在一定程度上,能增加对这些疾病的认识,也为疾病的预防和诊疗提供强有力的依据,寻找诊疗遗传病的生物标记物和关键的药物靶点[8]。
代谢组学(Metabolomics)
代谢产物是基因和蛋白的下游产物也是最终产物,主要是一些参与生物体新陈代谢、维持生物体正常功能和生长发育的小分子化合物。代谢组学是通过考察生物体系受到刺激或扰动后,其代谢产物的变化或其随时间的变化,来研宄生物体系的一门科学。代谢处于生命活动的终端,因此代谢组学比基因组学、蛋白质组学更接近于表型[9] 。
代谢组学研究的目的是定量分析一个生物系统内所有代谢物的含量。代谢组学分析可以指示细胞、组织或器官的生化状态, 协助阐释新基因或未知功能基因的功能[10], 并且可以揭示生物各代谢网络间的关联性, 帮助人们更系统地认识生物体。
代谢组学通过高分辨的质谱、核磁等技术,对机体体液或组织中代谢物进行高通量分析,并结合多元统计学,模式识别模型筛选与疾病相关且具有显著差异的代谢标志物,为疾病的诊治提供科学依据。
生物体是一个完整的系统,生物体液、细胞和组织中的代谢物处于一个动态平衡的状态,当疾病出现时,病理紊乱就会引起一些内源性代谢物的种类及浓度等发生改变。这些变化都可以应用代谢组学技术来进行全面分析, 从而为临床的诊疗提供依据。目前,代谢组学应用于疾病领域的研究已非常广泛,涉及临床诊断、治疗监测、病理研究、器官移植等多个方面[11]。
多组学技术平台的快速更新为转化医学体系的发展、完善提供了多层次的高通量组学数据研究和获取的策略,更为大数据医学提供了有力的工具。
基因组学、转录组学、蛋白组学和代谢组学等多项组学综合技术平台的构建,多组学信息库的发展与完善,使人们可以对机体病理状态下不同层次的因子的改变进行深层发掘和解析, 如疾病基因的查找,生物标志物、给药靶点的筛选,信号通路的分析等,为疾病预防、诊断、治疗等提供了更多必要的途径和重要的手段。
在大数据时代,如何利用生物信息学分析方法,综合整理浩瀚地组学信息,是我们快速有效推进研究进展的首要问题。
参考文献
[1] 杨旭, 焦睿, 杨琳,等. 基于新一代高通量技术的人类疾病组学研究策略[J]. 遗传, 2011, 33(8):829-846.
[2] 张伟, 周宏灏. 药物基因组学和个体化医学的转化研究进展[J]. 药学学报, 2011(1):1-5.
[3] 胡学达, 杨焕明, 赫捷,等. 肿瘤基因组学与全球肿瘤基因组计划[J]. 科学通报, 2015(9):792-804.
[4] 桂耀庭. 肿瘤基因组学与精准医学[J]. 医药导报, 2016, 35(9):911-914.
[5] SULTAN M, SCHULZ M H, RICHARD H, et al. A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome. Science, 2008, 321(51):956-960
[6] 李玉香, 戎浩, 胡群英,等. 蛋白质组学在医学研究中的应用与进展[J]. 中国组织工程研究, 2016, 20(33):4985-4992.
[7] 马袁君, 程震龙, 孙野青. 生物信息学及其在蛋白质组学中的应用[J]. 生物信息学, 2008, 6(1):38-39.
[8] 盛铭浩. 生物信息学在蛋白质组学上的应用[J]. 科学与财富, 2015(22):16-16.
[9] 杨必成, 王枫, 刘淮,等. 代谢组学与精准医学[C]// 江西省中西医结合学会检验医学专业委员会成立大会暨第一次中西医结合检验医学学术交流会资料汇编. 2015.
[10] 李灏, 姜颖, 贺福初. 代谢组学技术及其在临床研究中的应用[J]. 遗传, 2008, 30(4):3-399.
[11] 孙立业, 颜贤忠. 代谢组学技术在疾病研究中的应用进展[J]. 医学综述, 2012, 18(7):961-963.
[12] 金利泰. 组学在转化医学中的应用进展[J]. 生物产业技术, 2016(6).下载本文