生物信息学理论与医学实践_李霞 主编_AZW3_MOBI_EPUB_PDF_电子书(无页码)_李霞 主编

内容节选

第二节新一代测序技术和工作流程 Section 2 Work FIow of Next-Generation Sequencing 高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。 高通量测序可以帮助研究者跨过文库构建这一实验步骤,避免了亚克隆过程中引入的偏差。依靠后期强大的生物信息学分析能力,对照一个参比基因组(reference genome)高通量测序技术可以非常轻松完成基因组重测序(resequencing),2007年Van Orsouw等人结合改进的AFLP技术和454测序技术对玉米基因组进行了重测序,该重测序实验发现的超过75%的SNP位点能够用SNPWave技术验证,提供了一条对复杂基因组特别是含有高度重复序列的植物基因组进行多态性分析的技术路线。2008年Hillier对线虫CB4858品系进行Solexa重测序,寻找线虫基因组中的SNP位点和单位点的缺失或扩增。但是也应该看到,由于高通量测序读取长度的限制,使其在对未知基因组进行从头测序(de novo sequencing)的应用受到限制,这部分工作仍然需要传统测序(读取长度达到850碱基)的协助。但是这并不影响高通量测序技术在全基因组mRNA表达谱,microRNA表达谱,ChIP-chip以及DNA甲基化等方面的应用。 2008年Mortazavi等人对小鼠的大脑、肝脏和骨骼肌进行了RNA深度测序,这项工作展示了深度测序在转录组研究上的两大进展,表达计数和序列分析。对测得的每条序列进行计数获得每个特定转录本的表达量,是一种数码化的表达谱检测,能检测到丰度非常低的转录本。分析测得的序列,有大于90%的数据显示落在已知的外显子中,而那些在已知序列之外的信息通过数据分析展示的是从未被报道过的RNA剪切形式,3’端非翻译区,变动的启动子区域以及潜在的小RNA前体,发现至少有3500个基因拥有不止一种剪切形式。而这些信息无论使用芯片技术还是SAGE文库测序都是无法被发现的。 高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易地解决芯片技术在检测小分子时遇到的技术难题(短序列,高度同源),而且小分子RNA的短序列正好配合了高通量测序的长度,使得数据“不浪费”,同时测序方法还能在实验中发现新的小分子RNA。在衣藻、斑马鱼、果蝇、线虫、人和黑猩猩中都已经成功地找到了新的小分子RNA。在线虫中获得了40万个序列,通过分析发现了18个新的小RNA分子和一类全新的小分子RNA。 在DNA—蛋白质相互作用的研究上,染色质免疫沉淀—深度测序(ChIP-seq)实验也展示了其非常大的潜力。染色质免疫沉淀以后的DNA直接进行测序,对比ref seq可以直接获得蛋白与DNA结合的位点信息,相比ChIP-chip,ChIP-seq可以检测更小的结合区段、未知的结合位点、结合位点内的突变情况和蛋白亲合力较低的区段。 一、新一代测序法和常见的测序仪 最近市面上出现了很多新一代测序仪产品,例如454基因组测序仪、Illumina测序仪、SOLiD测序仪、Polonator测序仪以及HeliScope单分子测序仪。所有这些新型测序仪都使用了一种新的测序策略——循环芯片测序法(cyclic-array sequencing),也可将其称为“新一代测序技术或者第二代测序技术”。 所谓循环芯片测序法(图6-2),简言之就是对布满DNA样品的芯片重复进行基于DNA的聚合酶反应(模板变性、引物退火杂交及延伸)以及荧光序列读取反应。2005年,有两篇论文曾对这种方法做出过详细介绍。与传统测序法相比,循环芯片测序法具有操作更简易、费用更低廉的优势,于是很快就获得了广泛的应用。 图6-2 Sanger测序法和新一代测序技术工作流程图 在开发新型高通量、高并行运行方法时碰到的一个关键问题是,如何将反应试剂同时加入数量如此之多的各个反应体系中?在焦磷酸测序的过程当中需要反复加入不同的碱基以供测序反应使用,而当时的自动化加样设备无法有效地做到对这么多的反应体系同时循环加样。于是,开发一种全新的高密度并行处理方法这一重要课题又再一次摆在了科研人员的面前。这一次,我们找到了一个非常简单但是又很巧妙地方法。在高密度的反应芯片表面使用层流(laminar flow)加样方式,反应试剂会通过扩散作用很好地进入每一个反应体系,而且也可以用层流的方式洗去多余的反应试剂。现在,所有的新一代测序仪都采用了这种层流......

  1. 信息
  2. 序言
  3. 绪论
  4. 第一节 生物信息学的产生及发展
  5. 第二节 生物信息学的主要研究内容
  6. 第三节 当前生物信息学研究的热点
  7. 第一章 序列比对与序列特征分析
  8. 第一节 获取DNA、RNA和蛋白质序列
  9. 第二节 双序列比对
  10. 第三节 多序列比对
  11. 第四节 核酸序列特征分析
  12. 第五节 蛋白质序列特征分析
  13. 第六节 应用实例
  14. 参考文献
  15. 第二章 基因芯片数据分析
  16. 第一节 基因芯片平台简介
  17. 第二节 基因芯片数据的预处理
  18. 第三节 特征基因挖掘
  19. 第四节 基因芯片数据的聚类分析
  20. 第五节 基因芯片数据的分类分析
  21. 第六节 基因芯片数据库及常用分析软件
  22. 参考文献
  23. 第三章 基因注释与功能分类
  24. 第一节 引言
  25. 第二节 基因注释数据库
  26. 第三节 基因功能预测
  27. 第四节 基因集合富集分析
  28. 第五节 基因功能比较
  29. 参考文献
  30. 第四章 蛋白质结构分析
  31. 第一节 蛋白质高级结构
  32. 第二节 蛋白质的结构解析与预测
  33. 第三节 蛋白质高级结构预测方法
  34. 第四节 基于蛋白质结构的功能分析
  35. 第五节 蛋白质的结构异常与疾病
  36. 第六节 应用实例
  37. 参考文献
  38. 第五章 分子进化分析
  39. 第一节 系统发生分析与重建
  40. 第二节 核苷酸和蛋白质的适应性进化
  41. 第三节 分子进化与生物信息学
  42. 第四节 应用实例:SARS流行病的系统发生分析
  43. 参考文献
  44. 第六章 新一代测序数据分析
  45. 第一节 全基因组测序与重测序
  46. 第二节 新一代测序技术和工作流程
  47. 第三节 新一代测序数据存储、处理与分析
  48. 第四节 DNA和RNA测序
  49. 第五节 研究实例:基于新一代测序技术的癌症组学研究
  50. 参考文献
  51. 第七章 转录调控的信息学分析
  52. 第一节 基因的转录调控
  53. 第二节 启动子的信息学分析
  54. 第三节 转录因子结合位点的信息学研究
  55. 第四节 可变剪接的生物信息学研究
  56. 第五节 转录调控与人类疾病
  57. 第六节 应用实例
  58. 参考文献
  59. 第八章 生物分子网络与通路
  60. 第一节 网络的基本概念
  61. 第二节 生物分子网络种类
  62. 第三节 生物分子网络分析方法
  63. 第四节 通路的网络分析方法
  64. 第五节 应用实例:疾病代谢子通路识别、网络构建和分析
  65. 参考文献
  66. 第九章 复杂疾病的系统遗传学分析
  67. 第一节 复杂疾病的分子遗传学特征
  68. 第二节 变异组信息学与复杂疾病遗传定位
  69. 第三节 复杂疾病的分子系统分析
  70. 第四节 系统遗传学集成软件工具
  71. 参考文献
  72. 第十章 miRNA与复杂疾病
  73. 第一节 miRNA与其靶基因
  74. 第二节 miRNA转录组
  75. 第三节 miRNA调控网络
  76. 第四节 miRNA多态和复杂疾病
  77. 参考文献
  78. 第十一章 计算表观遗传学
  79. 第一节 引言
  80. 第二节 表观基因组图谱绘制
  81. 第三节 表观遗传修饰谱分析
  82. 第四节 表观遗传异常标记物识别
  83. 第五节 人类表观基因组计划及意义
  84. 第六节 应用实例:用于疾病的风险预测、诊断、预后及治疗的表观基因组数据分析
  85. 参考文献
  86. 第十二章 药物生物信息学
  87. 第一节 药学相关信息资源
  88. 第二节 基于生物信息学方法发现潜在药物靶标
  89. 第三节 药物基因组学
  90. 参考文献