高通量测序FAQ - 金唯智官网

高通量测序常见问题

转录组测序
全基因组测序
靶向测序/目标区域测序
外显子组测序
16S/18S/ITS测序及宏基因组测序
文库测序

高通量测序常见问题

项目完成后，安升达能将原始样品返还给我吗？

对于客户提交的原始样品或提取后的核酸样品，如有剩余，项目交付日期起2个月内(含2个月)免费保存，超过2个月即进行样品清理。如需返样请在项目交付后一周内通知项目管理，相关费用客户自理。

我怎样监控NGS项目进程？

安升达在收到样品和完成样品检测时都会向客户发送邮件。此后，安升达每周向客户更新一次项目进展，直到项目结束。

安升达如何保证测序数据的安全性？

安升达非常注重客户信息的保密性及保护知识产权的安全性，并对结果严格保密，不会泄露给第三方。如需获得更多信息，请查阅安升达保密政策。

我怎样向安升达提交样品？

请在样品到达我方实验室前，给安升达项目管理团队发送一份填写完整的电子版 《安升达高通量测序样品信息单(组织或核酸)》。随同样本包裹附上纸质版《安升达高通量测序样品信息单》，将样本置于适当的包装箱中（干冰、蓝冰或者室温），选择速度最快的运输方式寄送至如下地址：

收件人：安升达高通量测序服务
收件地址：中国苏州工业园区科教创新区酝慧路8号
电话：15599039790
邮编：215000

国际订单：请选择最快的运货代理商，确保您的样品包装完好温度适宜，并将您的包裹追踪信息发送给安升达。因为国际货运需要清关，所以请保留足够量的样品，以防您需要再次向安升达提交材料。

转录组测序

什么是转录组测序？

转录组测序是利用深度测序技术研究特定组织或细胞在某个时期转录出来的所有mRNA，可以对样品中的mRNA序列进行全面的定量和分析。转录组研究是基因功能及结构研究的基础和出发点，已广泛应用于基础研究、临床诊断和药物研发等领域。

转录组测序和基因芯片技术有何区别？

基因芯片技术是预先针对已知序列设计探针进而捕获和定量特定的RNA序列。这意味着基因芯片技术只能检测预先选择好的转录本，如果样本mRNA以前从来没有报道过，那么基因芯片上面就不会有相应的探针序列，也就检测不到新的mRNA。而高通量转录组测序技术能够对任何样品的RNA（包括已知序列和未知序列）进行鉴定和定量分析。

转录组是直接对样本mRNA进行测序，优势显著：
1）可以直接测定每个转录本片段序列、单核苷酸分辨率的准确度，同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题；
2）灵敏度高，可以检测细胞中少至几个拷贝的稀有转录本；
3）可以对任意物种进行全基因组分析，无需预先设计特异性探针，因此无需了解物种基因信息，能够直接对任何物种进行转录组分析，同时能够检测未知基因，发现新的转录本，并准确地识别可变剪切位点及cSNP，UTR区域；
4）检测范围广，高于6个数量级的动态检测范围，能够同时鉴定和定量稀有转录本和正常转录本。

我的实验需要多少reads？这些reads的长度是多少？

测序所需数据量依物种基因组大小和已知基因、转录本数目及研究目的而定。由于不同物种间转录组大小差异较大，所以测序前需要对转录组大小进行评估：① 针对有参考基因组的物种，可通过分析基因组信息，统计编码基因个数及其碱基数来评估转录组的大小，同时也可参考相近或相关物种转录组研究的文章;② 针对无参考基因组的物种，只能参考相近物种的转录组大小。对于小型基因组(如细菌)来说，我们推荐10M reads;大型基因组(如：人和小鼠)则推荐20-30M reads。所测reads数越多得到的有效数据量越大，这能增加低表达量基因的检出率。需要注意的是，足够的数据量是确保下游数据分析结果可靠性和准确性的必要条件，如果数据量过低会造成无法分析，建议您提前咨询技术支持确认测序数据量。

对于转录组测序，我们一般采用HiSeq 150PE测序。

安升达接受哪些起始材料？对样品的要求是什么？

安升达建议起始材料送总RNA，同时，我们也接受ds-cDNA、mRNA、细胞、血液和组织等样品。

总RNA及其他样本要求可参阅“样品制备指南”页面或咨询技术支持。

贵公司提供数据分析服务吗？

安升达拥有专业的生物信息分析工程师，可以提供标准分析服务和高级分析(定制化分析)服务，如果客户不需要数据分析，默认提供FASTQ格式的原始数据。针对转录组测序，我们提供的标准数据分析内容包括：

真核有参转录组

1.测序数据质量分析

2.参考基因组序列比对分析

3.基因表达分析

4.RNA-seq整体质量评估

5.基因差异表达分析

6.GO功能富集分析

7.KEGG功能富集分析

8.可变剪切分析

9. 新转录本预测

10. SNV和InDel 分析

11. 外显子表达水平分析

12. 主成分分析

13.互作网络分析

14.基因融合分析

15. RNA编辑分析

16. LncRNA预测和功能分析

17.共表达网络分析

LncRNA分析内容

1.原始数据质量控制

2.参考基因组比对

3.转录本组装

4.基因表达分析

5. RNASeq整体质量评估

6.差异分析

7.GO富集分析

8.Pathway富集

9.可变剪切分析

10.新转录本预测

11.SNV分析

12. lncRNA鉴定和预测

13.lncRNA统计

14.lncRNA靶基因预测

15.差异lncRNA

16.差异lncRNA靶基因功能分析

17. 差异lncRNA与靶基因互作分析

无参转录组分析

1.测序数据质量评估

2. 序列组装

3. Unigene注释

4. 参考序列比对分析

5. 基因表达分析

6 .SSR分析

7. 差异表达分析

8. 功能富集分析

9. RNA-seq整体质量评估

10 .SNP分析

11. 互作网络分析

原核有参转录组

1.原始数据质量控制

2.参考基因组比对

3.新转录本预测

4.SNV分析

5.基因表达分析

6.RNASeq整体质量评估

7.差异分析

8.富集分析

9.基因结构分析

10.UTR分析

11.sRNA预测

12.互作网络分析

13 共表达分析

smallRNA分析内容

1.测序数据质量评估

2.microRNA注释及新microRNA预测

3.miRNA家族分析

4.表达差异分析

5.功能富集分析

circleRNA分析内容

1.测序数据质量分析

2.与参考基因组比对分析

3. CircRNA 鉴定及注释

4. CircRNA差异表达分析

5. 差异表达CircRNA来源基因分析

6. ceRNA分析

另外，如有个性化分析内容请和安升达项目管理团队沟通。

安升达能帮助客户进行RNA-Seq实验设计吗？

安升达有经验丰富的技术支持团队，可以协助客户明确实验目的，设计实验方案。如需帮助，可通过电子邮件或电话：400-8100-669 转 3 进行咨询，也可联系所属区域销售。

poly-A建库及核糖体RNA去除方法的区别是?如何选择?

对于真核生物mRNA转录本，我们一般使用 poly-A选择方法来富集。采用何种方法，这取决于您的样品需求，有时去除核糖体RNA更好。有些物种具有大量的核糖体RNA，或者不含有poly-A结构，对于这样的样品，我们推荐使用核糖体RNA去除。如果您需要检测多种类型的非编码区，如长的和短的非编码RNA，那么我们也推荐核糖体RNA去除方法。

总RNA中大约有80%-90%的序列是rRNA序列，因而在测序前先要获得mRNA样品。真核生物一般通过oligo(dT)富集带有poly-A尾的mRNA，但对于不含有polyA尾的转录本序列或存在降解的总RNA样品，此种方法不适用。对于这类样品以及原核生物样品，我们会使用rRNA去除法(采用相应试剂盒)来获得mRNA序列。还有检测多种类型的非编码RNA序列时，如长的和短的非编码RNA，也会采用rRNA去除法。

之后会将mRNA片段化然后用随机引物反转录构建测序文库。

如果我们提供的RNA/cDNA样品数比安升达要求的少，结果会如何?

安升达可以对少量的样品起始材料进行测序，但是我们不能保证整个实验的结果。

研究物种没有参考序列，是否可以选择近缘物种参考序列进行转录组后续信息分析？

如果选择的近缘物种基因序列高度相似，可以利用已公布的近缘物种基因组数据做参照进行后续信息分析，但我们推荐先进行denovo组装，利用denovo组装的序列做参考进行后续基因差异表达分析与功能富集分析等。

如何对得到的数目较多的差异基因进行后期验证？

转录组测序后可选取有代表性序列使用实时荧光定量PCR（qRT-PCR）技术来验证测序结果。基因的挑选原则：首先，要根据自己的实验目的选择，从GO和KEGG的聚类分析结果入手，选择差异表达基因；其次，选择基因表达量高的基因，至少在一个样品中的表达量（RPKM或FPKM）大于50；根据基因序列能设计出合适qPCR引物。

什么是FPKM?

基因的表达水平用FPKM（fragments per kilobase of exon model per million mapped reads）来衡量。原始的描述请参考：https://www.nature.com/nmeth/journal/v5/n7/abs/nmeth.1226.html。

简单的说，FPKM是针对个体转录本的长度，来正常化强度上的差异。

qPCR验证结果为什么和NGS结果不一致？

qPCR检测和NGS测序这两种方法本身在实验原理和流程上存在很大差异，数据分析的原理也不一样，部分结果存在的一定的差异属于正常情况。一般推荐选择NGS测序中基因表达量高，差异显著的基因进行qPCR验证。另外以下几方面也会对qPCR验证的一致性产生影响：没有用同一批样品来做实验；样品中有其他物种污染或rRNA污染致使转录组测序的基因表达量不准确；做QPCR验证的基因表达量偏低，差异不显著。在保证实验无误的情况下，基因表达水平以qPCR为准。

全基因组测序

什么是全基因组重测序？

全基因组重测序是对基因组序列已知物种的个体进行基因组测序，并在个体或群体水平上进行差异信息分析的方法。

什么是基因组de novo测序？

de novo测序也称为从头测序，不依赖于任何参考序列就可以对某个物种进行测序并利用生物信息学分析手段对序列进行拼接，组装，从而获得该物种的基因组图谱。

我想进行全基因组测序，贵公司可以接受哪些类型的样品？

安升达可以接受多物种多类型的样品，gDNA、细胞、血液、新鲜组织、冷冻组织、石蜡切片（FFPE）、制备好的文库等多种类型的样品都可以送至公司检测。如您不能确定是否可以检测，可以通过邮件或电话咨询。

Email： NGS.Service@Azenta.com

Tel: 400-8100-669 转 3（免费）

为什么要进行人全基因组测序？

从个体角度来讲，人出生时可能就携带了一些致病基因，在之后的生活过程中，可能又有一些基因突变导致诸如癌症等疾病的发生，通过全基因组测序可全面挖掘DNA水平的遗传变异，为筛选疾病的致病及易感基因，研究发病及遗传机制提供重要信息；同时对基因治疗、风险人群的疾病预防、环境因子等方面的研究具有重要意义。从群体水平来讲，全基因组测序对研究不同人种的亲缘关系和研究生物进化提供分子水平的支持。

测序深度如何选择？

根据不同的研究目的，测序深度的选择是不一样的。测序错误率或变异检测（如SNP）假阳性结果会随着测序深度的提升而下降，根据统计，当测序深度达到30X时，SNP检测才会达到饱和，所以个体的全基因组遗传信息检测推荐30X测序深度，癌组织检测推荐50X及以上，以保证中低频变异的检测成功率；群体遗传学分析时是通过计算基因组不同区域的多样性变化来推断，一般10X测序深度即可满足要求。

全基因组重测序服务可以提供哪些分析内容？

基本的信息分析包括数据质控，与参考基因组进行比对、统计测序深度及覆盖度，全基因组区域的SNV/InDel检测及注释，样品间差异SNV/InDel统计，Somatic SNV检测（癌组织），突变位点对应基因的GO富集和KEGG富集分析，基因组结构变异分析（CNV、SV）。另外，我们公司可以根据您的需求提供个性化的高级分析服务，详情请与技术支持联系沟通。

如何验证重测序的结果？

通过全基因组重测序一般能够发现SNP、InDel、SV、CNV等多种遗传变异，不同的变异类型，其验证方法也不相同： ① SNP和InDel可以通过一代测序的方法进行验证，即设计引物PCR扩增包含该SNP/InDel位点的区段，并进行Sanger测序；② CNV可通过Real-time PCR对存在拷贝数变异的片段进行扩增，并根据CT值估算不同个体的拷贝数变化倍数。 ③ 小的SVs可通过PCR扩增和测序辨别，而大的SVs则需要通过亚显微方法发现，如FISH等。

如何批量将整个基因组序列都上传到Genbank中？

提交基因组信息到NCBI数据库的主要步骤如下：

1）申请一个NCBI账号。
2）给提交的物种申请bioproject。https://submit.ncbi.nlm.nih.gov/subs/bioproject/
3）有了bioproject号，再通过WGS提交基因组序列。

可参考：
https://www.ncbi.nlm.nih.gov/genbank/wgs/
https://www.ncbi.nlm.nih.gov/genbank/eukaryotic_genome_submission
注意：提交序列时一般小于200bp的序列要去掉；如果提交contig序列，则不能含有N；一般不直接提交fasta序列，需用软件转换为sqn文件提交。数据公开时间可以选择的，不是提交后立即发布了，可以根据自己的需求选择延后时间。

靶向测序/目标区域测序

什么是靶向测序/目标区域测序？

靶向测序/目标区域测序是通过杂交或扩增方法富集基因组中感兴趣区域然后利用高通量测序技术进行测序。通过对大量样本的目标区域进行研究，有助于发现和验证疾病相关候选基因或相关位点，在临床诊断和药物开发方面有着巨大的应用潜力，并且此方法还能有效节约单个样品的研究成本。

为什么采用靶向测序/目标区域测序，而不是全基因组或外显子组测序？

全基因组信息量非常庞大，而靶向测序/目标区域测序可以去掉不感兴趣的区域只研究感兴趣的基因区域，这样大大减小了目标序列长度。而对于特定的NGS平台和配置来说，数据输出量是保持不变的，所以靶向测序能够在同一条run中混合更多样品或是提高样品测序深度及覆盖度。在同一run中安排更多样品测序，就可以大大降低项目的测序成本；提高样品的测序深度就能增加检测的灵敏度，从而检测到低频的稀有突变并能测序分析更复杂（高GC/AT）的基因区域，所以有明确的目标区域时，靶向测序/目标区域测序是最佳选择。

外显子组测序是靶向测序/目标区域测序的一种形式。但是，靶点尺寸比大多数定制靶向区域大得多。因此，较之全基因组测序，其具有相同优点。

所有这些不同类型的靶向测序/目标区域测序都有哪些优势和劣势，对于某个具体项目，安升达是如何选定采用哪种技术的？

实验设计过程可以从相对简单到极其复杂，这之间难易跨度很大。

设计过程中的某项关键要素包括：

确定采用扩增子测序还是靶向富集
确定最佳的扩增子或是富集化学过程/技术
针对具体区域/基因确定最佳设计（例如针对高GC或复杂区域设计最佳方案会比较难）

安升达在靶向实验设计方面具有丰富的经验，开发了多种内部专有基因检测平台（panels），并为具体应用（例如，为癌症研究进行优化的OncoGxOne™ Discovery cancer panels）进行优化。

靶向测序/目标区域测序技术如何应用？

该技术的应用包括但不限于：

发现普通和稀有遗传突变，其中包括点突变、插入/缺失（Indels）、拷贝数变异（CNVs）和基因重排。
将基因相关性表征为某一具体表型，例如疾病状态或药物反应。
对细胞系（其中包括真核细胞和原核细胞）进行分型分类。
发现抗体，包括从噬菌体展示文库和离体选择中发现抗体。
遗传检测，例如药物基因组学化验或肿瘤学化验。

我在什么地方能够获得更多信息？

如需获得更多信息，请联系安升达专业团队NGS.Service@Azenta.com。

外显子组测序

什么是外显子组测序？

外显子组测序(whole exome sequencing)是利用序列捕获技术将外显子区域DNA捕捉富集后，进行高通量测序的基因组分析方法。已经被广泛应用于研究遗传病和癌症的致病机理等研究领域。

较之全基因组测序，外显子组测序有哪些优势？

1. 更高性价比：外显子组区域包括85%的疾病相关的突变信息，却不到全基因组的2%，使得研究的成本大大降低，而且外显子区域发生的突变大多是和功能息息相关的。

2. 高深度测序：外显子组测序针对目标区段的测序深度和覆盖度都远高于全基因组重测序，因此使用它来检测低频突变十分合适，可以满足一些罕见突变导致的疾病和肿瘤的研究需要

但是外显子组测序只能获得外显子区域内部或边界的变异信息，不能检测到基因组内较大的结构性变异，也不能提供基因拷贝数变异的信息。全基因组测序能提供更加全面的基因组信息，测序数据也更加均匀和可信。

目前市场上主要的外显子捕获试剂盒有哪些，如何选择?

外显子组测序最为主流的三个捕获平台为Agilent、NimbleGen、Illumina，其中又以基于液相探针杂交捕获技术的Agilent平台最常用。目前，该技术广泛应用于遗传病和癌症相关的遗传变异研究中，并获得了国际癌症协会(ICGC)的鉴定认可，具体参数见下表：

指标	Aglient	Roche	Illumina
探针类型	RNA探针;与DNA形成RNA-DNA结构，比DNA探针形成的DNA-DNA结构TM值高，更稳定;	DNA探针;	DNA探针;
捕获效率	高	较好	略差
捕获区间	SureSelect Human All Exon V6试剂盒，60M	NimbleGen Sepcap EZ Exome试剂盒，64M	/
数据库注释	数据库注释率最高	数据库注释最多	/
市场认可度	高	较高	较差

外显子组测序项目为什么选择安升达？

安升达数年来坚定不移地提供一流的服务，成为DNA测序和基因组学领域的全球带头人。

1. 专业可靠的方案设计：经验丰富的技术团队，结合研究目的和科研热点，提供多项实验方案以供选择

2. 严谨规范的实验操作：ISO9001质量体系认证，官方原装试剂和行业最规的范执行标准，捕获效率等指标远高官方标准

3. 灵活多样的生信分析：行业顶尖的Bio-IT服务器，个性化服务提供可直接文章发表的结果

4. 及时高效的售后服务：多节点把控项目质量，定期售后回访，主动解决客户疑问

5. 一站式下游衔接服务：提供下游sanger测序、CRISPR基因编辑、引物合成等额业务，完美衔接测序分析结果

外显子组测序可以提供哪些分析内容？

安升达提供癌症研究外显子测序(CA_WES)和疾病研究外显子测序(DIS_WES)两种产品。

CA_WES产品的分析内容如下：

1. 测序数据质控

2. 测序数据与参考基因组比对

3. Normal样本的Germline SNV/Indel检测、注释及过滤

4. Somatic SNV/Indel检测、注释及过滤

5. Somatic CNV检测与注释

6. 遗传易感基因筛查

7. 驱动基因筛选与鉴定

8. 突变频谱及特征分析

9. 高频突变基因鉴定、富集分析及相关性分析

10. 高频CNV分析

11. 杂合性缺失(LOH)分析

12. 融合基因分析

13. 全局变异circos图

14. 其他个性化分析

DIS_WES产品分析内容如下：

1. 测序数据质控

2. 测序数据与参考基因组比对

3. SNV/Indel检测与注释

4. CNV检测与注释(样本数不少于8,且需要提供control)

5. 显隐性遗传模式筛选

6. 新生突变筛选

7. 连锁分析

8. 纯合子分析

9. SNP显著性分析

10. 候选基因筛选

11. 候选基因功能富集

12. 蛋白互作网络

13. 候选基因的疾病相关性排序

14. 其他个性化分析

16S/18S/ITS测序及宏基因组测序

16S宏基因组学有哪些应用？

1. 对未知样品进行快速种属分析

2、为生化鉴定提供指导信息

3、对于难以获得纯培养的细菌，如寄生菌等。16S宏基因组学用于鉴定样本中细菌和古生菌的类型和相对丰度。该技术能够非常有效地处理不均匀样品，例如土壤或肠道菌群和其他微生物组。

16S MetaVx™测序与16S宏基因组学方法有什么不同？

目前常用的16S宏基因组学技术采用的是单引物对，扩增16S rRNA基因的V4区。16S MetaVx™采用了独特的引物设计，可以同时扩增16S rRNA基因的V3、V4和V5区。

对比16S MetaVx™和传统的16S宏基因组学技术，16S MetaVx™具有更高的灵敏度和特异性，能够鉴定许多样本中更多的细菌和古生菌种类。

16S MetaVx™测序可以提供哪些分析内容？

16S MetaVx™测序可提供以下标准分析内容：

1. 去除Adaptors和低质量reads
2. OTU 分析
3. Rank-Abundance曲线
4. 物种分类分析
5. 稀释性曲线 (Rarefaction curve)
6. Alpha多样性分析
7. Beta多样性分析 (3个样本以上)
8. PCoA分析 (3个样本以上)
9. UPGMA聚类树 (3个样本以上)

另外，如有个性化分析内容请与安升达项目管理团队沟通。

宏基因组测序可以提供哪些分析内容？

宏基因组测序可提供以下标准分析内容：
1. 去除低质量Reads 和Adaptors
2. 宏基因组组装（多个样本默认分别组装，合并后聚类进行后续分析）
3. 物种组成和丰度计算
4. 基因预测
5. 构建非冗余基因集
6. 基因丰度统计
7. 基因功能注释（eggNOG、KEGG和CAZy）

另外，如有个性化分析内容请和安升达项目管理团队沟通。

宏转录组测序可以提供哪些分析内容？

1.去除低质量Reads 和Adaptors

2.转录本组装

3.Unigene功能注释

4.Unigene表达分析

5.Unigene表达差异分析

6.样品间的差异基因GO富集和Pathway富集分析

7.差异比较分析