高通量测序常见问题
-
转录组测序
|
-
全基因组测序
|
-
靶向测序/目标区域测序
|
-
外显子组测序
|
-
16S/18S/ITS测序及宏基因组测序
|
-
文库测序
高通量测序常见问题
对于客户提交的原始样品或提取后的核酸样品,如有剩余,项目交付日期起2个月内(含2个月)免费保存,超过2个月即进行样品清理。如需返样请在项目交付后一周内通知项目管理,相关费用客户自理。
请在样品到达我方实验室前,给安升达项目管理团队发送一份填写完整的电子版 《安升达高通量测序样品信息单(组织或核酸)》。随同样本包裹附上纸质版《安升达高通量测序样品信息单》,将样本置于适当的包装箱中(干冰、蓝冰或者室温),选择速度最快的运输方式寄送至如下地址:
收件人:安升达高通量测序服务
收件地址:中国苏州工业园区科教创新区酝慧路8号
电话:15599039790
邮编:215000
国际订单:请选择最快的运货代理商,确保您的样品包装完好温度适宜,并将您的包裹追踪信息发送给安升达。因为国际货运需要清关,所以请保留足够量的样品,以防您需要再次向安升达提交材料。
转录组测序
基因芯片技术是预先针对已知序列设计探针进而捕获和定量特定的RNA序列。这意味着基因芯片技术只能检测预先选择好的转录本,如果样本mRNA以前从来没有报道过,那么基因芯片上面就不会有相应的探针序列,也就检测不到新的mRNA。而高通量转录组测序技术能够对任何样品的RNA(包括已知序列和未知序列)进行鉴定和定量分析。
转录组是直接对样本mRNA进行测序,优势显著:
1)可以直接测定每个转录本片段序列、单核苷酸分辨率的准确度,同时不存在传统
微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题;
2)灵敏度高,可以检测细胞中少至几个拷贝的稀有转录本;
3)可以对任意物种进行全基因组分析,无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析,同时能够检测未知基因,发现新的转录本,并准确地识别可变剪切位点及cSNP,UTR区域;
4)检测范围广,高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。
测序所需数据量依物种基因组大小和已知基因、转录本数目及研究目的而定。由于不同物种间转录组大小差异较大,所以测序前需要对转录组大小进行评估:① 针对有参考基因组的物种,可通过分析基因组信息,统计编码基因个数及其碱基数来评估转录组的大小,同时也可参考相近或相关物种转录组研究的文章;② 针对无参考基因组的物种,只能参考相近物种的转录组大小。对于小型基因组(如细菌)来说,我们推荐10M reads;大型基因组(如:人和小鼠)则推荐20-30M reads。所测reads数越多得到的有效数据量越大,这能增加低表达量基因的检出率。需要注意的是,足够的数据量是确保下游数据分析结果可靠性和准确性的必要条件,如果数据量过低会造成无法分析,建议您提前咨询技术支持确认测序数据量。
对于转录组测序,我们一般采用HiSeq 150PE测序。
安升达拥有专业的生物信息分析工程师,可以提供标准分析服务和高级分析(定制化分析)服务,如果客户不需要 数据分析,默认提供FASTQ格式的原始数据。 针对转录组测序,我们提供的标准数据分析内容包括:
真核有参转录组
1.测序数据质量分析
2.参考基因组序列比对分析
3.基因表达分析
4.RNA-seq整体质量评估
5.基因差异表达分析
6.GO功能富集分析
7.KEGG功能富集分析
8.可变剪切分析
9. 新转录本预测
10. SNV和InDel 分析
11. 外显子表达水平分析
12. 主成分分析
13.互作网络分析
14.基因融合分析
15. RNA编辑分析
16. LncRNA预测和功能分析
17.共表达网络分析
LncRNA分析内容
1.原始数据质量控制
2.参考基因组比对
3.转录本组装
4.基因表达分析
5. RNASeq整体质量评估
6.差异分析
7.GO富集分析
8.Pathway富集
9.可变剪切分析
10.新转录本预测
11.SNV分析
12. lncRNA鉴定和预测
13.lncRNA统计
14.lncRNA靶基因预测
15.差异lncRNA
16.差异lncRNA靶基因功能分析
17. 差异lncRNA与靶基因互作分析
无参转录组分析
1.测序数据质量评估
2. 序列组装
3. Unigene注释
4. 参考序列比对分析
5. 基因表达分析
6 .SSR分析
7. 差异表达分析
8. 功能富集分析
9. RNA-seq整体质量评估
10 .SNP分析
11. 互作网络分析
原核有参转录组
1.原始数据质量控制
2.参考基因组比对
3.新转录本预测
4.SNV分析
5.基因表达分析
6.RNASeq整体质量评估
7.差异分析
8.富集分析
9.基因结构分析
10.UTR分析
11.sRNA预测
12.互作网络分析
13 共表达分析
smallRNA分析内容
1.测序数据质量评估
2.microRNA注释及新microRNA预测
3.miRNA家族分析
4.表达差异分析
5.功能富集分析
circleRNA分析内容
1.测序数据质量分析
2.与参考基因组比对分析
3. CircRNA 鉴定及注释
4. CircRNA差异表达分析
5. 差异表达CircRNA来源基因分析
6. ceRNA分析
另外,如有个性化分析内容请和安升达项目管理团队沟通。
对于真核生物mRNA转录本,我们一般使用 poly-A选择方法来富集。采用何种方法,这取决于您的样品需求,有时去除核糖体RNA更好。有些物种具有大量的核糖体RNA,或者不含有poly-A结构,对于这样的样品,我们推荐使用核糖体RNA去除。如果您需要检测多种类型的非编码区,如长的和短的非编码RNA,那么我们也推荐核糖体RNA去除方法。
总RNA中大约有80%-90%的序列是rRNA序列,因而在测序前先要获得mRNA样品。真核生物一般通过oligo(dT)富集带有poly-A尾的mRNA,但对于不含有polyA尾的转录本序列或存在降解的总RNA样品,此种方法不适用。对于这类样品以及原核生物样品,我们会使用rRNA去除法(采用相应试剂盒)来获得mRNA序列。还有检测多种类型的非编码RNA序列时,如长的和短的非编码RNA,也会采用rRNA去除法。
之后会将mRNA片段化然后用随机引物反转录构建测序文库。
基因的表达水平用FPKM(fragments per kilobase of exon model per million mapped reads)来衡量。原始的描述请参考:https://www.nature.com/nmeth/journal/v5/n7/abs/nmeth.1226.html。
简单的说,FPKM是针对个体转录本的长度,来正常化强度上的差异。
全基因组测序
安升达可以接受多物种多类型的样品,gDNA、细胞、血液、新鲜组织、冷冻组织、石蜡切片(FFPE)、制备好的文库等多种类型的样品都可以送至公司检测。如您不能确定是否可以检测,可以通过邮件或电话咨询。
Email: NGS.Service@Azenta.com
Tel: 400-8100-669 转 3(免费)
提交基因组信息到NCBI数据库的主要步骤如下:
1)申请一个NCBI账号。
2)给提交的物种申请bioproject。https://submit.ncbi.nlm.nih.gov/subs/bioproject/
3)有了bioproject号,再通过WGS提交基因组序列。
可参考:
https://www.ncbi.nlm.nih.gov/genbank/wgs/
https://www.ncbi.nlm.nih.gov/genbank/eukaryotic_genome_submission
注意:提交序列时一般小于200bp的序列要去掉;
如果提交contig序列,则不能含有N;一般不直接提交fasta序列,需用软件转换为sqn文件提交。数据公开时间可以选择的,不是提交后立即发布了,可以根据自己的需求选择延后时间。
全基因组信息量非常庞大,而靶向测序/目标区域测序可以去掉不感兴趣的区域只研究感兴趣的基因区域,这样大大减小了目标序列长度。而对于特定的NGS平台和配置来说,数据输出量是保持不变的,所以靶向测序能够在同一条run中混合更多样品或是提高样品测序深度及覆盖度。在同一run中安排更多样品测序,就可以大大降低项目的测序成本;提高样品的测序深度就能增加检测的灵敏度,从而检测到低频的稀有突变并能测序分析更复杂(高GC/AT)的基因区域,所以有明确的目标区域时,靶向测序/目标区域测序是最佳选择。
外显子组测序是靶向测序/目标区域测序的一种形式。但是,靶点尺寸比大多数定制靶向区域大得多。因此,较之全基因组测序,其具有相同优点。
实验设计过程可以从相对简单到极其复杂,这之间难易跨度很大。
设计过程中的某项关键要素包括:
- 确定采用扩增子测序还是靶向富集
- 确定最佳的扩增子或是富集化学过程/技术
- 针对具体区域/基因确定最佳设计(例如针对高GC或复杂区域设计最佳方案会比较难)
该技术的应用包括但不限于:
- 发现普通和稀有遗传突变,其中包括点突变、插入/缺失(Indels)、拷贝数变异(CNVs)和基因重排。
- 将基因相关性表征为某一具体表型,例如疾病状态或药物反应。
- 对细胞系(其中包括真核细胞和原核细胞)进行分型分类。
- 发现抗体,包括从噬菌体展示文库和离体选择中发现抗体。
- 遗传检测,例如药物基因组学化验或肿瘤学化验。
外显子组测序
1. 更高性价比:外显子组区域包括85%的疾病相关的突变信息,却不到全基因组的2%,使得研究的成本大大降低,而且外显子区域发生的突变大多是和功能息息相关的。
2. 高深度测序:外显子组测序针对目标区段的测序深度和覆盖度都远高于全基因组重测序,因此使用它来检测低频突变十分合适,可以满足一些罕见突变导致的疾病和肿瘤的研究需要
但是外显子组测序只能获得外显子区域内部或边界的变异信息,不能检测到基因组内较大的结构性变异,也不能提供基因拷贝数变异的信息。全基因组测序能提供更加全面的基因组信息,测序数据也更加均匀和可信。
外显子组测序最为主流的三个捕获平台为Agilent、NimbleGen、Illumina,其中又以基于液相探针杂交捕获技术的Agilent平台最常用。目前,该技术广泛应用于遗传病和癌症相关的遗传变异研究中,并获得了国际癌症协会(ICGC)的鉴定认可,具体参数见下表:
指标 | Aglient | Roche | Illumina | |||
---|---|---|---|---|---|---|
探针类型 | RNA探针;与DNA形成RNA-DNA结构,比DNA探针形成的DNA-DNA结构TM值高,更稳定; | DNA探针; | DNA探针; | |||
捕获效率 | 高 | 较好 | 略差 | |||
捕获区间 | SureSelect Human All Exon V6试剂盒,60M | NimbleGen Sepcap EZ Exome试剂盒,64M | / | |||
数据库注释 | 数据库注释率最高 | 数据库注释最多 | / | |||
市场认可度 | 高 | 较高 | 较差 |
安升达数年来坚定不移地提供一流的服务,成为DNA测序和基因组学领域的全球带头人。
1. 专业可靠的方案设计:经验丰富的技术团队,结合研究目的和科研热点,提供多项实验方案以供选择
2. 严谨规范的实验操作:ISO9001质量体系认证,官方原装试剂和行业最规的范执行标准,捕获效率等指标远高官方标准
3. 灵活多样的生信分析:行业顶尖的Bio-IT服务器,个性化服务提供可直接文章发表的结果
4. 及时高效的售后服务:多节点把控项目质量,定期售后回访,主动解决客户疑问
5. 一站式下游衔接服务:提供下游sanger测序、CRISPR基因编辑、引物合成等额业务,完美衔接测序分析结果
安升达提供癌症研究外显子测序(CA_WES)和疾病研究外显子测序(DIS_WES)两种产品。
CA_WES产品的分析内容如下:
1. 测序数据质控
2. 测序数据与参考基因组比对
3. Normal样本的Germline SNV/Indel检测、注释及过滤
4. Somatic SNV/Indel检测、注释及过滤
5. Somatic CNV检测与注释
6. 遗传易感基因筛查
7. 驱动基因筛选与鉴定
8. 突变频谱及特征分析
9. 高频突变基因鉴定、富集分析及相关性分析
10. 高频CNV分析
11. 杂合性缺失(LOH)分析
12. 融合基因分析
13. 全局变异circos图
14. 其他个性化分析
DIS_WES产品分析内容如下:
1. 测序数据质控
2. 测序数据与参考基因组比对
3. SNV/Indel检测与注释
4. CNV检测与注释(样本数不少于8,且需要提供control)
5. 显隐性遗传模式筛选
6. 新生突变筛选
7. 连锁分析
8. 纯合子分析
9. SNP显著性分析
10. 候选基因筛选
11. 候选基因功能富集
12. 蛋白互作网络
13. 候选基因的疾病相关性排序
14. 其他个性化分析
16S/18S/ITS测序及宏基因组测序
1. 对未知样品进行快速种属分析
2、为生化鉴定提供指导信息
3、对于难以获得纯培养的细菌,如寄生菌等。16S宏基因组学用于鉴定样本中细菌和古生菌的类型和相对丰度。该技术能够非常有效地处理不均匀样品,例如土壤或肠道菌群和其他微生物组。
目前常用的16S宏基因组学技术采用的是单引物对,扩增16S
rRNA基因的V4区。16S MetaVx™采用了独特的引物设计,可以同时扩增16S
rRNA基因的V3、V4和V5区。
对比16S MetaVx™和传统的16S宏基因组学技术,16S
MetaVx™具有更高的灵敏度和特异性,能够鉴定许多样本中更多的细菌和古生菌种类。
16S MetaVx™测序可提供以下标准分析内容:
1. 去除Adaptors和低质量reads
2. OTU 分析
3. Rank-Abundance曲线
4. 物种分类分析
5. 稀释性曲线 (Rarefaction curve)
6. Alpha多样性分析
7. Beta多样性分析 (3个样本以上)
8. PCoA分析 (3个样本以上)
9. UPGMA聚类树 (3个样本以上)
另外,如有个性化分析内容请与安升达项目管理团队沟通。
宏基因组测序可提供以下标准分析内容:
1. 去除低质量Reads 和Adaptors
2. 宏基因组组装(多个样本默认分别组装,合并后聚类进行后续分析)
3. 物种组成和丰度计算
4. 基因预测
5. 构建非冗余基因集
6. 基因丰度统计
7. 基因功能注释 (eggNOG、KEGG和CAZy)
另外,如有个性化分析内容请和安升达项目管理团队沟通。
1.去除低质量Reads 和Adaptors
2.转录本组装
3.Unigene功能注释
4.Unigene表达分析
5.Unigene表达差异分析
6.样品间的差异基因GO富集和Pathway富集分析
7.差异比较分析
另外,如有个性化分析内容请与安升达项目管理团队沟通。
A. 散样测序:文库浓度大于3 nM(qPCR定量浓度)、体积不低于15μl且样品中不含有磁珠;文库兼容相应的测序平台;
包Lane测序:文库浓度大于5nM(qPCR定量浓度)、体积不低于15μl且样品中不含有磁珠;文库兼容相应的测序平台;
B. 如果送样体积低于15ul,我司默认稀释到15ul再进行后续实验操作;
C. 如果样品中含有磁珠,我司默认去除样品中的磁珠,再进行后续实验操作;
D. DNA文库溶解于Illumina Resuspension Buffer(RSB)或其他品牌建库试剂盒的适当缓冲液中;
E. 提供Index 序列、片段大小(根据2100结果判断)、建库方式;选择提供Agilent 2100 Bioanalyzer质检图以及Qubit结果;
F. Hiseq文库大小介于300bp-500bp之间,Miseq文库大小介于300bp-600bp之间,无引物二聚体及接头二聚体;
A. Qubit荧光定量仪检测
荧光染料只和特异性的DNA、RNA、蛋白质结合,测定所有的双链DNA的浓度;最少仅需1ul样品即可检测出文库的浓度;
B. Agilent 2100 Bioanalyzer检测
基于芯片实验室技术的核酸分析系统,通过微流体技术对不同片段大小的样品进行分离,检测出文库的片段大小和峰形;
C. qPCR检测
利用P5和P7的引物进行检测有效文库的浓度;
A. 文库峰形较宽,这是由于文库制备过程中,片段大小筛选不够集中,片段大小均一性比较差。
B. 文库含有大片段,这是由于文库制备过程中,大片段去除不完全。
C. 文库峰形不单一,如有引物二聚体或接头二聚体等,这个需根据客户文库类型判断。
其他
病毒测序可提供以下标准分析内容(需提供宿主参考基因组,及其他物种污染参考基因组):
1. 去除Adaptors和低质量Reads
a) 提供PF 和Clean data的统计分析表
b) 提供测序PF数据不同位点碱基质量分布图,GC含量分布图,测序reads碱基平均质量分布图
2. 宿主及其他物种污染评估与去除
3. 病毒基因组组装分析
4. 组装结果评估
5. 编码基因预测
6. 基因功能注释(Nr数据库)
另外,如有个性化分析内容请和安升达项目管理团队沟通。
ChIP-Seq测序可提供以下标准分析内容:
1. 去除低质量Reads 和Adaptors
2. ChIP 测序序列与参考基因组序列的比对
3. ChIP 测序 Reads 在全基因组的分布
4. 统计ChIP测序数据富集区域 ( Peak ) 的信息
5. 基于Peak相关基因功能分析
另外,如有个性化分析内容请和安升达项目管理团队沟通。
1.去除低质量Reads 和Adaptors
2.参考受体库比对
3.VDJ基因使用频率分析
4.CDR3长度分析
5.饱和度分析
另外,如有个性化分析内容请和安升达项目管理团队沟通。