下机缩率(Reads Mapping Rate),是指测序后读长与原始序列长度的比值,通俗来说就是测序数据的“损失率”。它可以反映测序质量和可靠程度,同时对后续的数据分析也有很大的影响。
下机缩率的计算方法是将测序数据比对到参考基因组上,然后根据比对结果计算比率。一般来说,比对软件会输出两个值:mapped reads数和total reads数。mapped reads数指比对上参考基因组上的reads数,total reads数指测序仪测出的总reads数。通过下面的公式可以计算出下机缩率:
下机缩率= mapped reads数 / total reads数 * 100%
下机缩率的影响因素很多,包括测序仪的品质、样本的质量、DNA/RNA提取质量、文库制备质量、测序深度、比对软件、参考基因组的选择等等。
其中,测序深度是影响下机缩率的最重要因素之一。如果测序深度过低,会导致reads数不足,最终导致下机缩率降低。另外,比对软件和参考基因组的选择也会影响下机缩率的结果。
下机缩率可以反映出测序数据的质量和可靠程度,同时对后续的数据分析也有很大的影响。如果下机缩率过低,会导致数据无法得到很好的比对和拼接,从而影响后续的基因组装和差异表达分析。因此,科研人员在进行测序数据分析时,需要根据不同的应用场景和研究目的制定不同的下机缩率标准。
常用的下机缩率标准一般为90%~95%。在获得较高的下机缩率后,进一步对数据进行质控和过滤,可以提高数据的质量和可靠性。同时,在实际应用中,也需要根据不同的应用场景选择不同的下机缩率标准,以保证数据的准确性和可靠性。