promethease.com 给我发了封邮件,说wegene给我做的测试结果是错的,来解释下?

对方还找到了我在wegene上的一个帖子,那个的确是我发的
image.png
2016-06-07 • IP属地上海
按热门排序    按默认排序

8 个回复

cedre - -----------------------------------------------------------
Y染上一些单倍群的位点也存在聚类判断错误的问题,比如23527196、21753597、8379062、22519422、7509807、7770928、21880973等位置,主要是在C、N、Q、R、G、E这几个单倍群下面。
这个问题用排除法可以解决啊,比如非单倍群C的人却普遍检出某些C的位点结果为+,那么这些位点结果就是错误的、应该筛除掉,现在应该积累相当量的数据,做起来貌似没那么麻烦吧。。。
QQ截图20160705212057.png

SNPedia是这样说的。。。这是真的吗。。
这些问题解决了咩?
 
我只是WeGene的一个顾客,但我读过一些有关国外DNA测试机构对位点误判的信息。

23andMe:自从去年被美国FDA正式允许出有关遗传疾病携带者的报告以后,对质量控制更加重视。今年一月到四月,可能由于发现比预期高的误判率,突然增加了对大批样品的质控分析,导致检测时间从6-8星期增加到长达12星期。Promethease几年来一直认为该公司对某些位点(如rs7755898和i5005436)有高的误判率。

AncestryDNA:该公司原始数据的报告对X和Y染色体的位点,不管男女,都显示两个值。对男性,两个值应是重复即一样的(对女性,Y的所有位点应为零);但在少数位点上,因为软件判断有误,会有两个不同的值,给顾客造成一些疑问。

Genes for Good:这是美国密执安大学做科研的一个项目,应对测试准确性的要求很高。在它们出的原始数据里可以看到,有些位点被侧了不止一次,其目的大概是为了提高测试的准确性。

另外,我知道至少有一篇在【自然】杂志上已发表的文章因后来发现测试芯片误判率高被作者撤回了。

总之,顾客应对有关健康和疾病的测试结果持谨慎态度,不要因为一个DNA测试结果就采取重大的行动(如做一系列侵入性的医疗程序或大量食取某种药物或所谓的补品),带来对健康不利的后果。
我再在@chengang的解释上补充一下,对于每个检测位点,我们都需要根据实验获得的信号利用软件算法判断该位点的基因型(如下图)。对绝大多数的位点,他们的信号分布大概如图a所示,因此通过简单的聚类就可以保证该给出的基因型结果是正确的。
snp_cluster_graphs_large.jpg

 
但在某些位点上,不同基因型的实验信号也可能是像图b或图c这样(甚至混的更加极端),因此在聚类时更有难度,也会产生错误判断的情况。这时除了优化聚类算法以外,我们可以:1)对自觉无法准确判断的位点,统一归为未检出;2)进行判断,承担一定的错误率。在算法本身没有继续优化的前提下,这两者只能达成一个平衡,而无法即提高检出率、又提高正确率。目前看来,23andme在这些位点上的判断更为保守,一旦觉得判断质量不高,所有用户在该位点上都会被判定为未检出(而其中有一部分用户,其实是可以给出数据的)。目前我们没有做强制的未检出判定,同时在每个位点上还在积累数据,如果有些位点长期被观察容易出错,我们也会在未来的原始数据给出中进行调整、或者在芯片设计时进行优化。
费力科思 - WeGene勤杂工
楼主,您好!
 
我是WeGene的陈钢,关于您的疑问,这两天我们检查了数据和质控情况。考虑到SNPedia大量接受23andme的数据,所以我们将WeGene的数据在相关位点上的情况跟23andme的数据的情况作了简单的比较。由于不知道具体是指哪些位点的情况,所以暂且笼统的解释如下:
 
1. 他在邮件中提及的那个帖子,我已在里面做了回复,详见:https://www.wegene.com/question/603
 
2. 关于BRCA1和BRCA2两个与乳腺癌相关的基因中的突变情况。根据之前华大基因公布的百万无创产前检测的基因组数据,亚洲人和欧美人在在这两个基因上的突变情况有明显差异。此外,同样的突变在两大人群上对遗传性乳腺癌的风险的影响也是有显著差异的。
 
3. 关于BRCA1和BRCA2两个基因在WeGene检测中的情况。通过检查WeGene女性乳腺癌解读项目中的相关位点,我们发现了四个跟23andme有显著差异的位点:RS11571746,RS2227945,RS1801426和RS4987047。这四个位点在超过70%的23andme数据中被判断定为"__"(未检测)。因此,在上传23andme的数据到SNPedia时,这四个位点不会有任何解读信息,而WeGene的数据则有可能被判断为有突变。
 
4. 除去上述四个位点,其他乳腺癌解读项目中的位点的突变频率跟23andme的数据没有明显差异。
 
这次用于我们分析的WeGene数据约为1500份,23andme数据约为2000份。
 
谢谢楼主的反馈,如我在另外一个帖子里回复的,我们会继续优化检测和质控标准,提供更好更可靠的解读和数据。就整体数据质量而言,我们跟23andme还有差距。
 
如有疑问,欢迎继续提问或吐槽。
 
谢谢,
 
陈钢
我看了一下发件人,应该是这位:http://snpedia.com/index.php/User:Cariaso 
 
Cofounder of SNPedia a wiki database of human genetic variation
Author of Promethease a program to interpret personal genomes
这个promethease.com是个什么鬼
zhengqiang - 勤奋学习
很抱歉给您造成这样的疑虑,我们正在检查原始数据信息!稍后给您回复!

要回复问题请先登录注册