使用本网站需要启用 JavaScript, 请启用后刷新页面获得更好的体验
登录
注册
首页
个人居家检测
临床应用研究
科研合作项目
合作与服务
社区
纯合片段分析
姓氏祖源
祖源平均脸
基因关系
基因保险助手
原始数据
使用 WeGene 需要启用 Cookies, 请启用后刷新页面获得更好的体验
社区首页
吐槽反馈区
讨论详情
爽朗的RGMA基因
综合讨论组
请问我下载到的数据,为什么很多位点是缺失的,是什么原因导致的,能否解决?
缺失的数据量大概5-10%没详细看
2018-01-14 • IP属地中国
与内容相关的链接
提交
按热门排序
按默认排序
4 个回复
高调的RARB基因
大概百分比的话能有多少呢?
zhengqiang
-
勤奋学习
目前我们提供的核心数据部分NOCALL的比例应该不会超过2%,绝大部分都是1%左右。超过这个比例样本都会做失败处理。
出现nocall的原因主要是对应位点上的数据质量在临界值附近,很难区分a或c,g或t,所以算法会把这类的信号做nocall处理。随着积累的原始数据增加,其中会有一些nocall的数据因为算法和原始数据的迭代变成有值的部分。
爽朗的RGMA基因
我是这样算比例的,我把文件用UltraEdit打开,
显示行数为10073391
以--作为关键词
找到1215874个结果
得到结果0.1207
是不是就意味着我的样本12.7%的位点是无法识别的呢?
爽朗的RGMA基因
核心数据确实缺失的少,1.47%
要回复问题请先
登录
或
注册
发起讨论
综合讨论组
8210 个讨论
4 个回复
赞同来自:
出现nocall的原因主要是对应位点上的数据质量在临界值附近,很难区分a或c,g或t,所以算法会把这类的信号做nocall处理。随着积累的原始数据增加,其中会有一些nocall的数据因为算法和原始数据的迭代变成有值的部分。
赞同来自:
显示行数为10073391
以--作为关键词
找到1215874个结果
得到结果0.1207
是不是就意味着我的样本12.7%的位点是无法识别的呢?
赞同来自:
赞同来自:
要回复问题请先登录或注册