安静的DPP10基因 综合讨论组

基因助手的祖源距离靠谱吗?

本人中原土著,以下分别是本人在微基因的祖源距离,以及基因助手-中国地理基因-城市-三维-距离。为什么会差别这么大?以及怎么这么北?



 
WechatIMG134.jpg WechatIMG133.jpg WechatIMG132.jpg
2025-06-26 • IP属地美国
按热门排序    按默认排序

5 个回复

tokyo9pm - “Jawatsau” toipu kunino tsatuma-paritsau no khoh'ei. Pukhei to mbokhei tsotsen pa ndottimo Namutohkhei.
微基因的感觉还行,基因助手那个有点不大靠谱,我太太纯日本人它说最接近的是俄罗斯族,我汉族成分70%它说我最接近的是东乡族,很离谱…
Mehmet - R1b-Z2106-CTS8966
PCA是否准确?请先看看自己的微基因祖源成分数值,感受下是否准确?所谓“祖源最相似”是相对来说的,指的是你和中国56个民族相比,和哪个民族祖源最接近,或差异最大。

基因助手的“中国地理基因-祖源距离”是基于微基因的各个省份或地级市(包含微基因全部用户数据)的平均祖源结果计算PCA,祖源数据源和官网是一致的,也就是42个祖源成分。二维是只保留2个最大的主成分,三维是保留3个最大的主成分。
 
基因助手的“世界民族基因-微基因模型”是基于微基因(授权给基因助手)的用户数据计算PCA,目前有一万多个授权用户,由于微基因用户主要是中国人,所以这个功能只统计中国56个民族的用户数据,计算时不包含国外用户的数据(比如日本人、美国人、欧洲人。。) ,那么对于国外民族的用户使用此功能时,会看到自己的数据点远离中国民族的数据点,并且最接近的是中国民族中离散度最大的民族(一般是中国汉族成分最少的少数民族,比如俄罗斯、塔吉克、维吾尔等),原因也很简单,由于计算PCA的所有样本都是中国人,所以当切换到二维PCA时,横纵坐标实际相当于(但不等同)中国南汉和北汉成分,而外国人和这些少数民族的汉族成分都很少,所以都距离其他中国民族距离很远,相比之下,外国人就和这些汉族成分少得少数民族距离更近。但如果切换到三维PCA模式,Z轴表示第三个主成分,就是非汉族成分的其他中国少数民族成分(如蒙古族、通古斯族群、彝族、苗族等),在Z轴可以看到,外国人和这些汉族成分少得少数民族的祖源距离也很远。
 
所以,基因助手的“祖源距离”完全是根据微基因用户的42个祖源成分数值,进行PCA降维成二维或三维坐标点,再计算坐标系中点之间的欧几里得距离,坐标点距离数值本身没有意义,但点与点之间距离的大小则有意义——反映的是祖源关系的远近。
都不靠谱
看给出的祖源结果值够不够准确,不准的话相似地也会失真
我的微基因祖源结果一般准确,70北汉,26蒙古语,1.5通古斯加因纽特。我老家在是华北平原中心

要回复问题请先登录注册