一项刚发表的研究,把日本人群基因这件事又往前推了一步。结果挺直接,研究团队对日本和冲绳7个地区的3256人做了全基因组测序,最后给出的判断是,现代日本人的祖源并不只是常说的几路混合,而是至少能看到三大来源。
这件事为什么值得聊,不只是因为样本多。更关键的是,它补上了过去遗传研究里一个老问题,欧洲人数据太多,东亚尤其日本本土的大样本高质量数据一直不够。说白了,很多结论过去是拿着不完整地图看地形,现在终于把图补细了。
这次建立的数据资源,被命名为JEWEL。名字先放一边,真正有分量的是数据本身。研究收录了来自日本七个地理区域的3256个个体,测序深度平均达到25.6倍。这个水平,已经足够让很多细小差别显出来,不再只是看个大概。
研究团队在这些样本里找到了4558万多个单核苷酸变异,还有911万多个插入缺失变异。更值得注意的是,把它和已有大型数据库对照后,JEWEL里有相当多变异此前没被记录,其中有1541万多个甚至是这个库里独有的。看到这,很多人可能会问,不都是人类基因吗,怎么还会差这么多?
问题就在于,不同人群的数据覆盖一直不均衡。样本从哪来,结论就更容易围着谁转。老实说,这也是近几年基因研究越来越强调多样性样本的原因,不然医疗判断、疾病风险评估,都可能偏掉。
再往回看这项研究最受关注的部分,就是祖源结构。研究者通过多种分析方法去拆解日本人群内部差异,最后发现,当代日本人的基因构成,用三种祖源成分来解释最合适。一个是新石器时代的绳文狩猎采集者,一个和东亚汉族祖先相关,另一个则指向一个还没有被完全明确身份的东北亚人群。
这个发现,某种程度上改写了过去外界对日本祖源的简单想象。以前很多讨论,喜欢把历史故事、迁徙传说、文化传播直接套进血缘问题里,但基因证据往往没那么省事。真正的人群形成,常常不是单线叙事,而是多次混合、多地区流动,一层压一层。拿一句流行话说,现实比传说复杂得多。
而且,研究还不只是讲一个全国平均值。它把日本列岛内部差异也拉了出来。本州不同区域、琉球群岛和本州之间,遗传结构都能看出更清楚的区分,西部和南部人群里还出现额外的亚聚类。你看,这就不是一句日本人怎样怎样能概括的了,内部本来就有层次。
还有一部分信息,也许对普通人更有现实感,那就是和健康的关系。研究识别出18481个可能导致蛋白功能丢失的变异,涉及9045个基因,其中不少在现有数据库里根本没登记过。什么意思?简单说,就是一些可能和疾病、药物反应、身体差异有关的基因变化,以前并没有被充分看见。
这类发现有什么用,不少人会问,离看病远吗?其实不远。基因数据库越贴近本国、本地区人群,未来做疾病风险评估、做筛查、选更合适治疗方案时,误差就可能越小。精准医疗这几个字这些年经常被说,但真正关键的不是口号,而是有没有本土数据撑着。
研究还把目光放到了更早的人类身上,也就是尼安德特人和丹尼索瓦人。团队用了新的计算方法,在日本人群中识别出一批可能来自这两支古人类的基因片段,并把其中44个古老片段和49个表型联系起来。这里面,多数片段是过去研究没报出来的。
这部分最容易引发兴趣。因为它不是说古人类基因只是留在远古故事里,而是可能还和现代人的一些身体特征、疾病风险挂着钩。研究提到,有的片段和2型糖尿病有关,有的和身高有关,还有一些与前列腺癌、冠心病、类风湿性关节炎等疾病发展相关。

当然,这里也得说清楚,相关不等于命中注定。带有某种变异,不代表一定患病,更不能把健康问题全推给祖先留下的基因。基因只是因素之一,生活方式、环境、年龄这些照样重要。不过,把这些片段找出来,至少能让后续医学研究更有方向。
我个人看,这项研究最有价值的地方,不是又做出一个吸睛标题,而是它提醒大家,人群研究不能总拿欧洲样本当默认模板。东亚人群内部的差异、本土特有变异、古老基因留下的影响,都需要自己去测、去建库、去分析,不然很多医学判断都只是半成品。
还有一点也值得注意,关于日本人从哪里来,这类问题总容易被公众讨论成一句话答案,甚至拉上各种历史传说。但基因研究给出的往往不是爽快结论,而是一张越来越细的混合图谱。三大祖源也不是终点,那个未知的东北亚成分到底是谁,未来多半还会继续追。
结果呢,这项研究既是在讲日本人的过去,也是在给未来医疗打基础。它告诉外界,东亚人群遗传图谱远没画完,日本人群内部也远比表面看到的复杂。你说这只是学术话题吗,其实未必,等到疾病筛查、个体化治疗更普及,这些今天看起来有点远的数据,可能就会变成很现实的东西。