东南亚大陆的基因故事,首次集体讲述
王晓波 | 撰文
东南亚大陆(Mainland Southeast Asia)位于东亚、南亚和东南亚岛屿部分的交汇处,又称中南半岛,包括缅甸、泰国、越南、老挝、柬埔寨和马来西亚的马来半岛等地区。这里的语言、民族和人群极富多样性,但在全球基因组学研究中长期代表不足——在已报道的全球67万例人群全基因组测序数据中,东南亚人群样本仅占1.57%。
5月14日,一项由中国科学院昆明动物研究所牵头、泰国、柬埔寨等东南亚六国34个科研团队参与的国际合作研究在《自然》发表[1],首次系统解析了该地区人群的遗传结构、演化历史与环境适应,有效地填补了国际基因组数据库的空白。
“从我们的基因组数据来看,地理隔离是解释东南亚人群遗传分化的主导因素。语言的形成和分化会比较复杂,人口扩散和文化同化应该会共同发挥作用。”论文的通讯作者之一、中国科学院昆明动物研究所研究院宿兵告诉《赛先生》。
研究团队花费十余年,深入东南亚大陆雨林腹地,采集了涵盖五大语系、6个国家、30多个地方的东南亚人群样本,完成了3023例深度全基因组测序,构建了构建了迄今为止最完整的东南亚人群高质量全基因组变异数据库——SEA3K。
在这些样本中,研究人员以平均43.5倍深度完成了短读长全基因组测序,并对40个代表性个体进行了平均32.7倍深度的长读长测序。结果发现,研究人员共识别出约8000万个短序列变异和近10万个结构变异,其中有超过2000万个短序列变异和近2.5万个结构变异是此前从未在东南亚人群中报道的新发现。
研究者通过主成分分析法发现,大多数东南亚人群的遗传结构主要与地理分布格局高度一致,而不是随语言分类聚类,这表明人群间的分化主要通过地理隔离形成,印证了该地区复杂的遗传交融与语言更替历史。
图一:主成分分析法说明基因分化与地理距离高度相关
研究还揭示出构成东亚与东南亚大陆人群的四种主要遗传成分。一是东南亚土著中占主导地位的独特古老成分,在柬埔寨及安达曼群岛人群中尤为突出;二是从中国南方向南迁的农业人群成分,与新石器时代农业的扩散有关;三是与东亚北部相关的成分,广泛存在于藏族和中国西南非汉族人群中,反映了最近一次从中国西南向中南半岛的人口迁移;四是广泛分布于安达曼群岛、孟加拉及中南半岛各人群的古老成分。
“在东南亚群体中确实可以看到新石器时期北方南迁的农业文明群体的遗传混合印记,主要影响的是东南亚的主体民族。在土著人群中的主要成分是东南亚特有的、且比较古老的遗传成分,可以称之为东南亚的土著遗传成分。”宿兵解释说。
他指出,这些发现有助于我们重新理解东南亚在现代人类演化史中的关键地位。第一,东南亚,包括中国西南部,可能是现代人最早到达亚洲东部的地区,是人群早期迁徙的中转站,因为东南亚土著人群的基因组中保留了亚洲祖先人群的遗传印记;第二,目前的东南亚人群,基本上是远古祖先人群和后来的农业人群的混合。农业文明从东亚大陆向东南亚扩散,对东南亚主体民族人群产生很大影响,但对土著人群影响相对有限。
2018年,《知识分子》的文章《史前传奇:华南人群多次下南洋,改变东南亚人群基因构成》曾报道,早在近代移民潮以前,史前时期的华南人群就曾多次南迁,并深刻改变了东南亚人群的基因构成[2]。2021年,中国科学院古脊椎动物与古人类研究所付巧妹团队也在Cell杂志报道了约9,000至6,000年前的广西人群在农业出现前已与来自东南亚的古老采集者和福建地区的南方祖源广泛融合。[3]
图二:人口树得出组成中南半岛人群的4种遗传成分
此外,该研究还描绘了中南半岛人群的演化史:所有东南亚大陆人群和东亚人群在15万至20万年前共享祖源,并在10万至1万年前的末次盛冰期经历了严重的瓶颈效应,人口一度减少到1000人左右。随后,在农业扩张驱动下,人口出现爆发式增长。
图三:人口增长
作为世界上气候最为多样的区域之一,东南亚大陆的高温高湿、密林密布环境,对人群演化产生了深远影响。
研究团队采用CMS评分方法,在东南亚大陆人群基因组中鉴定到44个受到强烈正选择的区域,涉及89个基因,其中72个为首次发现的正选择靶点。
这些基因涉及体质、免疫、代谢等适应性特征,揭示了东南亚人群应对热带环境的独特进化策略。例如,SLC245基因通过调控皮肤色素沉着抵御热带地区的强紫外环境,CDC42SE2可以减轻热带雨林地区蚊虫叮咬反应,MRPS22基因促成的卷发表型可加速散热等。值得注意的是,研究发现1号染色体上有一个长达443kb并在东南亚人群特异富集的基因组区域,该区域包含了与卷发相关的TCHHL1、TCHH等基因,以及与皮肤屏障相关的FLG等基因,进一步说明东南亚人群中受选择的基因与热带雨林环境适应密切相关。
同时,研究人员发现自然选择在东南亚人群的基因组的调控序列和蛋白质编码区都起作用,但与生活在非洲热带雨林的人群在变异位点上存在显著差异,反映了东南亚大陆土著人群在与非洲土著人群在趋同演化上的独特性。
图四:东南亚大陆人群基因组的自然选择信号和潜在的环境适应表型
现代人的基因组中依然保留着古人类的痕迹。在这项研究中,研究团队发现东南亚大陆人群的尼安德特人基因占比介于东亚和南亚之间,而丹尼索瓦人基因和东亚人比例接近,但普遍高于南亚人群。
另外,研究还揭示出丹尼索瓦人与现代人之间存在多次渗入事件。23个被分析的人群中,13个人群显示有单次渗入信号,而其他人群显示至少两次渗入信号。特别的是,有一个柬埔寨人群显示有3次渗入事件。这些不同的基因渗入模式,支持此前关于“亚洲至少发生过两次丹尼索瓦人与现代人混血事件”的观点,表明有可能多个丹尼索瓦人支系在不同的时间,很可能在不同的区域和现代人类杂交。
图五:尼安德特人基因和丹尼索瓦人基因对东南亚大陆人的渗入
“这篇文章首先数据库非常难得,针对东南亚族群不同的群体,对之后的研究非常关键;第二它发现的选择适应基因,尤其是跟东南亚特有环境相关的基因,以及和非洲人演化适应过程的不同,也非常有意思;更重要的一点是,未来很有可能通过这样的数据,找到我们在现在人群还不知道的一些成分,很有意义。”中国科学院古脊椎动物与古人类研究所研究员付巧妹评论说。
在首期聚焦东南亚大陆研究的基础上,目前中国科学院昆明动物研究所联合国际合作伙伴已正式启动“东南亚基因组计划”二期工程(SEA10K),致力于构建覆盖东南亚全域的万人级高分辨率基因组图谱。
随着SEA10K的推进,我们或许能更全面地理解,什么造就了今天的亚洲人——以及我们从何而来。
参考文献:
[1]Yaoxi He, et al., Genome diversity and signatures of natural selection in mainland Southeast Asia, Nature May 14th, 2025
[2]《知识分子》,2018,《史前传奇:华南人群多次下南洋,改变东南亚人群基因构成》,惠家明
[3]Tianyi Wang, et al., Human population history at the crossroads of East and Southeast Asia since 11,000 years ago, Cell, 2021