黄河弯曲地区的古基因组揭示了中原、草原和中国南方之间的远距离人口互动
**Ancient genomes from the Yellow River Bend reveal long-distance population interactions between the Central Plains, Steppe, and southern China** **黄河弯曲地区的古基因组揭示了中原、草原和中国南方之间的远距离人口互动** **亮点** - 新石器时代北方草原对黄河弯曲地区的影响 - 与中国南方的远距离基因接触 **摘要**黄河弯曲地区,作为中国文明的北部边界,见证了中国中原与北方草原地区人口之间频繁的史前互动。然而,该地区相关的史前人口动态仍然知
Ancient genomes from the Yellow River Bend reveal long-distance population interactions between the Central Plains, Steppe, and southern China
黄河弯曲地区的古基因组揭示了中原、草原和中国南方之间的远距离人口互动
亮点
- 新石器时代北方草原对黄河弯曲地区的影响
- 与中国南方的远距离基因接触
摘要黄河弯曲地区,作为中国文明的北部边界,见证了中国中原与北方草原地区人口之间频繁的史前互动。然而,该地区相关的史前人口动态仍然知之甚少。在此,我们为23位从新石器时代晚期到青铜铁器时代的个体生成了全基因组数据。我们发现,来自中原的仰韶相关血统构成了当地基因库的主要组成部分。在新石器时代晚期,黄河弯曲地区的人口接受了来自蒙古草原不可或缺的基因贡献。同时,新石器时代的异常个体呈现出来自中国南方的意外基因影响,这种影响一直持续到青铜铁器时代,暗示了中国南北方之间的远距离基因交流。总体而言,我们的研究强调了自新石器时代以来,在黄河弯曲地区,中原、草原和中国南方之间复杂的古代人口互动。

关键词古DNA、黄河、新石器时代、青铜时代、石峁、周朝
研究主题CP: 基因组学
引言黄河发源于青藏高原,流经5000多公里后注入渤海,在陕西、内蒙古南部及邻近地区形成了一个大型马蹄形弯道,我们称之为黄河弯曲地区。在南部,黄河弯曲地区连接着中国中原(以下简称中原),即黄河中下游地区,这里农业繁荣,孕育了中华文明。在北部,黄河弯曲地区通过内蒙古草原与欧亚草原接壤,那里以畜牧业为主。黄河弯曲地区独特的地理位置位于所谓的农牧生态区,史前牧民和农民在此相遇并互动。
中原地区最重要的农业文化之一,也是中华文明基础的是仰韶文化。追溯至距今7000-5000年(中新石器时代),仰韶文化在全新世气候最适宜时期经历了快速发展和扩张。仰韶相关人群的扩张已达到内蒙古北部,据推测他们与当地居民混合,形成了庙子沟文化(距今5500-5000年)。从中新石器时代到晚新石器时代,中原地区的考古文化从仰韶转变为龙山(距今4500-3800年),期间社会复杂性显著增加,伴随着社会等级的出现。同时,黄河弯曲地区的古代社会也经历了社会复杂化,从庙子沟文化演变为阿山文化(以区域中心聚落和防御结构为特征),最终发展为石峁文化。石峁文化主要由石峁遗址及相关卫星考古遗址(约距今4300-3800年)定义,这是一个极其庞大的石基聚落,成为中国北方的政治、经济、文化和宗教中心。考古研究推测石峁文化与庙子沟文化之间存在潜在联系,以及石峁文化相关遗址之间的文化同质性,但文化联系是否反映基因联系仍不清楚。
后来,在黄河弯曲地区,历史记载中最早的统一政体之一(周朝)于公元前1046年兴起,正如《史记》(公元前85年司马迁撰写的古代历史书籍)所记载,持续了近800年。周朝经历了早期阶段(西周,公元前1046-771年)和晚期阶段(东周,公元前770-221年),由于冶金术的进步,这里称为青铜铁器时代。尽管黄河弯曲地区是史前政体(石峁)的中心和最早的历史统一政体之一周朝的所在地,但周前人群和古代周人之间的连续动态仍然未知。
在此,我们聚焦于两个代表性考古遗址来研究黄河弯曲地区的古代人口动态。新华遗址位于石峁20公里外,被视为中国北方第一个史前政体——石峁的卫星城市,13与石峁城共享类似的玉器和陶器类型。年子坡遗址的居民同时实践农业和畜牧业,据推测与周朝的兴起有关。14总共,我们为来自新华遗址(距今4,100-3,850年,新石器时代晚期)13和年子坡遗址(距今3,000-2,200年,周朝,青铜铁器时代)14的23位个体生成了全基因组数据,其中16位产生了相当数量的无污染基因组数据(STAR方法;表S1)。我们首先使用READ软件估计新报告个体之间的亲缘关系,并使用Haplogrep3和Yleaf软件分配其线粒体和Y染色体单倍群(STAR方法)。我们发现两个遗址的个体具有相当多样的线粒体单倍群,其中D4单倍群较为常见(5/17),这与之前对石峁城古代个体的线粒体研究结果一致。15我们发现新华和年子坡的男性携带Q1a1a、O2a2b1a1a1a2和C2b1的Y染色体单倍群,后两者代表现代中国主要的父系单倍群。16,17我们还注意到G71403是一位具有G2a4线粒体单倍型的女性,而她的两位二度女性亲属G71402和G80604没有亲缘关系,各自携带不同的线粒体单倍型——分别是F2g和D4i,这暗示家族内可能通过父系而非母系存在潜在的基因联系(表S1)。去除亲缘关系个体后,我们保留了14位个体用于下游人群遗传分析(表S1;图S1)。总体而言,通过将新生成的数据与已发表的东亚古代人群遗传景观整合,我们提供了蒙古草原人群、东亚南方人群和中原农业人群在黄河弯曲地区史前人口互动的全面图景。
结果
黄河弯曲地区仰韶相关基因祖先的普遍存在在考古记录中,仰韶文化——1921年首次在中原河南省发现——是中国最突出且分布广泛的史前新石器时代文化,已经扩散并影响了长城到中国南方长江中游盆地之间的广大土地。18 彩陶,仰韶文化的显著特征,也在中原以北地区被发现,包括黄土高原和内蒙古南部。19 然而,目前尚不清楚仰韶文化的影响是否仅影响了黄土高原的制陶技术,还是制陶技术的传播也伴随着基因流动。
在此,我们发现新报告的来自黄土高原的新石器时代晚期人群(XH_LN)与石峁文化相关人群的古代人口以及中原地区仰韶文化相关的古代人群(China_YR_MN)有着强烈的基因亲缘关系(图1、2和S3-S5;表S2A-S2D)。正如预期,来自黄土高原的两个相邻新石器时代石峁文化相关人群(China_Shimao_LN和China_Miaozigou_MN)20在外群f3中也与China_YR_MN共享高度基因亲缘关系(图S3和S4;表S2A)。

图1. 新研究的古代群体和相关古代东亚人的地理和时间分布
(A) 地理分布。相关考古文化在文本中以红色和黄色标注。
(B) 时间分布。新报告的古代数据在符号中以黄色填充突出显示。
(A)中的底图来自Natural Earth (https://www.naturalearthdata.com)。另见表S1。

图2. 新华和年子坡人群的遗传结构
(A) 古代和现代东亚人的主成分分析。
(B) 东亚和东南亚人的ADMIXTURE分析结果,K = 4。
另见图S2。
鉴于石峁文化位于黄河上游和中游之间,我们进行了进一步分析,以检验石峁文化相关人群(XH_LN、China_Shimao_LN和China_Miaozigou_MN)与China_YR_MN之间检测到的密切基因亲缘关系是否是由于黄河上游和中游人群之间共享的基因库,以排除因上游黄河人群与新石器时代石峁文化相关人群之间共享基因亲缘关系而导致的假阳性可能性。使用Zongri5.1k21作为黄河上游地区古代人群的代表,我们发现XH_LN和China_Shimao_LN确实基于f4(XH_LN/China_Shimao_LN,上游黄河群体;中游黄河群体,Mbuti.DG)与中游黄河人群比与上游黄河人群有着更紧密的基因亲缘关系(STAR方法;表S2E),这一点得到了基于外群f3分析(图S3和S4;表S2A)的支持,即XH_LN和China_Shimao_LN与古代黄河中游人群(仰韶文化相关)共享高度基因亲缘关系。

图3. 目标人群的混合比例和f4统计
(A) 通过qpAdm估计的XH_LN、XH_LN_o、XH_LN_o1和NZP_LBIA及相关人群的祖先比例。中原祖先由China_YR_MN代表,东亚北部祖先由China_NEastAsia_Inland_EN代表,东亚南部祖先由China_SEastAsia_Island_LN(XH_LN_o和XH_LN_o1)和Atayal.DG(NZP_LBIA)代表。
(B) f4 (China_AR_EN, China_YR_MN; test, Mbuti.DG)和f4 (Ami.DG, China_YR_MN; test, Mbuti.DG)的结果。"test"人群包括新报告的人群。水平条表示点估计±1标准误差。
(C) 通过f4 (target, China_YR_MN; test, Mbuti.DG)进行的遗传亲缘关系测试,其中"target"包括XH_LN、XH_LN_o、XH_LN_o1和NZP_LBIA,64个古代和现代东亚人群在"test"位置进行了测试。方框跨度从第一四分位数到第三四分位数,包含中间50%的数据。
与XH_LN_o类似,XH_LN_o1在PCA中也偏离了XH_LN的主要聚类,尽管它与东亚南部人群的距离不如XH_LN_o那么接近(图2)。在ADMIXTURE结果中,XH_LN_o1具有一个在东亚南部人群中达到最大比例的绿色成分,其比例介于XH_LN和XH_LN_o之间(图2)。如f4(XH_LN/China_Shimao_LN,XH_LN_o1;参考群体,Mbuti.DG)所示,统计值最不负的参考群体主要是东亚南部人群(表S3G;图S5和S7)。然而,我们发现XH_LN_o1与东亚南部人群共享的遗传漂变少于XH_LN_o,这从f4(XH_LN_o,XH_LN_o1,参考群体,Mbuti.DG)和f4(XH_LN_o1/XH_LN_o,China_YR_MN/China_YR_LN;参考群体,Mbuti.DG)中可以看出(表S3G、S3I和S3K;图S6和S7)。使用与XH_LN_o相同的建模策略,以China_YR_MN作为中原祖先和China_SEastAsia_lsland_LN作为东亚南部祖先,XH_LN_o1可以被模拟为China_YR_MN祖先(81.7%)和东亚南部祖先(18.3%)的混合体(图3;表S3D)。使用DATES,22我们估计与东亚南部祖先的混合发生在约69±17代(2,001±493年前,假设每代29年23)早于XH_LN_o1的年代(表S3L;图S10)。
此外,我们发现这种南方祖先在位于黄河弯曲地区更南部的年子坡遗址也能被检测到。对于来自年子坡的晚期青铜时代/早期铁器时代人群(NZP_LBIA),外群f3统计显示他们与XN_LN_o1和东亚北部人群有着高度遗传亲缘关系(图S3和S4;表S2A)。与早期的XH_LN/China_Shimao_LN相比,NZP_LBIA与东亚南部人群的遗传亲缘关系也得到了负值f4(XH_LN/China_Shimao_LN,NZP_LBIA;Ami.DG,Mbuti.DG)统计的支持(图S5和S8;表S2H)。与黄河上游群体China_Upper_YR_IA相比,NZP_LBIA似乎与东亚南部群体共享更多亲缘关系,而与同期且位于NZP_LBIA更南部的China_YR_LBIA相比,China_YR_LBIA表现出与古代中国南方群体类似的遗传亲缘关系(图S8;表S2N)。使用qpAdm建模,我们发现NZP_LBIA可以被模拟为97.6%±5.7%的China_YR_MN和2.4%±5.7%的Atayal.DG(图3;表S3D),或者也可以被模拟为88.4%±5%的XH_LN和11.6%±5%的Atayal.DG(表S3J),考虑到XH_LN与NZP_LBIA之间的时间距离相较于China_YR_MN与NZP_LBIA之间的时空距离,后一种模型更为接近。
总体而言,我们表明XH_LN_o、XH_LN_o1和NZP_LBIA相较于XH_LN、China_Shimao_LN和China_YR_MN接受了来自东亚南部人群的一定遗传贡献。先前的研究揭示,在中原地区,仰韶文化的继承文化(龙山)相较于仰韶相关人群接受了一定的南方基因流,20我们的研究提出,这种南方遗传影响远至更北部,达到欧亚大草原的周边地区,比先前发现的距离远800多公里。20
遗传相似性反映了黄河弯曲地区考古文化的相似性
作为中国北方最突出的史前政体中心之一,石峁文化在黄河弯曲地区的各个考古遗址中广泛分布。在这里,我们研究了来自三个考古遗址的人群,包括与石峁文化相关的新华和圣格达梁遗址,以及与石峁文化前身文化(庙子沟文化)相关的庙子沟遗址。9 从主成分分析(PCA)中,我们发现东亚人群形成了一个三角形,其三个顶点分别是东北亚相关、东南亚相关和藏族相关人群。来自沿海和内陆东南亚的古代个体聚集在一起,并投射到靠近东南亚人群(如阿美族和泰雅族)的位置;来自欧亚草原的古代个体投射到由东北亚相关的突厥语和蒙古语人群形成的渐变线附近;来自尼泊尔的古代个体投射到靠近藏族相关人群的位置。来自黄河中游流域的古代人群处于这三个遗传梯度的交叉点。我们研究的三个群体——XH_LN、China_Miaozigou_MN和China_Shimao_LN——聚集在一起,落在黄河中游流域古代人群所在的PC空间中(图2)。
与PCA聚类模式一致,XH_LN、China_Shimao_LN和China_Miaozigou_MN之间的遗传相似性在外群f3统计中也很明显,它们彼此之间共享紧密的遗传亲缘关系(图S3和S4;表S2A)。在对称f4(XH_LN,China_Shimao_LN/China_Miaozigou_MN;参考,Mbuti.DG)检验中,所有测试的参考群体在统计上都没有打破XH_LN与China_Shimao_LN/China_Miaozigou_MN之间的遗传对称性,这暗示测试的群体与XH_LN和China_Shimao_LN/China_Miaozigou_MN的亲缘关系相当(图S5;表S2B),确认了XH_LN、China_Shimao_LN和China_Miaozigou_MN之间的遗传相似性。qpWave检验进一步从统计学上支持了China_Shimao_LN与XH_LN之间的遗传分支关系,即它们可能源自相同的祖先来源(图S9;表S3B)。
ADMIXTURE分析揭示,来自黄河弯曲地区的XH_LN、China_Shimao_LN和Miaozigou_MN与古代黄河中游农民(China_YR_MN、China_YR_LN)共享相似的基因组成部分。在古代黄河人群和现代藏缅语人群中最为显著的红色组分和蓝色组分,强调了它们之间的亲缘关系(图2和S2)。在这里,我们发现XH_LN/China_Shimao_LN/China_Miaoizgou_MN与China_YR_MN之间的紧密基因联系,揭示了黄河弯曲地区的古代石峁文化相关和庙子沟文化相关人群与中原地区仰韶文化相关人群之间密切相关的基因谱系。
黄河弯曲地区北方草原与中原农民之间的互动
尽管黄河弯曲地区的古代人群(XH_LN、China_Shimao_LN和China_Miaozigou_MN)与中原地区仰韶相关文化的人群(China_YR_MN和China_YR_LN)之间存在基因相似性,但它们并非源自单一祖先来源。XH_LN/China_Shimao_LN/China_Miaozigou_MN与China_YR_MN/China_YR_LN之间的基因同质性检验在qpWave测试中被统计学上拒绝(p < 0.05,表S3B)。目前尚不清楚是什么样的人口互动导致了这种情况。考古研究表明,在黄河弯曲地区出土的一些距今4,000-5,000年的文物也与欧亚草原的文物共享类似的文化特征。24作为欧亚草原的一部分,内蒙古毗邻黄河弯曲地区。因此,我们使用鱼鳞文化的古代人群(China_NEastAsia_Inland_EN,约8,400年前)——内蒙古地区最早且唯一可获得的已发表新石器时代人群——作为欧亚草原血统的代表。25 正向f4(XH_LN/China_Shimao_LN,China_YR_MN;China_NEastAsia_Inland_EN,Mbuti.DG)统计表明,XH_LN/China_Shimao_LN与曾经存在于内蒙古的北方新石器时代祖先之间可能存在基因联系(表S2D)。考虑到它位于黄河弯曲地区以北,我们在此后将这种可能存在于蒙古的北方新石器时代血统称为北方草原血统。
为进一步量化黄河弯曲地区可能存在的北方草原血统,我们不仅测试了China_NEastAsia_Inland_EN作为代表,还测试了蒙古草原中青铜时代中晚期的主要人群(Ulaanzuukh_SlabGrave)以及与草原接壤的东北亚新石器时代人群(China_HMMH_MN、China_AR_EN和China_AmurRiver_N)作为潜在代表(研究方法)。在使用China_YR_MN作为中原血统来源和上述古代代表作为北方草原血统的双源qpAdm测试中,XH_LN中估计的北方草原血统始终保持在10%–20%左右(表S3C)。此外,China_YR_MN与北方草原血统之间的混合成功解释了来自相同石峁相关考古文化背景的三个人群(XH_LN、China_Shimao_LN和China_Miaozigou_MN)的遗传起源,其中China_Miaozigou_MN拥有最高的草原血统(31.5% ± 6.5%)(图3;表S3C)。China_Miaozigou_MN相对较高的草原血统与该人群相对北部的地理位置相关,与China_Shimao_LN和XH_LN相比,它更接近蒙古草原(图1和3;表S3C)。先前的考古研究提出,农牧生态区的形成始于4,500年前(仰韶文化晚期),从东北亚延伸至整个黄河弯曲地区。利用古DNA证据,独立于考古证据,我们证明了北方草原血统在新石器时代黄河弯曲地区人群基因组形成中起到了关键作用。
讨论
公元前5千年是中国文明兴起的关键时期,形成了多样而统一的考古框架,同时黄河地区的社会复杂性显著增加。在本研究中,我们为黄河弯曲地区的两个古代人群(新石器时代晚期和青铜铁器时代)生成了全基因组数据,这些人群是中国文明北部边界的居民。尽管这一地区被广泛认为是中原农民与北方游牧民相遇的地方,但先前的线粒体研究显示,古代黄河弯曲地区人群(石峁相关)与之前的仰韶相关人群之间存在高度的母系遗传相似性。15 石峁文化——特别是石峁城,它是中国保存最完好的史前宫殿结构遗址之一——具有重要的历史意义,表明其高度发达的文明阶段与国家权力的出现有关。26,27本研究在全基因组水平上证明,作为石峁文化一部分的新华遗址新研究的古代人群与其他石峁文化相关人群表现出高度的基因相似性。这种基因相似性可能反映了石峁相关文化背景的古代人群相对精英的社会地位,考虑到发现的显著石峁相关文化元素,如在石峁发现的结构化石基建筑和在新华遗址发现的充满玉器(权力和社会地位的象征)的坑,13,26,28 这些人可能在古代分层组织的定居系统的精英社会阶层内保持了基因同质性。
此外,在研究的石峁文化相关古代人群(XH_LN、Shimao_LN和Miaozigou_MN)中,中原血统仍然是主要的基因组成部分。中原血统在黄河弯曲地区的普遍存在,证实了新石器时代仰韶文化及其后继的龙山文化的假设性扩张。黄河弯曲地区共有的中原血统也解释了石峁文化相关古代人群之间观察到的基因相似性。
值得注意的是,我们发现北方草原血统对新石器时代黄河弯曲地区人群(XH_LN、Shimao_LN和Miaozigou_MN)产生了不可或缺的基因影响。这一基因证据与考古学假设相吻合,即中国北方农牧生态区的形成始于公元前4千年。虽然北方草原血统对新石器时代黄河弯曲地区人群的影响不如对黄河中游农民的影响那么深远,但它表明,自新石器时代晚期以来,黄河弯曲地区一直是与北方草原接触的前沿地带。考古证据,包括在石峁文化相关遗址中发现的石像、青铜器物以及家畜遗骸(如羊和牛),也表明当时可能与欧亚草原存在畜牧文化交流。24,29,30,31,32
本研究中发现的最显著的跨区域人口接触是北方和南方中国之间的远距离史前人口接触,可追溯至新石器时代。这一发现完善了我们以往对人口接触的理解,这种接触通常发生在邻近的地理区域之间,如黄河弯曲地区与蒙古草原之间。在此,我们报告了黄河弯曲地区与中国南方之间联系的明确基因证据,这一证据来自新华遗址中发现的基因异常个体。然而,这些南方东亚人如何影响黄河弯曲地区以及这些南方人群遵循了哪条迁徙路线的问题仍不清楚。考古研究提出,石峁文化的玉器与中国南方的玉器之间存在一些相似之处,特别是与新石器时代晚期南方中国的一个重要区域性早期国家中心——位于长江下游地区(靠近上海)的良渚文化28,30,33和位于长江中游地区(靠近武汉)的后石家河文化的玉器34。然而,玉器交流是否类似于基因交流仍有待确定。我们希望在未来的研究中,来自邻近地区的更多古代DNA数据和新的考古材料能够进一步阐明当地的基因景观和跨区域文化交流现象,进一步证明我们在此检测到的异常个体是个别案例还是代表了一种普遍现象。总体而言,我们特别强调了在中国文明兴起初期,黄河弯曲地区与北方草原和中国南方之间在全基因组水平上发生的显著人口互动。
样本ID 人群ID 文库ID 考古遗址 墓葬编号
陕公网安备61011302002223号