古DNA揭示乌拉尔和叶尼塞人民的史前历史

北欧亚大陆的森林和森林草原地区长期以来一直是千年跨文化联系的场所,但是其中大部分历史仍然不为人所知。特别是,现代乌拉尔语和叶尼塞语人群的基因组形成过程仍然未明。在此,我们为该地区180个古代个体生成了全基因组数据,发现早至中全新世的狩猎采集者展现出连续的祖源梯度,从波罗的海地区的完全欧洲相关祖源到贝加尔湖以东的完全东亚相关祖源。同时期的东北西伯利亚群体处于这一梯度之外,他们来源于一个曾是美洲原住民主要来源的古群体,该群体后来与内陆东亚和黑龙江地区人群混合,形成了两个人群,其扩张恰逢青铜时代前人群结构的崩溃。第一个群体贝加尔湖西侧新石器晚期-青铜时代(Cisbaikal_LNBA)的祖源与叶尼塞

古DNA揭示乌拉尔和叶尼塞人民的史前历史

Ancient DNA reveals the prehistory of the Uralic and Yeniseian peoples

https://www.nature.zxtsg.top/articles/s41586-025-09189-3

摘要

北欧亚大陆的森林和森林草原地区长期以来一直是千年跨文化联系的场所,但是其中大部分历史仍然不为人所知。特别是,现代乌拉尔语和叶尼塞语人群的基因组形成过程仍然未明。在此,我们为该地区180个古代个体生成了全基因组数据,发现早至中全新世的狩猎采集者展现出连续的祖源梯度,从波罗的海地区的完全欧洲相关祖源到贝加尔湖以东的完全东亚相关祖源。同时期的东北西伯利亚群体处于这一梯度之外,他们来源于一个曾是美洲原住民主要来源的古群体,该群体后来与内陆东亚和黑龙江地区人群混合,形成了两个人群,其扩张恰逢青铜时代前人群结构的崩溃。第一个群体贝加尔湖西侧新石器晚期-青铜时代(Cisbaikal_LNBA)的祖源与叶尼塞语系群体相关,第二个群体雅库特新石器晚期-青铜时代(Yakutia_LNBA)的祖源与史前乌拉尔语系人群的迁徙相关。我们表明,约4,000年前,Yakutia_LNBA首先从勒拿河流域向西扩散至阿尔泰-萨彦地区,并进入了与塞玛-图尔宾冶金术相关的西西伯利亚社区——这是一套从阿尔泰地区迅速扩张的先进青铜铸造技术。塞玛-图尔宾时期的16个个体显示出多样的祖源,还携带有来自与印欧-伊朗相关牧民以及各种狩猎采集群体的DNA。因此,文化传播和人口迁徙都是塞玛-图尔宾现象的关键因素,该现象参与了早期乌拉尔语系社区的初始扩散。

主要内容

乌拉尔语系语言分布于北欧亚大陆,从中欧到东北西伯利亚,但其发源地一直存在争议,有理论指向阿尔泰-萨彦山脉,西伯利亚鄂毕河与叶尼塞河之间,欧洲伏尔加河与卡马河交汇处周围,或波罗的海东部2(补充信息第1节提供了地理术语指南)。现代乌拉尔语系使用者与其印欧语系邻居的系统性差异在于他们具有大量西伯利亚血统(从爱沙尼亚人的约2%到恩加纳桑人几乎全部),以及高频率的源自西伯利亚的Y染色体单倍群N谱系3。古DNA的时间断面显示,这种血统大约在3.5千年前(ka)抵达卡累利阿4,约2.6千年前抵达波罗的海东部5。与印欧语系不同,印欧语系可以通过欧洲草原亚姆纳亚人的祖源扩散来追踪,但对于史前乌拉尔语系人群的扩散,尚未发现遗传"示踪剂"。

叶尼塞语系仅在叶尼塞河中上游的人群中有记载,而克特语是唯一现存的语言。然而,叶尼塞语系在过去曾有更广泛的地理分布,并且在远古时期与北美洲的纳-德内语系(阿萨巴斯坎-埃亚克-特林吉特语系)如奇佩维安语和纳瓦霍语相关联,这些语言分布从阿拉斯加到亚利桑那6。先前的研究试图找到阿萨巴斯坎人和克特人之间的遗传联系7,8,9,10,但由于克特人与其非叶尼塞语系邻居的遗传相似性,这一工作面临挑战11。与印欧、突厥和蒙古语系后期传播相关的迁徙所产生的破坏性影响12,13也使得根据现代人群的遗传变异来重建乌拉尔语系和叶尼塞语系使用者的史前迁徙变得困难。

我们为北欧亚大陆地区的180个个体生成了全基因组数据,这些个体来自中石器时代(约11千年前)到青铜时代(约4.0千年前)的考古文化,地理范围从伏尔加-乌拉尔地区到中西伯利亚的勒拿河谷(图1)。扩展数据图1提供了遗址地图,扩展数据图2提供了全面的图表,展示了遗址在地理区域内的位置以及各区域文化年表中的考古文化;每个遗址和文化的考古背景按区域在补充信息第3节中提供和组织。补充信息指南提供了查找文本中每个参考对应的补充信息部分所需的信息,以及仅在补充信息中提及的补充表1-35和补充图1-101的描述。我们使用溶液富集法对超过120万个单核苷酸多态性(SNPs)进行了分析(方法)。我们将数据与来自相关地点和时期的1,312个先前报告的古代个体的数据合并。我们还报告了88个直接碳14测年结果,由于淡水水库效应可能导致高估达一千年(补充信息,第2节),这些结果应谨慎看待。我们的人群标签标识来自同一遗址的基因同质个体(区域_遗址_考古时期_时间),但对于某些分析,我们使用更加聚合的分组(表1中的术语表;参见扩展数据图2了解遗址的地理和时间位置以及它们的考古文化)。

图 1:NEAHG梯度线及其在古代北欧亚地区通过混合形成的遗产。

image.png

a,所有个体的采样位置和文本中提到但不在梯度线上的选定样本。此图像的高分辨率版本,包含所有人群标签,可在扩展数据图11中找到。b,主成分分析(PCA)。我们将古代和现代数据投射到来自122个基因分型的现代欧亚和美洲原住民人群的变异上,这些人群被选择为具有最小的撒哈拉以南非洲和大洋洲混合成分。我们观察到一个横跨大陆的NEAHG梯度线,以及一条从欧洲和青铜时代草原人群延伸到现代恩加纳桑人、Yakutia_LNBA个体和塞玛-图尔宾时期的Tatarka遗址的乌拉尔人群梯度线。在图例中,包含新测序样本的人群标签标有星号。c,NEAHG梯度线人群的混合比例。上图,qpAdm估计与四个来源相关的祖源(Russia_AfontovaGora代表ANE,China_AmurRiver_LPaleolithic_19K代表东亚,Russia_HG_Elshanks代表EHG,以及Romania_IronGatesMesolithic代表WHG)对于NEAHG梯度线上的所有人群。93个人群中有84个具有通过模型(P > 0.01);柱状图上方没有星号的人群。在这些情况下,我们显示P值最高的模型。误差条表示半个标准误差。中图,图例中所有八个来源的估计混合比例(扩展包括Tarim_EMBA1, Altai_N_9kya, Iran_GanjDareh_N和CHG);柱状图上方的粉色点表示所有通过的qpAdm模型都将Tarim_EMBA作为来源。十字标记表示用作来源的人群(Altai_N_9kya; Russia_MiddleVolga_Elshanka_Chekhalino_4_10kya)。对于Elshanka个体,我们用Russia_Veretye_Mesolithic.SG替换了EHG来源。下图,在K = 18时NEAHG梯度线人群的ADMIXTURE结果。所有人群的祖源都被分配到在EHG、Tarim_EMBA、Altai_N和东亚人群中最大化的成分。

Table 1 Glossary of acronyms

m Usage Meaning
M Term used to designate the archaeological period in population labels Mesolithic
N Term used to designate the archaeological period in population labels Neolithic. Note that in Russian archaeological literature and in the archaeology of much of Northern Eurasia, the Neolithic period is defined by the presence of pottery, and not of agriculture or domesticated animals.
EN, MN, EMN Term used to designate the archaeological period in population labels Early Neolithic, Middle Neolithic, Early and Middle Neolithic
BA, EBA, LBA, MLBA, LNBA Term used to designate the archaeological period in population labels Bronze Age, Early Bronze Age, Late Bronze Age, Middle and Late Bronze Age, Late Neolithic and Bronze Age
APS Acronym used to refer to an ancestry type Ancient Palaeosiberian ancestry—a term referring to an ancient Siberian population related to the ancestors of Native American populations, who admixed into all later Eastern and Central Siberian populations as well as present-day populations on either side of the Bering Straits
NEAHG Acronym North Eurasian hunter-gatherers—a term designating a belt of hunter-gatherer populations spanning Northern Eurasia in the first half of the Holocene.
AIEA Acronym Admixed Inner Eurasians—a term designating all populations in Central and Northern Eurasia that are the product of Holocene admixtures between West Eurasian ancestries and East Asian ancestries, including present-day and ancient Mongolic, Turkic, Tungusic and Uralic populations, as well as ancient Scythians, Sarmatians and pre-Scythian nomads of the Iron Age Steppes.

我们进行了无监督遗传分析,包括主成分分析(PCA)和ADMIXTURE(图1和补充信息,第4和5节),这些分析表明,来自北欧亚森林草原和森林区南缘约10-5千年前使用陶器的采集文化带的个体,形成了一个横跨约7,000公里的遗传梯度(图1b,c和扩展数据图3-5),这种梯度在今天已不复存在。我们称之为北欧亚狩猎采集者(NEAHG)梯度线。这一梯度线的中心接近古北欧亚(ANE)个体阿丰托瓦-戈拉3号(AG3),以及塔里木盆地的早期青铜时代人群(Tarim_EMBA15;图1b和扩展数据图3-5)。然而,许多其他人群并不在这一梯度线上,包括来自更北部(森林区深处或北极地区)的中部和东北西伯利亚人群、黑龙江流域人群,以及约5千年后的贝加尔湖西侧地区人群。

为了了解该地区约17千年前到4.0千年前的遗传差异和人口变化,我们将NEAHG梯度线上的个体、更深入东北西伯利亚的个体以及贝加尔湖周围的个体分组为人群,然后用一系列人群遗传学方法对它们进行分析。扩展数据图6以图形方式总结了我们的主要发现。在接下来的章节中,我们按顺序呈现我们的分析:首先是东北西伯利亚的人口历史;其次是NEAHG梯度线;然后,我们深入探讨连接两个青铜时代人群分组的联系:贝加尔湖西侧新石器晚期-青铜时代(Cisbaikal_LNBA)和雅库特新石器晚期-青铜时代(Yakutia_LNBA),以及叶尼塞语系和乌拉尔语系人群。

古西伯利亚人在亚洲和美洲的遗产

为了研究该地区的人口历史,我们使用f4-统计方法将来自东北西伯利亚、贝加尔湖西侧和贝加尔湖外侧地区的100个全新世个体聚类为遗传人群。这些分组在很大程度上与考古文化相吻合(补充信息,第6节和补充数据1)。我们确定了七个聚类:五个有多个成员,两个只有单个个体。按时间顺序,这些是:MiddleLena_KhatystyrCave_M_10.2kya(一个新报告的个体,来自勒拿河中游的哈提斯提尔洞穴,约10.2千年前),MiddleVitim_Dzhilinda1_M_N_8.4kya(处于中石器-新石器时代交界处,来自维季姆河的Dzhilinda-1遗址,属于Ust'-Yumurchen文化16),Transbaikal_EMN(8.8-6.2千年前,来自贝加尔湖以东的早期和中期新石器时代基托伊文化),Cisbaikal_EN(8.0-6.6千年前,来自贝加尔湖以西的早期新石器时代基托伊文化),Syalakh-Belkachi(6.8-6.2千年前,来自勒拿河中游流域的早期新石器时代Syalakh和中期新石器时代Belkachi文化),Cisbaikal_LNBA(5.1-3.7千年前,来自贝加尔湖以西的新石器晚期和青铜时代Serovo、Isakovo和Glazkovo文化)和Yakutia_LNBA(4.5-3.2千年前,主要与Ymyyakhtakh文化相关)。其余个体在遗传上处于中间位置,与我们分析的其他群体的混合一致。除了这七个聚类外,我们还添加了三个更古老的个体:MiddleLena_Khaiyrgas_16.7kya16,Selenge_Ust-Kyakhta_14kya17和Kolyma_M_10.1kya9,形成了一个十成员的横断面(扩展数据图7)。

我们使用qpAdm模型将每个目标人群视为来源于先前或同时期人群,采用"外群轮换"方法,该方法直接比较初始拟合模型以找到最佳匹配18(补充信息,第7和8节以及方法)。对于十个人群中的每一个,我们找到了一个或少量质量相似的合格模型(P > 0.05)。通过大量模型的所有扫描预计会允许一些不正确的模型通过18,19,因此我们的方案不应被视为一个稳健的模型选择程序;相反,它应被视为一个模型拒绝程序,合格的模型应被检查以识别一致的发现,正如我们在此所做的。数据也是通过混合实验室过程(SNP富集8和鸟枪测序)生成的,这引起了对由与人口历史无关的技术偏差导致错误推断的担忧20。然而,我们的推断可以在使用单一实验室过程生成序列的qpAdm设置中复制(补充信息,第7节)。我们的定性发现也与简单的f4-统计一致,这些统计测试了与可能与东北西伯利亚人口相关的远缘人群的亲缘关系(图2a,b和补充信息,第8节)。

图2:中全新世人群和形成它们的混合事件。

image.png

a, 形式为f4(埃塞俄比亚_4500BP,目标,中国_旧石器时代,Yana_UP)与f4(埃塞俄比亚_4500BP,目标,X,Yana_UP)的统计数据,其中X是古代美洲原住民或白令海峡地区人群。目标人群在y轴上的位置与其ANE和东亚祖源的比例成正比。Kolyma_M_10.1kya、MiddleVitim_Dzhilinda1_M_N_8.4kya、Syalakh-Belkachi和Yakutia_LNBA向左偏移,表明它们与古代白令海峡群体共享更多漂变,相比于具有类似ANE和东亚祖源比例的其他人群。b, 形式为f4(埃塞俄比亚_4500BP,X,中国_东北亚_内陆_新石器早期,中国_黑龙江_中石器_14K)与f4(埃塞俄比亚_4500BP,X,中国_旧石器时代,MA1_HG)(左上)和f4(埃塞俄比亚_4500BP,X,中国_旧石器时代,秘鲁_Laramate_900BP)(左下)的统计数据,其中X是东北亚和西伯利亚的古代人群。这些统计数据检测到内陆东亚相关源(以禹民狩猎采集者中国_东北亚_内陆_新石器早期为代表)和黑龙江相关源(由中国_黑龙江_中石器_14K表示)之间的差异。黑龙江地区的人群始终与中国_黑龙江_中石器_14K有高度亲缘关系,而蒙古高原和贝加尔地区的人群则与禹民共享更多亲缘关系。西伯利亚最早的强烈东亚相关个体,中石器时期的MiddleLena_KhatystyrCave_M_10.2kya,极端黑龙江相关;其他APS祖源比例高的东北西伯利亚群体,如MiddleVitim_Dzhilinda1_M_N_8.4kya、Kolyma_M_10.1kya和Syalakh-Belkachi,兼有两种亲缘关系;Cisbaikal_LNBA则极端内陆东北亚相关。沿黄河流域的农业人群中,与中国_东北亚_内陆_新石器早期的亲缘关系增强。c, 根据qpAdm在从约17千年前到约4千年前的十成员横断面中推导出的东北亚和东西伯利亚人群关系示意图。主要发现是:(1)MiddleLena_Khaiyrgas_16.7kya人群是一个几乎未混合的APS人群代表,具有美洲原住民亲缘关系;(2)APS祖源通过两条路径持续存在;以及(3)西伯利亚人的东亚祖源来源于黑龙江流域相关源和内陆东亚相关源。

我们横断面中最古老的个体,MiddleLena_Khaiyrgas_16.7kya(来自雅库特的勒拿河中游,属于迪尤克泰文化;补充信息,第3节)适合作为美洲原住民的姐妹群体,可以被模型化为完全来源于一个与美洲原住民相关的源(补充信息,第8节)。古西伯利亚人(APS)这一术语曾用于指定我们横断面中第三个个体(Kolyma_M_10.1kya)的祖源,在此我们扩展这一术语,用来指定全新世前(元)人口,该人口在ANE和东亚祖源之间混合,产生了美洲原住民,其中MiddleLena_Khaiyrgas_16.7kya可能是一个几乎未混合的代表。APS祖源在我们西伯利亚横断面和北美北极地区所有后来群体的基因形成中发挥了关键作用。

我们的发现表明,APS祖源可能在东北西伯利亚旧石器时代晚期随着富含锥形和楔形微核的"白令传统"石器扩散21。这种祖源在两个后期个体中仍保持较高水平,但与额外的东亚祖源混合,这两个个体分别是Selenge_Ust-Kyakhta_14kya17(位于贝加尔湖以南的色楞格河,其石器属于同一传统)和Kolyma_M_10.1kya(靠近白令海峡9;补充信息,第8节)。更西边的阿尔泰地区,到了全新世早期(约9千年前),APS与ANE相关源的混合形成了NEAHG梯度上的Altai_N(补充信息,第8节),与上鄂毕河和阿尔泰山麓的新石器时代库兹涅茨克-阿尔泰文化相关(补充信息,第3节)。

先前的研究表明,在整个全新世期间,东北西伯利亚地区的"新西伯利亚"东亚祖源增加,而APS祖源下降9。我们发现,这种不断增加的东亚祖源可以追溯到至少两个来源:内陆东北亚相关祖源,我们以约8.4千年前的内蒙古禹民个体22(China_NEastAsia_Inland_EN)为代表;以及黑龙江流域相关祖源,由约14千年前的黑龙江流域全新世前狩猎采集者23(China_AmurRiver_14K)所代表。我们西伯利亚横断面中东亚祖源比例高而APS祖源比例低的最古老个体,MiddleLena_KhatystyrCave_M_10.2kya,与黑龙江狩猎采集者有很强的亲缘关系(图2b和补充信息,第8节),但更南方的后续人群(包括与基托伊相关的约8.8-6千年前的Transbaikal_EMN和Cisbaikal_EN,以及约7.5千年前的Mongolia_N_North)与内陆东北亚源的亲缘关系不断增强(图2b)。我们发现,后来的群体因其东亚祖源的混合而有所不同:沿NEAHG梯度分布的个体,包括Cisbaikal_EN和Transbaikal_EMN,具有东亚祖源的特征性混合,其亲缘关系在内陆和黑龙江相关源之间处于中间位置,但非NEAHG人群,如来自黑龙江流域的狩猎采集者或Cisbaikal_LNBA,则有不同的比例(补充信息,第8节)。

在贝加尔湖西侧地区,全新世中期,祖源从贝加尔湖西侧新石器早期(Cisbaikal_EN,8-6.6千年前)被贝加尔湖西侧新石器晚期-青铜时代(Cisbaikal_LNBA,5.1-3.7千年前)所替代,这一转变与从新石器早期基托伊文化向新石器晚期和青铜时代的谢罗沃、伊萨科沃和格拉兹科沃文化过渡相吻合(补充信息,第8节)。Cisbaikal_LNBA的APS祖源比其前身高得多,这只能被模型化为源自与Ust-Kyakhta_14kya相关的源,但由于这两个人群之间相隔很长时间,这一结果应谨慎看待。Cisbaikal_LNBA还有一个显著特点,即在我们的横断面中具有最强烈的内陆相关东亚祖源(图2b和补充信息,第8和11节)。尽管APS祖源增加,但与其他类似ANE和东亚祖源混合的群体(如Ust-Kyakhta_14kya、Khaiyrgas_16.7kya.SG或来自上叶尼塞的NEAHG人群;图1b和2a)相比,Cisbaikal_LNBA与美洲原住民或白令海峡人群的共享漂变并未增加。相反,它与中西伯利亚现代人群,尤其是叶尼塞河流域的人群,共享高水平的漂变(扩展数据图8和补充信息,第8节)。我们在下文中展示,Cisbaikal_LNBA相关祖源可能是APS祖源持续到现代人群中的两条路径中的第一条,即中西伯利亚人群;也就是说,它是"路径1"人群(图2c和3b以及补充信息,第8节)。

图3:Yakutia_LNBA和Cisbaikal_LNBA对AIEA的贡献。

image.png

标有所有人群标签的版本在扩展数据图10中呈现。af4-统计量的主成分分析。标有所有人群标签的版本在补充信息第13节中呈现。形式为f4(Ethiopia_4500BP, AIEA, AG3, East Asian)的统计量主成分分析测量了AIEA人群的东亚祖源与一组测试的东亚人群之间的亲缘关系:China_AmurRiver_N、Mongolia_N_North、Transbaikal_EMN、Cisbaikal_LNBA或Yakutia_LNBA。PC1与任何类型东亚祖源的比例相关。在给定的东亚祖源比例下,古代和现代乌拉尔语系人群在PC2上的偏移方向表明与Yakutia_LNBA存在不成比例的亲缘关系。PC3突出了与Cisbaikal_LNBA(右侧)的相似性,叶尼塞语系人群、南西伯利亚突厥人、萨莫耶德人和两个上叶尼塞离群值(3.0-2.9千年前,RISE497.SG和RISE554.SG,根据我们的考古研究表明它们来自卢加夫斯卡亚文化)显示最强的亲缘关系。b,Cisbaikal_LNBA对现代人群的贡献。Cisbaikal_LNBA祖源超过4%的人群以大黑点表示。米努辛斯克盆地可能的卢加夫斯卡亚文化离群值以白色星号表示。c,祖源建模。上图,AIEA人群的qpAdm结果。条形图上方的一个橙色点表示所有东亚祖源都可以被模型化为来自Yakutia_LNBA;两个橙色点表示——此外——所有通过验证的模型都将Yakutia_LNBA包含在来源中。我们还使用Cisbaikal_LNBA作为参考和来源进行了qpAdm分析(补充信息,第11节);灰色点表示所有通过验证的模型都将Cisbaikal_LNBA包含在来源中。下图,ADMIXTURE结果。几乎所有乌拉尔语系人群的东亚祖源几乎完全归属于Yakutia_LNBA成分;叶尼塞语系人群、南西伯利亚突厥人和萨莫耶德人是唯一具有明显Cisbaikal_LNBA相关成分水平的人群。米努辛斯克盆地的两个可能的卢加夫斯卡亚文化离群值是唯一几乎所有祖源都归属于Cisbaikal_LNBA成分的个体。

在贝加尔湖区域以北沿勒拿河,MiddleLena_KhatystyrCave_M_10.2kya个体的大部分祖源来自黑龙江流域狩猎采集者,但来自Kolyma_M_10.1kya相关源的混合导致在随后的MiddleVitim_Dzhilinda1_M_N_8.4kya中APS祖源增加(补充信息,第8节)。随后,APS祖源随着来自东亚源的混合而下降,这一系列人口更替似乎与考古文化之间的转变相吻合。第一次转变是从MiddleVitim_Dzhilinda1_M_N_8.4kya到Syalakh-Belkachi人群(6.8-6.2千年前),约有20%的混合来自贝加尔湖地区的东亚源。第二次转变是Syalakh-Belkachi再次与Transbaikal_EMN混合约50%,形成了与Ymyyakhtakh相关的Yakutia_LNBA人群(4.5-3.2千年前)。

这四个东北西伯利亚人群序列(科雷马10.1千年前、中维季姆_兹林达18.4千年前、西亚拉赫-贝尔卡奇和雅库特新石器晚期-青铜时代)在主成分分析中独特地向美洲原住民和白令海峡人群偏移(图1、扩展数据图5和8以及补充信息第8节)。在f4-统计量中,它们与古代和现代白令海峡人群共享的漂变多于任何具有相似ANE和东亚祖源比例的群体(哈伊尔加斯16.7千年前、乌斯季-恰赫塔14千年前、贝加尔湖西侧新石器晚期-青铜时代以及阿尔泰以东的所有NEAHG;图2a)。使用qpAdm,我们确认这一序列的第三个成员——西亚拉赫-贝尔卡奇——对北美洲北极小型工具传统的人群做出了重大贡献(约70%),这些人群由格陵兰萨卡克古爱斯基摩人和其他来自多塞特及相关文化的个体代表,这也在其他地方有报道16;补充信息第9节)。这种与西亚拉赫-贝尔卡奇相关的古爱斯基摩祖源在白令海峡周围的所有后来人群中都持续存在,包括那些与现代爱斯基摩-阿留特人、楚科奇-堪察加人和尤卡吉尔人相关的人群,这解释了这四个人群序列独特的跨白令海遗传联系。我们提出,这代表了APS祖源持续存在的第二条主要路径:即这些是"路径2"人群(图2c和补充信息第8节)。

然而,古阿萨巴斯坎人是一个例外,他们不需要来自格陵兰_萨卡克.SG的这种祖源,这一点通过他们在f4-统计量中的表现得到了证实(补充图9798)。这表明阿萨巴斯坎人和古爱斯基摩人的APS祖源并非来自同一来源——这与我们研究小组先前的发现7,8相矛盾,但证实了关于欧亚大陆向美洲有多次全新世迁徙的建议9,10,24。相反,我们发现了有关路径1人群参与古阿萨巴斯坎人APS混合的指示性但较弱的证据(补充信息,第9节)。语言学家已经发现中西伯利亚的叶尼塞语系与北美的纳-德内语系之间存在联系6,我们的研究结果可能为德内-叶尼塞假说提供了一些遗传学上的支持。

NEAHG 梯度
更南部,在10-4千年前,来自北欧亚森林草原和森林区南缘的所有150个新报告和81个先前发表的个体都落入一个遗传弧线——NEAHG梯度——它连接了使用陶器的东欧采集者与外贝加尔地区的同类群体,这在ADMIXTURE分析(图1c,底部)和多个主成分分析(图1b和扩展数据图3-5)中可见。我们根据地点、时间和在主成分分析和ADMIXTURE中的遗传相似性对NEAHG个体进行分组(图1a和扩展数据图3-5和9;分组标签结果见扩展数据图10和补充数据1)。绝大多数可以在qpAdm中被模型化(限于1240K数据25;关于本文所有qpAdm分析的详细信息,请参见扩展数据表1)为四种祖源的混合(93个人群中的84个P > 0.01):西方狩猎采集者祖源(WHG,由来自塞尔维亚的样本代表26,约10千年前之后),欧洲狩猎采集者(EHG)祖源(由来自中伏尔加河埃尔尚卡文化的I6413代表,这是东欧最古老的使用陶器的文化,约8千年前),古北方欧亚人(ANE,由约16千年前的AG3个体代表27)和东亚人(由约19千年前的黑龙江流域采集者代表23;图1c,底部,补充信息,第10节和补充数据2)。在西部,从波罗的海到乌拉尔山的狩猎采集者,如埃尔尚卡、坑-梳状纹/利亚洛沃和沃洛索沃文化,主要具有EHG和低水平的WHG,这与先前的发现一致28,29。乌拉尔山以东,在托博尔和中伊尔蒂什河的新石器时代人群中,以及在使用梳状-坑纹陶器的西西伯利亚铜石器时代文化圈中,EHG与ANE和低水平的东亚祖源混合,类似于哈萨克草原的博泰人群12(5.4-5.1千年前)和先前描述的西西伯利亚狩猎采集者30(6.6-8.1千年前)。更东部,来自上鄂毕河和阿尔泰山麓库兹涅茨克-阿尔泰文化的个体可以被模型化为ANE和东亚祖源的双向混合。这一趋势延续到上叶尼塞和坎斯克河流域新石器时代遗址的个体中,在那里ANE祖源减少而东亚祖源增加。这一梯度通过贝加尔湖西侧早期新石器时代(Cisbaikal_EN)延伸到贝加尔地区的基托伊文化,最终止于外贝加尔早中期新石器时代(Transbaikal_EMN)。

我们使用限于1240K数据的qpAdm方法寻找阿尔泰山以西NEAHG人群ANE祖源的时间接近的来源(扩展数据表1)。两个来源可以解释所有这种祖源(图1c,中间和补充信息,第10节):来自中亚的类塔里木早中期青铜时代(Tarim_EMBA)人群(约4千年前)和库兹涅茨克-阿尔泰新石器时代人群(以Altai_N_9kya为代表)。塔里木早中期青铜时代晚于NEAHG人群,但ADMIXTURE和PCA分析表明,与他们相关的一个来源和西西伯利亚的NEAHG之间存在基因流动(图1b,c,底部)。西西伯利亚NEAHG如果没有与塔里木早中期青铜时代相关的来源就无法建模(图1c和补充信息,第10节),这意味着与塔里木早中期青铜时代相关的狩猎采集者人群在青铜时代之前就生活在中亚,并对北方的群体有所贡献。

NEAHG梯度在中全新世时期由于来自东西方的迁徙而发生了分裂(扩展数据图6)。从西方,雅姆纳亚牧民带来了草原早中期青铜时代(Steppe_EMBA)祖源,随后随着法佳诺沃、辛塔什塔和安德罗诺沃文化的扩张,又带来了欧洲晚期新石器-青铜时代(Europe_LNBA)和草原晚期新石器-青铜时代(Steppe_LNBA)祖源。在东方,其他迁徙在约5.4千年前将贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)祖源楔入NEAHG梯度的贝加尔湖地区。随后,草原中晚期青铜时代(Steppe_MLBA)与其他东亚祖源的混合产生了多个遗传梯度中的混合群体,这些遗传梯度连接了讲突厥语、蒙古语、通古斯语和乌拉尔语的人群(图1c和扩展数据图3-5)。为了评估NEAHG梯度和中西伯利亚人群在后来欧亚大陆人群中留下的遗产,我们分析了一组混合内亚欧人群(AIEA)——我们用来指代古代和现代乌拉尔语、突厥语、蒙古语、通古斯语和叶尼塞语人群,以及晚期青铜时代和铁器时代的牧民如斯基泰人、萨尔马特人和匈奴人的术语。我们发现NEAHG人群对这些后来的群体贡献很少,但两个非NEAHG人群——贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)和雅库特晚期新石器-青铜时代(Yakutia_LNBA)——以重要方式做出了贡献。

贝加尔湖西侧晚期新石器-青铜时代群体与叶尼塞语系相关
贝加尔湖西侧晚期新石器-青铜时代群体(5.1-3.6千年前;扩展数据图7)拥有丰富的APS祖源,在主成分分析中占据独特位置(扩展数据图6c),并且与内陆东北亚人群有着独特的强烈亲缘关系(图2b,扩展数据图8和补充信息,第8节)。虽然来自东北西伯利亚的其他富含APS祖源的群体(即所有四个路线2的人群)与白令海峡群体有更密切的关系,但四条分析线证明贝加尔湖西侧晚期新石器-青铜时代群体与叶尼塞流域的现代人群共享更多的遗传漂变。

首先,ADMIXTURE(图3和扩展数据图11)显示,现代叶尼塞流域群体,如克特人、萨莫耶德人和西伯利亚突厥语使用者,独特地拥有贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)相关的成分(图3b,c,底部和扩展数据图11b,c)。其次,当贝加尔湖西侧晚期新石器-青铜时代被用作参考人群时,这些群体的qpAdm模型一致地失败;贝加尔湖西侧晚期新石器-青铜时代在所有通过的模型中都是一个来源(图3c和扩展数据图11c的底部行以及补充信息第11节)。第三,在设计用于检测混合内亚欧人群(AIEA)之间对不同东亚群体亲和性差异的f4统计主成分分析中,叶尼塞语系、萨莫耶德语系和南西伯利亚突厥语使用者系统地向由与贝加尔湖西侧晚期新石器-青铜时代共享漂变增加产生的方向移动(图3a和扩展数据图11a的PC3以及补充信息第11节)。第四,在克特人中高频出现,在萨莫耶德和西伯利亚突厥人群(如塞尔库普人和图瓦人)中低频出现的与单倍群Q-YP1691相关的Y染色体序列,仅从属于贝加尔湖西侧晚期新石器-青铜时代的格拉兹科沃男性中被发现(补充信息第11节)。

民族语言学数据和历史记录表明,南西伯利亚突厥人同化了叶尼塞语系的使用者,这一过程始于公元六世纪叶尼塞柯尔克孜人的到来,一直持续到近代早期。其他西伯利亚突厥语——雅库特语和多尔干语——是由那些祖先在过去一千年间从如今南西伯利亚突厥人居住地区迁徙而来的人群所使用的。更北方,民族志记录表明,一些说萨莫耶德语的群体与叶尼塞语系使用者保持着密切关系,存在大量通婚现象(补充信息,第12节)。

出乎意料的是,我们还发现两个已发表的晚期青铜时代(3.0-2.9千年前)来自上叶尼塞米努辛斯克盆地的东亚离群个体(RISE497.SG和RISE554.SG)拥有几乎完全的贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)祖源(85-95%;图3b和补充信息,第11节)。这些个体在所有现代或古代混合内亚欧人群(AIEA)中与贝加尔湖西侧晚期新石器-青铜时代的遗传亲缘关系最强(图3a,c和扩展数据图11)。它们在原始出版物中被标记为卡拉苏克文化,但我们的考古调查表明它们应该归属于卢加夫斯卡亚文化(补充信息,第3节)。因此,在晚期青铜时代约3.0千年前,拥有极高贝加尔湖西侧晚期新石器-青铜时代祖源的人群已经出现在上叶尼塞地区,接近于今天贝加尔湖西侧晚期新石器-青铜时代祖源最大化的地方(图3b)。除了克特语外,所有其他六种现已灭绝的叶尼塞语言都曾在今天贝加尔湖西侧晚期新石器-青铜时代祖源达到顶峰的地区使用(图3b)。克特人自己则是在最近的扩张中,最晚于十七世纪才到达他们目前的北方位置(补充信息,第12节)。

这些发现与基于叶尼塞语水文地名分布的重建相符——即叶尼塞语系的发源地位于贝加尔湖西侧地区和上叶尼塞河之间(补充信息,第12节)。贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)人群首次在基因上出现于5.4-3.8千年前的谢罗沃文化、伊萨科沃文化和格拉兹科沃文化中(补充信息,第11节)。沿着中安加拉河(从贝加尔湖流入叶尼塞河),这一人群与格拉兹科沃文物一起出现在按照格拉兹科沃传统埋葬的样本中(补充信息,第3节)。因此,贝加尔湖西侧晚期新石器-青铜时代的祖源可能追溯叶尼塞语系使用者更远的史前迁徙。

雅库特晚期新石器-青铜时代与乌拉尔语系相关
雅库特晚期新石器-青铜时代(图1和扩展数据图7)的个体主要属于勒拿河流域的伊梅亚赫塔赫文化,是与白令海峡群体共享独特遗传漂变的路线2人群之一(图2a和补充信息,第8节)。他们可以被模拟为勒拿河谷早期的锡亚拉赫-贝尔卡奇人群与贝加尔湖以东的基托伊人群(Transbaikal_EMN)之间大约50%:50%的混合(补充信息,第8节)。与贝加尔湖以东早中全新世人群的关联还得到了Y染色体单倍群N共享亚型的支持(补充信息,第13节),并且与伊梅亚赫塔赫文化起源的考古学重建相符(补充信息,第3节)。然而,在勒拿河流域西南远处的克拉斯诺亚尔斯克-坎斯克森林草原地区发现的一个约4.2千年前的个体(来自Nefteprovod-2遗址的Kra001.SG),在一个原本由东北亚-高加索梯度(NEAHG)人群占据的地区,在遗传上也属于雅库特晚期新石器-青铜时代,这表明雅库特晚期新石器-青铜时代的个体可能在4.0千年前不久从东北西伯利亚向阿尔泰-萨彦山北部的森林草原地区扩散,这与当时伊梅亚赫塔赫陶器向该地区的传播时间相吻合。

雅库特晚期新石器-青铜时代与古代和现代乌拉尔语系人群明确相关。首先,在ADMIXTURE分析中,当K=18时,雅库特晚期新石器-青铜时代中最大化的成分出现,该成分在今天的恩加纳桑人中达到峰值,并占据了乌拉尔语系使用者几乎所有的东亚祖源;非乌拉尔语系的混合内亚欧人群(AIEA)要么没有雅库特晚期新石器-青铜时代成分,要么除了雅库特晚期新石器-青铜时代外还有其他东亚成分(图3c和扩展数据图11c)。其次,在f4统计量的主成分分析中,乌拉尔语系使用者朝着表明与雅库特晚期新石器-青铜时代相比其他东亚祖源亲和性增加的方向偏移(图3a和扩展数据图11a中的PC2以及补充信息,第13节)。第三,另一组f4统计量表明,在任何东亚混合程度上,与雅库特晚期新石器-青铜时代相比其他东亚祖源亲和性最高的混合内亚欧人群总是乌拉尔语系人群(扩展数据图12和补充信息,第13节)。第四,乌拉尔语系使用者的qpAdm模型总是需要雅库特晚期新石器-青铜时代作为来源,通常占据他们所有的东亚祖源(图3c和扩展数据图11c的顶行以及补充信息,第13节),与其他民族语言学分组的混合内亚欧人群总是有其他东亚来源形成对比。最后,雅库特晚期新石器-青铜时代的男性携带有Y染色体单倍群N的亚型,这些亚型在现代乌拉尔语系使用者中高频出现(补充信息,第13节)。

雅库特晚期新石器-青铜时代在塞玛-图尔宾现象中的角色
从东欧到西西伯利亚的人口,直到中晚期青铜时代(法佳诺沃、辛塔什塔和安德罗诺沃文化)都不显示任何雅库特晚期新石器-青铜时代祖源3,4,5,但来自同一地区的现代乌拉尔语系使用者却有这种祖源,这表明雅库特晚期新石器-青铜时代祖源向西扩散,在最早约4千年前部分替代了草原中晚期青铜时代和欧洲晚期新石器-青铜时代祖源29,30,31。这一转变可能伴随着与乌拉尔语系相关的Y染色体单倍群N的扩散,该单倍群在雅库特晚期新石器-青铜时代祖源到来之前在东欧和西西伯利亚是不存在的。在此,我们展示雅库特晚期新石器-青铜时代祖源向西扩散的最早阶段发生在塞玛-图尔宾现象中。

塞玛-图尔宾现象指的是一系列相似的青铜器物突然出现,这些器物采用先进的铸造技术制成,在约4.0千年前从中国到波罗的海的北欧亚大陆广阔地区传播1,40。考古学家一致认为,它负责将冶金技术引入东亚,并将锡青铜的先进铸造方法传播到欧洲41,42。塞玛-图尔宾器物以其精湛和精细而著称(扩展数据图13)。大多数是武器,但有些是具有仪式意义的物品。大多数塞玛-图尔宾物品是分散在不同文化遗址中的孤立发现,但许多出现在西西伯利亚和东欧的仪式墓地中,这些墓地是大型埋葬复合体,有时还有空的仪式墓穴(衣冠冢),里面有丰富的塞玛-图尔宾器物和铸造模具收藏。这种不寻常的分布引发了人们对塞玛-图尔宾现象的社会性质以及其携带者身份的猜测1,40,43,44。到目前为止,发现的唯一制造塞玛-图尔宾青铜器物的物质证据是从鄂毕-伊尔蒂什盆地和上鄂毕与上叶尼塞之间地区的使用金属的渔猎采集者的居住地遗址中恢复的——这种非凡的文化联系在考古文献中引起了大量评论1,43,44。

我们从4个遗址的16位个体中生成了全基因组数据,这些遗址都紧密地分布在大约4.0千年前的时间段(补充信息第2节和补充数据1)。其中两个遗址——位于鄂毕-伊尔蒂什盆地的中伊尔蒂什河岸的罗斯托夫卡(Rostovka)(9位个体)和位于中乌拉尔山脉以东的萨特加-16(Satyga-16)(2位个体)——是塞玛-图尔宾墓地。除此之外,我们还添加了来自两个塞玛-图尔宾时期遗址的样本,这些遗址与塞玛-图尔宾现象的直接证据较少,但我们的基因分析表明它们可能与之相关:一个来自切尔诺奥泽里耶-1(Chernoozerye-1),位于罗斯托夫卡附近,以及四名男性来自一个此前未描述的遗址——位于上叶尼塞河沿岸、阿尔泰山北部克拉斯诺亚尔斯克-坎斯克森林草原上的塔塔尔卡山(Tatarka Hill)。在我们使用qpAdm的基因建模中,来自塔塔尔卡山的四位个体与完全属于雅库特晚期新石器-青铜时代(Yakutia_LNBA)的特征一致。相比之下,来自罗斯托夫卡、萨特加-16和切尔诺奥泽里耶-1的个体携带有三种主要和两种次要祖源的不同比例(图1b和图4,扩展数据图4和图5以及补充信息第15节)。基于qpAdm,这些祖源是:(1) 雅库特晚期新石器-青铜时代;(2) 来自东北亚-高加索梯度(NEAHG)的富含古北欧(ANE)祖源;以及(3) 草原中晚期青铜时代(Steppe_MLBA),这些祖源出现在未混合的个体代表中或在混合个体内部交织(二向混合:NEAHG祖源 + Steppe_MLBA,或三向混合:NEAHG祖源 + Steppe_MLBA + Yakutia_LNBA;图4b顶部)。来自更西部的萨特加-16的两位个体都是混合的(携带所有三种祖源类型),与罗斯托夫卡形成对比(9位个体中有4位是单一祖源个体:2位NEAHG,1位Yakutia_LNBA和1位Steppe_MLBA;图4b和补充信息第15节)。

图4:塞玛-图尔宾现象的遗传学。

image.png

a,塞玛-图尔宾遗址和发现地图。我们获得了基因数据的切尔诺奥泽里耶-1、罗斯托夫卡、萨特加-16和塔塔尔卡用红色圆圈标记。其他重要遗址编号为:(1)塞玛;(2)列什诺耶;(3)图尔宾诺;(4)卡宁斯卡亚洞穴;(5)萨特加-16;(6)罗斯托夫卡;(7)萨穆斯-4;(8)沙伊坦斯科耶湖;以及(9)塔塔尔卡。改编自参考文献61。b,16个塞玛-图尔宾时期个体的ADMIXTURE和qpAdm比例:9个罗斯托夫卡,2个萨特加-16,1个切尔诺奥泽里耶-1和4个塔塔尔卡。顶部,使用远端来源集的qpAdm模型选择,始终显示最简单通过(P > 0.01)且P值最高的qpAdm模型(与图3b中相同的建模)。I32899在P > 0.01时没有模型通过,如条形图上方的星号所示。中间,使用更近端来源集的qpAdm结果,将塔塔尔卡个体用作雅库特晚期新石器-青铜时代的来源,将西西伯利亚晚期新石器或铜石并用时期(乌拉尔山和阿尔泰山之间)的人群用作NEAHG的来源;雅库特晚期新石器-青铜时代已被添加到参考中。即使雅库特晚期新石器-青铜时代在参考中,塔塔尔卡人群的祖源也足以解释塞玛-图尔宾个体所有与雅库特晚期新石器-青铜时代相关的祖源。东亚祖源可完全来自雅库特晚期新石器-青铜时代相关来源的样本在其qpAdm条形图上方用单个橙色圆点标记,而在每个通过模型中都需要这种来源的样本则用两个橙色圆点标记。一个个体(I32816)在来源中需要贝加尔湖西侧新石器晚期-青铜时代祖源(灰点);为该个体显示的模型是最简单的通过模型,其中包含贝加尔湖西侧新石器晚期-青铜时代和雅库特晚期新石器-青铜时代祖源。在两组qpAdm中,来自切尔诺奥泽尔斯基-1的个体(I6787)需要来自乌拉尔山以西远处的来源(WHG祖源)。底部,K = 18时的ADMIXTURE比例。

近端qpAdm分析揭示了塞玛-图尔宾人的直接祖先。罗斯托夫卡、萨特加-16和切尔诺奥泽里耶-1的雅库特晚期新石器-青铜时代祖源与塔塔尔卡山的人群相关,中西伯利亚没有额外的雅库特晚期新石器-青铜时代混合(图4b)。这一联系通过罗斯托夫卡出土的单倍群N-L1026(在雅库特晚期新石器-青铜时代个体I32545中)得到加强,塔塔尔卡山的全部四位男性也携带这一单倍群(补充信息第13节)。罗斯托夫卡的亚支系(N-L1026>Z1936)在当今从西西伯利亚到波罗的海的乌拉尔语系人群中广泛分布,在靠近波罗的海的芬兰人、维普斯人和卡累利阿人中达到最高频率(高达约40%)。塞玛-图尔宾个体的东北亚-高加索梯度(NEAHG)祖源很大程度上来自西西伯利亚先前的新石器和铜石并用时期人群(图4e),这与附近奥迪诺沃和克罗托沃文化的冶金狩猎采集者起源一致,他们系统性地铸造塞玛-图尔宾器物。然而,一些个体需要来自更远地区的额外NEAHG祖源,来自与东欧狩猎采集者(EHG)相关或与阿尔泰新石器时代(Altai_N)相关的来源。

这三种主要的祖源伴随着两种次要祖源:非雅库特晚期新石器-青铜时代(non-Yakutia_LNBA)的东亚祖源,以及来自远至波罗的海地区的西欧狩猎采集者(WHG)祖源(图4e)。来自切尔诺奥泽里耶-1的塞玛-图尔宾时期个体(I6787)在ADMIXTURE分析和所有拟合的qpAdm模型中都需要较大比例的WHG祖源(图4e和补充信息第15节)。这是一个引人注目的案例,一个人的近期祖源可追溯到至少三个来自欧亚大陆广泛分离区域(波罗的海、西西伯利亚和阿尔泰-萨彦)的狩猎采集人群。来自罗斯托夫卡的两个个体,I32816和I33369,拥有来自东方的祖源——前者的情况是来自贝加尔湖西侧新石器晚期-青铜时代(Cisbaikal_LNBA)相关来源,可能是同时期格拉兹科沃文化的采集者。

我们的研究结果表明,塞玛-图尔宾器物是在一种社会文化背景下制造、交换和传播的,该背景将来自横跨大陆网络的多个人群整合到埋葬在单一墓地的连贯社会群体中。我们的样本捕捉到了这一过程的快照,表明人类迁徙模式与考古证据相对应,显示了器物在广阔地理距离上的相似性,这在当时的文化群体中是不寻常的1,46。

讨论

总的来说,我们的研究揭示了北欧亚大陆五次主要的祖源变化:

(1)一个与美洲原住民相关的更新世人群,我们称之为APS祖源,与两个东亚祖源来源——内陆东北亚相关和黑龙江流域相关——混合,从而为西伯利亚各地的后期人群做出贡献。APS祖源通过两条路线持续存在,第一条路线(路线1)负责中西伯利亚的APS祖源,第二条路线(路线2)负责白令海峡两侧人群的APS祖源。

(2)跨越北欧亚大陆纬度带的早期陶器使用者,生活在全新世早期至中期(1万至1.5万年前),包括森林草原和与之紧邻的森林地带,构成了一个横跨大陆的东西方向基因梯度,包含EHG(东欧狩猎采集者)、ANE(古北欧亚人)和东亚祖源。这个NEAHG(东北亚-高加索梯度)梯度开始在全新世中期(约5千年前开始)因几次重大人口扩张而瓦解,这些扩张要么完全取代了NEAHG梯度群体,要么与之发生了大量混合。

(3)大约5.4千年前的基因更替见证了一个群体的崛起,即贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)人群——一个路线1人群。这种祖源从贝加尔湖西侧地区扩散到叶尼塞地区,直到晚期青铜时代末期,约3.1千年前。如今,这种祖源的存在与叶尼塞语系人群以及那些可能在历史上与之混合的人群有着强烈的关联。我们还发现,古爱斯基摩人格陵兰岛萨卡克(Greenland_Saqqaq.SG)人群向白令海峡两侧所有后期古代人群贡献了高水平的APS祖源,这解释了他们与路线2相关人群的高度亲缘性,但来自阿拉斯加的古代阿萨巴斯坎人(约1千年前)是个例外,这与他们从另一个来源获得APS祖源的情况一致,这一结果还得到了暗示性证据的支持,即阿萨巴斯坎人中的APS来源与路线1人群有亲缘关系,为德内-叶尼塞假说提供了首个基因数据支持。

(4)大约4.5千年前的基因更替见证了东北西伯利亚雅库特晚期新石器-青铜时代(Yakutia_LNBA)人群的崛起——这是路线2中的一个人群。如今,这种祖源往往是乌拉尔语系人群中唯一存在的东亚祖源,这是其他任何民族语言群体所不具备的显著特征。到了约4.2千年前,这种祖源出现在远离雅库特的西南方向上叶尼塞河上游的克拉斯诺亚尔斯克地区,伴随着Y染色体单倍群N的亚支系,这种单倍群在当今远至波罗的海的乌拉尔语系男性中频率很高。这种祖源很可能是通过人口迁徙传播了乌拉尔语系语言。

(5)生活在塞玛-图尔宾现象时期的个体——这是一个考古学术语,指大约4千年前在北欧亚大陆广阔地区突然出现的一系列独特青铜器物——在基因上是异质的,但许多人携带雅库特晚期新石器-青铜时代(Yakutia_LNBA)祖源,这种祖源出现在靠近乌拉尔山脉的塞玛-图尔宾遗址中,远在这种祖源原始分布区的西部。这种地理分布支持了塞玛-图尔宾现象与早期乌拉尔语系社区扩散有关的理论。埋葬在塞玛-图尔宾遗址的人们的其余基因祖源极其多样化,其最终来源从波罗的海延伸到贝加尔湖。这种基因祖源模式指向了一个社会过程,该过程使基因和文化上相距甚远的个体之间能够进行至少几代的接触和通婚。

大规模社会中的语言传播不一定需要人口迁移,但在较小规模社会中,同样的过程可能需要一定程度的人类流动性,这种流动性可以在基因混合中被观察到。我们的一个主要分析发现是识别出贝加尔湖西侧晚期新石器-青铜时代(Cisbaikal_LNBA)作为早期叶尼塞语系语言使用者传播的基因示踪剂。我们进一步证明,约1.1千年前阿拉斯加的古代阿萨巴斯坎人在北美北极地区人群中独特之处在于缺乏来自古爱斯基摩人群的祖源,但拥有来自路线1 APS人群的初步信号,这一人群也明显地为叶尼塞语系群体做出了贡献。这些结果有助于将早期叶尼塞语系群体的迁移与贝加尔湖西侧地区联系起来,并可能为西伯利亚叶尼塞语系与北美阿萨巴斯坎语系之间的语言联系提供初步的基因支持:即"德内-叶尼塞假说"5。在我们的第二个主要分析发现中,我们表明雅库特晚期新石器-青铜时代(Yakutia_LNBA)可能是早期乌拉尔语系社区传播的极佳示踪剂,而这种祖源最早向西扩散是由与塞玛-图尔宾现象相关的人群所促成的。

考古学家对塞玛-图尔宾文物在如此广泛文化范围内快速传播的社会过程存在争议。我们发现,埋葬在塞玛-图尔宾墓地的人们在基因上高度多样化,这与塞玛-图尔宾人群同质性的假设相矛盾。我们的研究结果表明,要么是来自基因和文化上截然不同的社会群体的个体一次性融合形成了一个流动人口(这一事件可能发生在不同的地点,且先于塞玛-图尔宾遗址本身),要么——基于塞玛-图尔宾墓地个体的多向混合——来自多个群体的人们在多代人的活动中持续积极互动形成了这些遗址。这些发现与塞玛-图尔宾墓地其他文化物品的异质性相一致,例如陶器(类似于西西伯利亚狩猎采集者和塔塔尔卡山周围克拉斯诺亚尔斯克-坎斯克森林草原地区居民制作的陶器);燧石、骨头或玉器制品(类似于远东北西伯利亚和贝加尔湖地区的文化);以及来自非塞玛-图尔宾传统的金属物品(来自辛塔什塔和阿巴舍沃文化)。这三种物质文化来源与塞玛-图尔宾遗址的三大主要基因祖源平行,这一点也在同时报告的罗斯托夫卡考古基因学研究中被检测到。最后,塞玛-图尔宾遗址中来自广阔距离范围内(从贝加尔湖西侧一直到远至波罗的海)多个狩猎采集人群的祖源凸显了青铜时代金属交换网络的变革性社会影响,以及狩猎采集人群中日益累积但常被忽视的社会政治和经济活力证据。

我们发现雅库特晚期新石器-青铜时代(Yakutia_LNBA)祖源首先随着塞玛-图尔宾现象向西分散,几乎到达欧洲,这一发现具有考古学和语言学意义。在纳夫特普罗沃德-2(Nefteprovod-2)遗址发现的Kra001个体大约生活在4.2千年前,时间上接近并略早于塔塔尔卡山(Tatarka Hill)个体,表明雅库特晚期新石器-青铜时代祖源在4.2千年前已渗透到克拉斯诺亚尔斯克-坎斯克森林草原,并在那里持续存在,之后又对更西部的塞玛-图尔宾墓地产生了影响。纳夫特普罗沃德-2和塔塔尔卡山遗址共享相似的埋葬仪式——这表明将雅库特晚期新石器-青铜时代祖源带到克拉斯诺亚尔斯克-坎斯克森林草原并影响塞玛-图尔宾墓地的基因人群在文化上也是有凝聚力的(我们称之为安热夫斯基复合体;补充信息第3节)。塞玛-图尔宾墓地与最终源自东北西伯利亚的群体之间基因联系的另一个物质对应物可以在由骨板制成的盔甲套装中找到,这些盔甲已在格拉兹科沃文化尤其是伊密亚赫塔赫文化中被发现。其中一套盔甲与一名雅库特晚期新石器-青铜时代男性(来自科尔迪根遗址的N4a1.SG)一同埋葬,其他盔甲则来自纳夫特普罗沃德-2和塔塔尔卡山周围的克拉斯诺亚尔斯克-坎斯克森林草原(补充信息第3节)。在罗斯托夫卡发现了三套盔甲,其中一套与一名男性(来自33号墓的I32816;补充信息第3节)相关,该男性同时具有雅库特晚期新石器-青铜时代和贝加尔湖西侧晚期新石器-青铜时代的祖源。

语言学家已记录了数百个印度-伊朗语系借词,这些借词被现代乌拉尔语系语言从原始乌拉尔语言社区或从其分化后不久的早期乌拉尔语言社区继承下来54,55。印度-伊朗语系的扩张与从跨乌拉尔地区的辛塔什塔人群向中亚和西亚其他地区传播的草原中晚期青铜时代(Steppe_MLBA)祖源有关(这种祖源在历史上有记载的伊朗语系使用者中持续存在33,34,35,56,57,58),并进一步传播到南亚30。我们从罗斯托夫卡和萨特加-16遗址的发现,显示了草原中晚期青铜时代人群(从考古学角度看,这很可能是阿巴舍沃文化1,41,43,59)与雅库特晚期新石器-青铜时代人群之间的接触和混合,这为语言交流可能首次开始提供了一个有吸引力的背景,并为乌拉尔语系群体在塞玛-图尔宾遗址的存在提供了另一条证据,与之前的建议一致55,59。

乌拉尔语系,分布从西西伯利亚到中欧,在地理上与东部草原和远东北西伯利亚的语言相分离,但语言学家一方面发现了与尤卡吉尔语和爱斯基摩-阿留申语之间古老联系的痕迹,另一方面发现与"阿尔泰"语言区(蒙古语、通古斯语和突厥语)存在高度类型学相似性(补充信息,第14节)。为了解决这一难题,一些语言学家提出了一个最近的东部起源的人口假说,这一人口后来促成了乌拉尔语系使用者的扩张(例如,"前原始乌拉尔语在更东部地区使用……可能在靠近蒙古和叶尼塞河与勒拿河分水岭的某处,可能晚至公元前3000年"60)——这一场景与我们的研究结果相符。未来对该地区的古DNA采样将有助于更精确地确定原始乌拉尔语使用社区的考古学身份,并阐明它与西西伯利亚青铜时代更广泛社会世界之间的关系。

来自作者本人的讲述:

塞伊玛 是世界上第一次出现了”标准化”的文化产物,在不同文化,不同地域出现了同一种制式的青铜, 然而,使用传播它的人群的血统确是非常复杂的

文化、认知与共同演化实验室

这些相同的古代古西伯利亚人后来为北美的"第二波"移民做出了贡献,因为纳-德内和古爱斯基摩群体继承了这种特殊的祖源。

Read more

三台机器部署 ClickHouse 高可用集群实战记录

本文是一份可发布版部署记录。真实 IP、域名、账号、密码、下载链接、业务目录名、机器唯一标识等敏感信息已经替换为占位符。命令中的 <...> 需要按自己的环境替换。 目标与拓扑 这次目标是用三台数据节点部署一套 ClickHouse 高可用集群,拓扑采用: 1 shard x 3 replicas 含义是:集群只有一个逻辑分片,三台机器都保存同一份数据的完整副本。任意一台数据节点宕机时,只要 ClickHouse Keeper 仍然有多数派,剩余节点仍可继续提供读写服务。 规划节点如下: 主机名示例地址角色ch-01<ch-01-ip>ClickHouse Server + ClickHouse Keeperch-02<ch-02-ip>ClickHouse Server + ClickHouse Keeperch-03<ch-03-ip&

By ladydd

折腾记(二):接入火山引擎实时语音 API,家庭语音助手体验直接拉满

接上篇 上一篇用全开源组件(Whisper + Hermes + Edge-TTS)搭了个语音助手,能跑,但体验就是"能用"二字: * 中文识别只有 70 分,方言基本歇菜 * 英文唤醒词"Alexa"喊着别扭 * 说完到回复要等 4-8 秒 * 它说话的时候你插不了嘴 这些问题靠堆开源组件很难根治。于是我去试了火山引擎(字节跳动)的语音服务,结果直接换了条路。 这篇分两段:先讲怎么用火山引擎的 ASR/TTS 替换掉开源组件(小改),再讲怎么上端到端实时语音模型(大改)。 第一段:先把 ASR 和 TTS 换成火山引擎 为什么换 我用豆包输入法的时候发现它语音识别准得离谱。一查,豆包用的就是字节自家的火山引擎 Seed-ASR。开通后有免费额度(

By ladydd

折腾记(一):用全开源组件给家里搭一个语音助手,对接自己的 Hermes Agent

起因 事情是从一块 ESP32-S3 开发板开始的。 我手上有一块 Seeed Studio XIAO ESP32-S3 Sense,带摄像头和麦克风。最初的想法很美好:用这块板子做一个无线语音终端,对着它说话,连到我服务器上跑的 Hermes Agent(一个自托管的 AI agent),让它回答我。 但折腾到一半我突然意识到一件事:我的麦克风、音响、服务器全在家里,为什么要绕一圈用 ESP32?直接把麦克风和音响插到服务器上不就行了? ESP32 那条路(做无线拾音终端)当然也有价值,但那是"为了学嵌入式而学",不是解决问题的最短路径。于是这个项目就从"嵌入式项目"变成了"在服务器上拼一个语音助手"。这篇就记录后者。 教训零:先想清楚你要解决的是什么问题。很多时候最优解比你最初设想的简单得多。 目标

By ladydd

Kiro 的三种代理设置方法:本地、服务端、Remote

作为kiro的骨灰级用户,这篇是我自己折腾 Kiro / Kiro Remote / Ubuntu Server 代理问题后的复盘。 核心不是“怎么配一个代理”,而是先判断:到底是谁在访问外网? 谁访问外网,代理就要配给谁。 0. 先说结论 Kiro 相关代理大概分三类: 场景真正访问外网的进程在哪里代理应该配在哪里本地 KiroWindows / Mac 本机本机 Clash / Proxifier / 系统代理服务端 Kiro / CLIUbuntu Server 上的 shell、CLI、node、kiro 进程Ubuntu 的环境变量,比如 HTTP_PROXY / HTTPS_PROXYKiro Remote远程 Ubuntu 上的 ~/.kiro-server 和 extensionHost远程 Ubuntu 的 Kiro Server

By ladydd
陕公网安备61011302002223号 | 陕ICP备2025083092号