波哥大高原6000年的基因组横断面揭示了哥伦比亚人口历史中的多次基因变迁
1 **摘要:**关于美洲原住民人群的基因研究已经改变了我们对美洲人口历史的理解。然而,哥伦比亚这个南美洲的入口地区至今尚未通过古基因组学进行研究。在此,我们报告了哥伦比亚波哥大高原6000年至500年前21个个体的全基因组数据。我们揭示了前陶器时期的狩猎采集者代表了一个此前未知的基础谱系,该谱系源自最初的南美洲辐射。这些狩猎采集者与古代北美群体没有差异性亲缘关系,也没有对古代或现代南美洲人群有基因贡献。到2000年前,当地的基因祖先被来自中美洲的与Herrera陶器复合体相关的人群所取代,并且尽管经历了重大的文化变迁,这种基因祖先一直延续到穆伊斯卡时期。这些古代高原个体与巴拿马地峡的奇布查语
1
**摘要:**关于美洲原住民人群的基因研究已经改变了我们对美洲人口历史的理解。然而,哥伦比亚这个南美洲的入口地区至今尚未通过古基因组学进行研究。在此,我们报告了哥伦比亚波哥大高原6000年至500年前21个个体的全基因组数据。我们揭示了前陶器时期的狩猎采集者代表了一个此前未知的基础谱系,该谱系源自最初的南美洲辐射。这些狩猎采集者与古代北美群体没有差异性亲缘关系,也没有对古代或现代南美洲人群有基因贡献。到2000年前,当地的基因祖先被来自中美洲的与Herrera陶器复合体相关的人群所取代,并且尽管经历了重大的文化变迁,这种基因祖先一直延续到穆伊斯卡时期。这些古代高原个体与巴拿马地峡的奇布查语系人群相比,与哥伦比亚原住民的亲缘关系更近,这表明奇布查相关的祖先成分在随后的人口扩散事件中被稀释。
引言
关于古代和现代原住民人群的基因研究极大地促进了我们对美洲定居历史的理解。这些研究揭示,非北极地区美洲原住民的祖先人群源自古代东亚和西伯利亚群体在2万年前在东北亚某地的基因混合。
大约在1.6万年前,这支人群抵达北美洲后,其基因谱系分化为两支:北美原住民支系和南美原住民支系。北美原住民的基因成分主要局限于北美洲的古代和现代人群中,而南美原住民支系则向南扩张,构成了古代和现代南美洲原住民的主要基因来源。
南美原住民的基因成分在北美洲分化出至少三个亚支系:一支与蒙大拿州克洛维斯文化的Anzick-1个体有关,一支见于加利福尼亚海峡群岛的古代个体中,最后一支则是现代中美洲和南美洲人群的主要基因来源。这三个亚支系都为古代南美洲人群的基因库提供了一波基因贡献。
伊斯莫-哥伦比亚地区(从洪都拉斯海岸延伸到哥伦比亚北部安第斯山脉)对理解美洲的人口历史至关重要。除了是连接北美和南美的陆桥外,它还处于中美洲、亚马逊和安第斯三大文化区域的中心位置。在欧洲人接触时期,该地区居住着复杂的人群,主要是奇布查语系、乔科语系、加勒比语系和阿拉瓦克语系的使用者。
在这些人群中,奇布查语系使用者在人口数量、文化多样性和领土分布方面最为广泛。奇布查语系是一个包含多个高度独特分支的语系,其中许多分支至今仍在伊斯莫-哥伦比亚地区的不同地区使用。关于原始奇布查语的发源地和年代仍存在争议。该语系内部在词汇和语法方面的高度变异表明,这个语系历史悠久,并在数千年前就开始分化。
波哥大高原是伊斯莫-哥伦比亚地区最南端的区域。这个位于哥伦比亚东科迪勒拉山脉、平均海拔2600米的高原,从晚更新世开始就有古代狩猎采集群体居住。在前陶器时期的早期和中期(约11500至4000年前),高原上的人群经历了多次文化转型,最显著的是定居程度的增加,以及从狩猎采集生存方式向园艺实践和森林管理的过渡。

单亲遗传标记和人群结构
基因性别鉴定显示我们的数据集中有10名女性和11名男性,所有男性都属于Y染色体单倍群Q1b1a及其亚支系(表S1)。这是美洲原住民中占主导地位的父系单倍群,我们的数据证实了这一单倍群在古代哥伦比亚中的高频率(表S1)。在现代哥伦比亚原住民中,最普遍的线粒体DNA单倍群是A2、B2和C1,而D1和D4h3a则相对少见。这一总体趋势在我们的古代样本集中得到了证实,其中B2d单倍群频率最高,其次是A2和C1,而只有一个个体携带D1单倍群。A2单倍群在Colombia_Checua_6000BP组中的比例最高,这与之前对同一遗址较早个体的研究结果一致。
我们估算了所有个体之间的遗传亲缘关系,以及通过同源性遗传(IBD)状态和纯合区(ROH)来评估远亲关系和近亲繁殖水平。前者描述了个体之间密切的家族关系(最远至三级亲属),而IBD和ROH则提供了有关共同祖先、血亲和有效种群大小的信息。我们在Colombia_Checua_6000BP组的个体中发现了四对二级和三级亲属关系。在这个遗址测序的七个个体中有五个是男性,有亲属关系的个体共享相同的Y染色体单倍群但不共享线粒体DNA单倍群。Colombia_LagunadelaHerrera_2000BP的分析个体之间的亲缘关系较少,只有一对父子关系(FORM006和FORM004)和另一对二级亲属关系(FORM004和FORM008)。此外,我们没有发现经常性近亲通婚的证据,男性个体之间很少共享长IBD片段。所有个体都存在超过4厘摩根的ROH,在Colombia_Checua_6000BP组中最为普遍。ROH的分布表明,Colombia_Checua_6000BP的有效种群规模比后期古代哥伦比亚群体小三到八倍。这符合考古学对高原上狩猎采集社群规模较小,随后在Herrera和穆伊斯卡时期人口急剧增长的描述。
在随后的人群遗传分析中,我们在剔除一级和二级亲属并确认没有遗传异常值后,根据个体的年代和考古遗址将其分组。最后,我们将这些数据与美洲现有的古代和现代个体数据进行了整合(详见材料与方法)。
前陶器时期的狩猎采集者源自一个此前未知的基础谱系
为了确定高原狩猎采集者源自南美原住民祖先的哪一个特定分支,我们使用了一系列f4统计。考虑到Chile_LosRieles_12000BP在南美最大化了Anzick-1祖先成分,Peru_Cuncaicha_4200BP是具有最高加利福尼亚海峡群岛祖先成分的个体之一,而Peru_Lauricocha_8600BP则不具有这两种祖先成分,我们据此设计了这些分析。我们发现Colombia_Checua_6000BP与Anzick-1的遗传亲缘关系并不比Peru_Lauricocha_8600BP更近,而Chile_LosRieles_12000BP与Anzick-1的关系比Colombia_Checua_6000BP更近,这表明高原分析的狩猎采集者中没有显著的Anzick-1相关祖先成分。类似地,f4统计显示Colombia_Checua_6000BP与古代加利福尼亚海峡群岛个体也没有特殊的亲缘关系。

我们的综合研究结果表明,Colombia_Checua_6000BP既不属于与Anzick-1相关的扩张,也不属于加利福尼亚海峡群岛相关的南美洲扩张,而是源自代表南美洲人主要祖先来源的谱系。这一谱系从至少9000年前开始,在南美洲多个地区一直延续到现代个体中,表现出长期的基因连续性。因此,我们通过f3外群统计(形式为f3(Mbuti, 现代/古代原住民美洲人; Colombia_Checua_6000BP))来检验Colombia_Checua_6000BP是否与南美洲的任何古代和现代人群显示出差异性亲缘关系。这一分析显示,Colombia_Checua_6000BP与中美洲和南美洲人群共享的基因漂变比与北美洲人群更高,但与任何中美洲和南美洲人群都没有特定的等位基因共享,这与Colombia_Checua_6000BP源自一个深度分化的南美洲谱系的假设相符。
我们通过一系列f4统计(形式为f4(Mbuti, Colombia_Checua_6000BP; 现代/古代原住民美洲人, 现代/古代原住民美洲人))正式研究了这一假设,检验了这个古代狩猎采集群体与数据集中可用的古代或现代原住民美洲个体之间可能存在的不同亲缘关系。如f3外群统计所观察到的,只有在将中美洲和南美洲个体与北美洲人进行比较时才观察到显著的亲缘关系。相反,在古代和现代中美洲和南美洲人群之间的比较中,f4统计值与零相一致。
这些结果综合表明,Colombia_Checua_6000BP可能是几乎所有南美洲原住民的外群。为了正式检验这一位置,我们建立了一个反映美洲定居历史主要人口事件的qpGraph树。当将Colombia_Checua_6000BP放置在混合图的任何可能位置时,只有当这个群体被建模为一个此前未被发现的、直接源自中美洲和南美洲人群初始辐射的谱系时,我们才获得了统计上稳健的拟合结果。
最后,我们分析了高原上2000年前以后的古基因组数据,以研究可能存在的局部基因连续性。通过f4统计,我们不仅能够证明Colombia_Checua_6000BP与高原上随后的所有古代群体距离相等[f4(Mbuti, Colombia_Checua_6000BP; 古代哥伦比亚1, 古代哥伦比亚2) = 0],而且这个群体与随后的古代哥伦比亚人的亲缘关系并不比与我们数据集中的任何其他南美洲人群更近[f4(Mbuti, Colombia_Checua_6000BP; 古代哥伦比亚, 现代/古代原住民美洲人) = 0]。总的来说,所进行的分析为6000年至2000年前高原上发生的重大基因替代提供了有力证据。
2000年前高原地区的基因替代
为了概览高原上所有测序的古代个体的基因构成,并与该地区其他古代人群和现代原住民美洲人进行比较,我们对那些要么没有非原住民祖先成分要么已将其屏蔽的个体进行了无监督ADMIXTURE分析(图3A和图S11)。分析结果证实,Colombia_Checua_6000BP的基因谱与之后所有的古代哥伦比亚人有显著差异。相反,2000年至500年前的高原个体则表现出高度相似的基因构成。除了在Colombia_Checua_6000BP中也能看到的祖先成分外,这些年代较晚的个体还携带了大量在1400至600年前的巴拿马古代个体中发现的祖先成分。在约2400年前的委内瑞拉陶器时期个体中也观察到了类似的祖先谱,尽管遗址内部变异性较大。

为了评估公元前2000年至500年间的高原个体是否显示出随时间推移的基因连续性,我们基于f统计进行了一系列分析。首先,我们计算了一个包含代表性中美洲和南美洲祖先的古代群体的f3外群热图。这一分析显示,Herrera和穆伊斯卡时期的古代高原个体形成了一个具有高度基因亲缘关系的聚类(图3B)。这一点得到了f4统计和qpWave分析的进一步支持(表S4, A至G和S5, A至J),为波哥大高原的Colombia_LagunadelaHerrera_2000BP、LasDelicias_1200BP和Soacha_520BP个体携带共同基因祖先提供了更多证据。此外,Los Curos地区的Colombia_Purnia_530BP群体与我们在波哥大高原2000年前后的古基因组时间横断面高度相似,证实了两个地区之间先前观察到的基因联系。总的来说,这些发现揭示了高原地区至少持续了1500年的大规模基因连续性,尽管Herrera和穆伊斯卡时期之间发生了重大文化变迁。
随后,我们尝试描述至少在2000年前抵达高原的基因祖先的来源。我们首先基于f3统计构建了一个多维尺度(MDS)图,包括迄今为止在中美洲和南美洲发现的主要基因变异轴的代表性人群(图3C)。由于之前显示的高度基因亲缘关系,在这一分析中,我们将所有2000年前后的古代哥伦比亚个体合并为一个称为Altiplano_2000-500BP的单一群体。在MDS图中,我们识别出三个基因聚类,分别由安第斯、南锥体和陶器时代加勒比地区的古代个体代表。Colombia_Checua_6000BP位于MDS图的中心位置,而Altiplano_2000-500BP群体则接近于巴拿马西班牙殖民前的个体和委内瑞拉的陶器相关个体,这与ADMIXTURE分析结果一致。将古代哥伦比亚人与古代美洲原住民基因组进行直接比较的f4统计证实,2000年前后的古代哥伦比亚人和陶器相关的委内瑞拉人与古代巴拿马人有显著的亲缘关系。
为了研究古代哥伦比亚人、委内瑞拉人和巴拿马人之间的基因关系,我们构建了两个主成分分析(PCA),聚焦于中部和北部南美洲人的基因多样性,并将古代数据投射其上。我们的发现表明,古代哥伦比亚人和委内瑞拉人都处于古代巴拿马人和中美洲及南美洲其他先前检测到的祖先之间的中间位置。值得注意的是,来自委内瑞拉单一遗址的陶器相关个体在PCA空间中的分布比来自哥伦比亚四个遗址的2000年前后的古代个体更分散。
我们通过进行TreeMix分析进一步探索了古代中美洲和北部南美洲基因组之间的分支和混合模式。由于先前显示的委内瑞拉陶器相关个体的异质性,我们使用f4统计来检验特定个体与其他古代美洲原住民人群的差异性亲缘关系。这些检验显示,Venezuela_LasLocas_Ceramic_2(三个个体)与古代巴拿马的亲缘关系显著高于Venezuela_LasLocas_Ceramic_1(五个个体)。通过TreeMix,我们发现一个一致的模式:Venezuela_LasLocas_Ceramic_2总是比任何2000年前后的古代哥伦比亚群体更接近古代巴拿马,而任何2000年前后的古代哥伦比亚群体总是比Venezuela_LasLocas_Ceramic_1更接近古代巴拿马。古代哥伦比亚群体从未与任何古代委内瑞拉群体形成一个排除古代巴拿马的分支。时间采样的稀疏性使我们无法估计巴拿马相关的祖先是否在相似的时间到达哥伦比亚和委内瑞拉,但我们的结果表明,这两个邻国的陶器相关个体经历了不同的人口学过程。
随后,我们通过f4统计检验了古代哥伦比亚人和委内瑞拉人是否处于巴拿马相关祖先和另一个来源之间的混合斜率上。尽管PCA和ADMIXTURE的结果与这种混合斜率的存在一致,但在考虑到鸟枪测序和靶向富集等不同测序协议引入的偏差后,f4统计没有显示任何显著统计结果。一种可能性是我们的比较数据集缺乏一个适当的代理群体来代表与巴拿马相关祖先混合并产生2000年前后古代哥伦比亚人群的源群体。另一种可能性是,传入的巴拿马相关祖先在向高原扩张过程中没有与其他基因来源混合。在这种情况下,古代巴拿马人一方与古代哥伦比亚人和委内瑞拉人另一方之间的基因差异可能是由于这些谱系中一个或多个分支后基因漂移的过程造成的。
与现代美洲原住民的基因亲缘关系
先前的研究揭示,前西班牙时期的巴拿马个体与奇布查语系使用者(特别是来自哥斯达黎加和巴拿马的人群)之间存在高度的基因相似性。我们首先通过f4(姆布蒂人、现代地峡人;古代巴拿马人、古代哥伦比亚人) < 0来研究古代巴拿马人和古代哥伦比亚人是否与中美洲现代奇布查语系使用者有同等的亲缘关系。正如预期的那样,我们发现巴拿马与哥斯达黎加之间的等位基因共享程度随时间推移要高于巴拿马与哥伦比亚之间的共享程度。这一结果与ADMIXTURE分析中观察到的模式一致,即与古代哥伦比亚人相比,古代巴拿马人具有更高比例的在现代奇布查语系使用者中达到最大值的祖先成分。
随后,我们使用未混血的个体或已屏蔽了近期非美洲原住民祖先混血的个体,测试了古代巴拿马人和古代哥伦比亚人与地峡现代人群之间的联系。f3外群统计f3(姆布蒂人、古代哥伦比亚人;现代美洲原住民)显示,2000年前以来的古代哥伦比亚群体与中美洲奇布查语系人群具有最高的亲缘关系。与哥伦比亚的美洲原住民人群(其中一些也使用奇布查语系)相比,这些古代群体与地峡现代人群表现出更高水平的基因漂移共享。
我们通过两组f4统计验证了这一模式。通过f4(姆布蒂人、现代美洲原住民;古代哥伦比亚1、古代哥伦比亚2) = 0,我们证明没有证据表明任一哥伦比亚群体与地峡内外的现代人群存在差异性亲缘关系,这证实了高原地区从至少2000年前直到殖民时期的基因构成具有同质性。相反,f4(姆布蒂人、古代哥伦比亚人;现代美洲原住民、现代中美洲南部人) > 0表明,来自中美洲的奇布查语系使用者(如Cabécar人)与2000年前以来的古代哥伦比亚人的亲缘关系显著高于我们数据集中的任何其他现代人群。

这一发现在比较地峡的奇布查相关人群与哥伦比亚北部群体时依然成立(图4B和表S7H)。然而,现代哥伦比亚群体与2000年前后的古代哥伦比亚人的亲缘关系并不都相同。具体来说,来自哥伦比亚北部和西部的原住民人群与古代哥伦比亚人的亲缘关系要高于其他哥伦比亚地区的原住民人群,这一点通过f4(姆布蒂人、古代哥伦比亚人;现代哥伦比亚1、现代哥伦比亚2)得到证实(表S7D)。虽然这些北部和西部哥伦比亚人群中有些确实使用奇布查语系(如科吉人和阿鲁瓦科人),但其他人群则不然(如恩贝拉人、瓦乌纳纳人和瓦尤人),他们与2000年前后古代哥伦比亚人的共同基因亲缘关系可能是由于与奇布查语系使用者在地理位置上的接近,这一点已在先前的现代基因型数据研究中得到证实。
这些基因联系可以归因于伊斯莫-哥伦比亚地区广泛的文化交流,例如在金饰和铜金合金装饰品中出现的一些重复图案的分布就证实了这一点。此外,考古证据表明,在前哥伦布时期,奇布查语系使用者在哥伦比亚占据了更广泛的地理区域,包括考卡山谷和锡努地区的部分地区,在这些地区与乔科语系使用者发生了长期的互动。
讨论
在这项研究中,我们从阿尔蒂普拉诺(Altiplano)地区21个个体获得了跨越近6000年的全基因组数据,这代表了伊斯莫-哥伦比亚地区的南部边缘。我们的发现有助于更好地理解这一地区的人口历史,这是南美洲人口迁徙过程中的关键区域。我们发现,大约6000年前的高原狩猎采集人群缺乏与克洛维斯相关的Anzick-1基因组和古代加利福尼亚海峡群岛个体相关的基因祖先,这表明他们属于南美洲原住民支系,该支系在9000年前成为南美洲人的主要祖先来源。
然而,与来自安第斯山脉和南锥体地区的古代基因组不同,这些来自哥伦比亚的前陶器时期个体与迄今研究的中美洲和南美洲任何古代或现代人群都没有明显的亲缘关系。因此,Colombia_Checua_6000BP可以被视为一个此前未知的独特谱系,该谱系源自南美洲初期定居时期产生的多个人群的辐射事件。
前陶器时期和Herrera时期之间的文化转变与当地基因构成的完全替代相关。这挑战了之前基于形态测量研究和古代线粒体DNA时间横断面提出的本地狩猎采集者原地发展的模型。相反,我们的研究表明,在6000年前至2000年前之间,高原地区发生了重大的基因更替。由于这一替代事件的机制和确切时间尺度仍不确定,我们无法直接将其与约3800年前玉米种植的出现联系起来。然而,我们的数据支持考古学假说,即与Herrera陶器复合体相关的陶器引入是通过人口扩散实现的。
我们的结果表明,高原地区新来的基因祖先与中美洲说奇布查语系的古代和现代人群有关。最简单的解释是奇布查相关的人群从中美洲南部向南美洲迁移,而不是向地峡方向的反向迁移。另一项研究发现,在5600年前,奇布查相关的祖先从中美洲南部向伯利兹的玛雅地区进行了一次此前未知的由南向北的扩张。
从考古学角度来看,奇布查相关的祖先首次在2000年前与Herrera陶器相关的个体中被识别。此外,此前测序的委内瑞拉陶器时期个体(约2400年前)也显示出与说奇布查语系的中美洲人群有高度亲缘关系。尽管基因祖先模式和时间框架相似,但这两个人群似乎并不构成简单的姐妹群体。这可能与语言学证据一致,后者表明奇布查语系向南美洲有多次不同的扩张,但需要进一步研究来阐明这个问题。
在奇布查相关祖先的到来彻底重塑该地区的基因版图之后,我们发现当地人群的基因构成在1500多年的时间里(从至少2000年前到500年前)保持了连续性。这种基因祖先的稳定性贯穿了Herrera时期末期和穆伊斯卡时期初期。这表明说奇布查语系的人群在穆伊斯卡文化特征出现之前就已经定居在高原地区,并且这种文化转变是在没有来自具有不同基因祖先构成地区的实质性迁移的情况下发生的。
虽然本研究极大地丰富了我们对伊斯莫-哥伦比亚地区复杂人口历史的理解,但我们强调三个主要局限性:首先,本研究报告了古代美洲原住民人群的全基因组捕获数据,但1240K SNP捕获面板中的绝大多数变异在美洲原住民人群中是固定的。其次,在高原地区需要更密集的基因组时间横断面数据,以缩小奇布查相关祖先到达的时间范围。第三,由于这是一项区域性研究,重要的是要评估所描述的人口转变是否也影响了高原以外的其他地区。来自尚未通过古基因组学分析的北安第斯邻近地区的古基因组数据,如哥伦比亚西部、委内瑞拉西部和厄瓜多尔,将对更好地确定人类向南美洲迁移的时间和祖先来源起到关键作用。
陕公网安备61011302002223号