从哈尔滨头骨(>146,000年前)牙结石中提取的丹尼索瓦人线粒体DNA

丹尼索瓦人尚未与人类头骨直接关联,这限制了我们对其形态和地理分布的理解。我们尝试从中国东北哈尔滨发现的一个几乎完整的中更新世头骨(>146,000年前)中提取DNA。虽然无法从牙齿或岩骨中提取DNA,但成功从牙结石中分离出线粒体DNA(mtDNA)。该线粒体DNA属于丹尼索瓦人线粒体DNA变异范围内,并与在南西伯利亚丹尼索瓦洞穴中早期丹尼索瓦人携带的线粒体DNA分支有关。这表明丹尼索瓦人在中更新世时期在亚洲有着广泛的地理分布范围。 丹尼索瓦人线粒体DNA与哈尔滨头骨的关联使我们能够更好地理解丹尼索瓦人与其他东亚中更新世化石之间的形态关系。此外,从牙结石中提取宿主DNA为中更新世人类的基因研究

image.png

亮点

  • 从中更新世人类头骨的牙结石中提取到宿主DNA
  • 哈尔滨线粒体DNA(>146,000年前)与早期丹尼索瓦人线粒体DNA有联系
  • 丹尼索瓦人线粒体DNA与一个几乎完整的人类头骨直接相关

摘要

丹尼索瓦人尚未与人类头骨直接关联,这限制了我们对其形态和地理分布的理解。我们尝试从中国东北哈尔滨发现的一个几乎完整的中更新世头骨(>146,000年前)中提取DNA。虽然无法从牙齿或岩骨中提取DNA,但成功从牙结石中分离出线粒体DNA(mtDNA)。该线粒体DNA属于丹尼索瓦人线粒体DNA变异范围内,并与在南西伯利亚丹尼索瓦洞穴中早期丹尼索瓦人携带的线粒体DNA分支有关。这表明丹尼索瓦人在中更新世时期在亚洲有着广泛的地理分布范围。

丹尼索瓦人线粒体DNA与哈尔滨头骨的关联使我们能够更好地理解丹尼索瓦人与其他东亚中更新世化石之间的形态关系。此外,从牙结石中提取宿主DNA为中更新世人类的基因研究开辟了新的可能性。

引言

在中国已经发现了20多处中更新世(78-300千年前)遗址。随着这些遗址化石的测年和形态学研究的改进,我们对这一时期东亚和东南亚古代人群的认识得到了极大提升。300千年后的东亚中更新世人类群体显示出高度的形态多样性。然而,尽管如此,在旧石器时代或现代亚洲人群中,除了丹尼索瓦人或尼安德特人以外,尚未发现其他古人类的基因贡献。

从北亚和欧洲中更新世遗址中采集的古DNA样本表明,基因证据在阐明中更新世人类与现代人群之间关系方面具有重要作用。通过提取古DNA实现的一个重要发现是在西伯利亚丹尼索瓦洞穴中识别出一个不同于尼安德特人的古人类群体,即丹尼索瓦人。然而,由于迄今为止发现的丹尼索瓦人DNA都来自于形态信息有限的骨骼和牙齿碎片,丹尼索瓦人的形态特征仍然基本未知。此外,在丹尼索瓦人可能曾经生活过的中国境内,尚未发现与形态学直接相关的DNA证据。

丹尼索瓦人与现代人共存,是尼安德特人的姐妹群体,他们与尼安德特人的共同祖先可追溯到约40万年前。通过对化石中的丹尼索瓦人DNA以及现代人基因组中渗入片段的研究表明,至少有两个丹尼索瓦人支系渗入到现代人群中。其中一个支系与丹尼索瓦洞穴的个体关系更为密切。

虽然推测丹尼索瓦人曾在整个亚洲有着广泛的地理分布范围,但迄今为止,在亚洲发现的丹尼索瓦人分子证据仅限于:西伯利亚丹尼索瓦洞穴中的牙齿、骨骼碎片和洞穴沉积物;青藏高原白石崖洞穴中的下颌骨、肋骨和洞穴沉积物;以及台湾澎湖水道发现的下颌骨。此外,在老挝的Tam Ngu Hao 2洞穴中发现的样本,根据形态学分析被认为可能属于丹尼索瓦人。

在本研究中,我们将"丹尼索瓦人"定义为丹尼索瓦洞穴中之前描述的7个个体(丹尼索瓦2号、丹尼索瓦3号、丹尼索瓦4号、丹尼索瓦8号、丹尼索瓦19号、丹尼索瓦20号和丹尼索瓦21号)。我们排除了其他个体及其基因数据,原因包括:与丹尼索瓦洞穴个体的遗传关系较远(如洛斯韦索斯天坑)、与丹尼索瓦洞穴个体的关系不明确(如Tam Ngu Hao 2),或缺乏相关骨骼碎片(如白石崖洞穴沉积物)。

image.png

图1. 哈尔滨头骨及100,000年前以上已提取到人类DNA的古人类化石地理位置

(A) 在中国东北黑龙江省哈尔滨发现的中更新世头骨。(B) 已提取到100,000年前以上人类DNA的一些遗址的地理位置和年代。哈尔滨约146,000年前(本研究采样)、白石崖溶洞约100,000年前(沉积物DNA)、丹尼索瓦洞穴123-217,000年前(东洞室14和15层以及主洞室22.1层的骨骼)、斯克拉迪纳洞穴约120,000年前和霍伦施泰因-施塔德尔洞穴约124,000年前。圆圈表示丹尼索瓦人线粒体DNA或类丹尼索瓦人线粒体DNA;方块表示尼安德特人线粒体DNA。

确认丹尼索瓦人的存在可能会因多种原因而具有挑战性。例如,目前尚不清楚老挝发现的标本是否属于丹尼索瓦人的变异范围,因为蛋白质组学分析尚未产生丹尼索瓦人特有的遗传标记。

此外,我们对丹尼索瓦人形态的认知还很有限。即使有基因材料可用,要将一个标本鉴定为丹尼索瓦人也并非易事。例如,在洛斯韦索斯天坑发现的40万年前个体的线粒体DNA(mtDNA)虽然超出了已知的丹尼索瓦人线粒体多样性范围,但与丹尼索瓦人的线粒体DNA相比更接近于尼安德特人的线粒体DNA,而他们的核DNA却与尼安德特人更为接近。

在中国东北黑龙江省哈尔滨发现了一个显著的中更新世晚期头骨,其年代至少可追溯到146,000年前(图1A)。基于其形态特征,这个头骨被归类为一个新的物种,命名为龙人(Homo longi)。然而,有研究表明其形态与夏河下颌骨相关,而夏河下颌骨通过蛋白质组学分析已被证实与丹尼索瓦人有关。由于年代久远,目前尚未从哈尔滨标本中提取到任何基因信息。事实上,在超过100,000年前的骨骼遗存中,仅从四处遗址成功测序出人类DNA:来自洛斯韦索斯天坑约40万年前的个体;来自德国西南部霍伦施泰因-施塔德尔洞穴和比利时斯克拉迪纳洞穴约12万年前的两个尼安德特人;以及来自丹尼索瓦洞穴年代为187-217,000年前、190,000年前和123-194,000年前的骨骼碎片(图1B)。

结果

古DNA提取和DNA序列测定

我们最初尝试从哈尔滨头骨的牙齿或岩骨中提取DNA但未能成功(见STAR方法和表S1)。随后我们转向牙结石(钙化的牙菌斑),由于其致密的晶体结构能够抵抗各种环境下的降解,可以为DNA保存提供一个受保护的环境。事实上,最近的研究已经从牙结石中成功提取到内源性古DNA(即来自宿主个体和口腔微生物组的DNA),而迄今为止,从旧石器时代的牙结石中仅提取到宿主微生物组和致病微生物的DNA。

为了减少现代DNA的存在,在DNA提取之前对哈尔滨牙结石进行了漂白处理(见STAR方法)。随后,我们从两个牙结石样本(0.5和0.3毫克,图2)中提取DNA,并将提取物的等份转化为单链文库。这两个文库经过现代人线粒体DNA探针富集,分别测序得到142,981和155,085个片段。将长度短于30个碱基对(bp)或比对质量低于25的片段丢弃后,分别得到3,665和2,047个能够比对到人类线粒体基因组的独特片段。这两个文库中DNA片段5'端的C到T替换频率分别为2%和25%。这些替换频率的升高是由于胞嘧啶脱氨基随时间积累所致,因此表明存在古DNA分子。低于5%的C到T频率被认为几乎没有古DNA的证据。因此,我们保留了C到T替换频率较高的文库数据(即0.3毫克样本),从中我们能够获得总覆盖度为6.6倍的人类线粒体DNA,这可能包括古DNA和污染的现代DNA。

为了最大限度地获得可用于分析的线粒体DNA片段,我们从剩余的DNA提取物以及两个样本的硅胶膜和沉淀物中重新提取DNA,制备了额外的文库(见STAR方法)。在制备的总共20个文库中,有8个文库在末端显示超过5%的C到T替换频率(表S1)。随后,我们检查这些序列是否与不同类型人类(现代人、尼安德特人和丹尼索瓦人)的线粒体DNA匹配。在这8个文库中,有7个含有携带丹尼索瓦人特有核苷酸变异的DNA片段,而没有一个文库显示尼安德特人特有的变异(表S1)。这7个文库被用于进一步分析。

image.png

图2. 在哈尔滨头骨牙齿上采集0.3毫克牙结石的位置,从该样本中捕获并测序了线粒体DNA

污染估计

为了富集潜在的内源性DNA,我们选择了在一端相对于现代人参考序列具有C到T替换的片段,并检查这些片段在另一端的C到T替换频率。如果在另一端的替换频率明显高于初始端没有C到T替换的片段,这表明相当大比例的总片段来自现代DNA污染。对于哈尔滨个体,3'端有C到T替换的片段在5'端的C到T替换频率为34%,相对于所有片段的14%(图3A,橙色)。相反,在5'端则为52%,相对于20%(图3A,蓝色,和图S2)。这表明文库中的许多线粒体DNA片段代表来自现代人的污染。此外,C到T替换频率表明内源性DNA主要存在于短于60bp的片段中(C到T% >10%)(图3B和S1)。

使用两种基于脱氨基模式的方法来估计污染水平(见STAR方法),分别得出56%和67%的估计值。我们还发现82%(225/276)覆盖现代人特有位点的片段携带现代人变异。然而,我们注意到15%(95/616)覆盖丹尼索瓦人特有变异位点的片段携带丹尼索瓦人变异,而0%(0/241)在尼安德特人独有位点携带尼安德特人特有变异(表S1)。

DNA序列重建

为了避免使用某一类人科动物的参考序列对鉴定的线粒体DNA片段产生偏差,我们将捕获的DNA片段与一个重建的人类祖先线粒体DNA进行比对。这个祖先序列是基于23个黑猩猩、洛斯韦索斯天坑人、18个尼安德特人、7个丹尼索瓦人和现代人重建的智人参考序列(RSRS)推断得出的(表S2,见STAR方法)。为了探索哈尔滨线粒体DNA与丹尼索瓦人线粒体DNA之间的关系,我们使用7个丹尼索瓦人重建的祖先线粒体DNA参考序列,以最大限度地从哈尔滨牙结石中恢复额外的内源性线粒体DNA片段(表S2,见STAR方法)。

为了富集内源性古DNA片段,我们将分析限制在长度短于60bp且第一个和最后三个末端核苷酸显示胞嘧啶脱氨基证据的片段("脱氨基",表S2)。通过组合来自7个文库的这些线粒体DNA片段(表S1),我们获得了828个与重建的人类祖先线粒体DNA比对的独特片段和855个与重建的丹尼索瓦人祖先线粒体DNA序列比对的独特片段(表S2)。为了进一步减少由胞嘧啶脱氨基引入的错误,我们掩蔽了相对于各自人类祖先或丹尼索瓦人祖先参考序列在正向链上有C→T错配和反向链上有G→A错配的位点。随后,使用两个或更多片段覆盖且至少三分之二碱基一致的位点来确定线粒体DNA基因组的一致序列。这产生了一个覆盖7,817个核苷酸位点的与重建的人类祖先线粒体DNA比对的一致序列,以及覆盖8,234个核苷酸位点的与重建的丹尼索瓦人祖先线粒体DNA比对的一致序列(表S2)。

系统发育重建和丹尼索瓦人线粒体DNA变异

我们接下来使用贝叶斯框架、最大似然法和最大简约法对哈尔滨线粒体DNA一致序列以及洛斯韦索斯天坑人、7个丹尼索瓦人、18个尼安德特人、58个现代人和一个黑猩猩的线粒体DNA进行系统发育树估计。所有三种方法构建的树都显示相同的拓扑结构(图4和S4),其中哈尔滨线粒体DNA位于丹尼索瓦人线粒体DNA分支内。

在丹尼索瓦人分支中,哈尔滨线粒体DNA倾向于与较早期的丹尼索瓦人(丹尼索瓦2号、8号、19号、20号和21号)聚类,而不是与两个较晚期的丹尼索瓦人(丹尼索瓦3号和4号),尽管支持度较低(后验概率33%或43%,自展支持率44%或39%)(图4和S4)。

为了进一步探索哈尔滨线粒体DNA与丹尼索瓦人线粒体DNA之间的关系,我们分析了哈尔滨线粒体DNA中覆盖的6个位点,在这些位点上,5个早期丹尼索瓦人(丹尼索瓦19号、20号、21号、8号和2号)固定携带衍生变异,而2个晚期丹尼索瓦人(丹尼索瓦3号和4号)携带祖先变异(表1)。其中4个位点有2-3个DNA片段覆盖,2个位点仅有单个片段覆盖。在这6个位点中,5个携带早期丹尼索瓦人见到的衍生变异,而1个携带祖先变异(位点16,111,有4个片段覆盖)(表1)。由单个线粒体DNA片段覆盖的两个位点的衍生变异是A和C(表1),因此不可能是由脱氨基引入的。

我们随后分析了哈尔滨线粒体DNA中覆盖的25或24个位点,在这些位点上,两个晚期丹尼索瓦人(丹尼索瓦3号和4号)携带衍生变异,而5个早期丹尼索瓦人具有祖先变异。在哈尔滨线粒体DNA中,所有这些位点都携带祖先变异。因此,有5个位点支持哈尔滨线粒体DNA与早期丹尼索瓦人的线粒体DNA有关,没有位点支持与晚期丹尼索瓦人线粒体DNA的关系,尽管有1个位点表明哈尔滨线粒体DNA可能处于早期丹尼索瓦人线粒体DNA的基部位置。

image.png

图3. 捕获序列中哈尔滨线粒体DNA的胞嘧啶脱氨基特征

(A) 所有序列末端的C到T替换频率(黑色)。橙色线表示选择在5'端携带C到T替换的序列,因此在5'端的C到T替换频率为100%,在3'端为34%。蓝色线表示选择在3'端携带C到T替换的序列,其中在3'端的C到T替换频率为100%,在5'端为52%。

(B) 在每5bp长度区间内序列首末端的C到T替换频率。

相关内容见图S2。

讨论

之前的形态学研究1,2,51将哈尔滨个体归类为一个新物种或智人的新姐妹谱系。然而,我们的研究表明,哈尔滨个体的线粒体DNA属于已测序的丹尼索瓦人线粒体DNA变异范围内,并且可能与丹尼索瓦2号、8号、19号、20号和21号的线粒体DNA的关系比与丹尼索瓦3号和4号更近。

丹尼索瓦19号、20号和21号的年代在187到217千年前13,31,它们是在丹尼索瓦洞穴东室最古老的考古层中发现的。连同丹尼索瓦2号(约123-194千年前)和丹尼索瓦8号(约190千年前),这些较早期丹尼索瓦人的线粒体DNA形成一个分支,不包括较晚期的丹尼索瓦3号(约52-76千年前)和丹尼索瓦4号(约55-84千年前)31。哈尔滨个体的年代(头骨年代:>146千年前;沉积物年代:138-309千年前)2与丹尼索瓦洞穴中较早期的丹尼索瓦人相近,且哈尔滨线粒体DNA倾向于与这些早期个体的线粒体DNA相关联。这表明丹尼索瓦人在中更新世时期在亚洲有着广泛的地理分布范围。

哈尔滨头骨含有丹尼索瓦人线粒体DNA的发现将丹尼索瓦人与形态特征联系起来,这将有助于识别其他丹尼索瓦人化石,特别是在古DNA无法保存或难以获取的情况下。例如,大荔52,53、金牛山52,53和化龙洞3的化石展现出与哈尔滨头骨相似的形态特征1,这使得它们也可能代表丹尼索瓦人群体。

image.png

图4. 使用与丹尼索瓦人共同祖先重建序列比对的哈尔滨线粒体DNA一致序列构建的人类线粒体关系系统发育亚树

树中的三角形折叠了包含18个尼安德特人和58个现代人的分支。该树是在GTR+G模型下使用贝叶斯系统发育方法构建的。树上的数字表示该分支的后验概率。比例尺表示每个位点的替换率。使用黑猩猩基因组(GenBank登录号HM068593.1)作为外群来确定树的根。

相关内容见图S4。

研究局限性

本研究基于从哈尔滨头骨牙结石中提取的有限数量的古人类线粒体DNA。为了增进我们对中更新世古人类遗传关系的理解,需要从东亚和东南亚各地的化石中提取核DNA数据。

尽管如此,研究发现哈尔滨标本的人类DNA在牙结石中的保存状况比在致密骨骼(包括岩骨)中更好,这表明牙结石可能是研究中更新世古人类DNA的一个重要来源。

中国与草原:内蒙古鄂尔多斯地区西沟畔2号墓(公元前4-3世纪)贵金属工艺技术研究

当前的科学分析结果为鄂尔多斯西沟畔出土的金银器物制作工艺提供了新的认识。内蒙古鄂尔多斯地区西沟畔2号墓出土的金饰片在双面雕刻技术的使用上,与甘肃礼县和清水遗址出土的器物具有共同的技术特征。这些地区在公元前8世纪至3世纪期间,秦国成为主导势力并与北方邻居有着广泛的互动。这表明在中国西北地区出现了金器制作的重要本土技术创新,西沟畔的金属制品可能出自秦国工坊。目前对中亚、中国西北边疆和中原地区出土的金器进行的化学分析综合研究表明,在东亚地区公元前一千年左右使用了多个天然金矿来源。

Read more

三台机器部署 ClickHouse 高可用集群实战记录

本文是一份可发布版部署记录。真实 IP、域名、账号、密码、下载链接、业务目录名、机器唯一标识等敏感信息已经替换为占位符。命令中的 <...> 需要按自己的环境替换。 目标与拓扑 这次目标是用三台数据节点部署一套 ClickHouse 高可用集群,拓扑采用: 1 shard x 3 replicas 含义是:集群只有一个逻辑分片,三台机器都保存同一份数据的完整副本。任意一台数据节点宕机时,只要 ClickHouse Keeper 仍然有多数派,剩余节点仍可继续提供读写服务。 规划节点如下: 主机名示例地址角色ch-01<ch-01-ip>ClickHouse Server + ClickHouse Keeperch-02<ch-02-ip>ClickHouse Server + ClickHouse Keeperch-03<ch-03-ip&

By ladydd

折腾记(二):接入火山引擎实时语音 API,家庭语音助手体验直接拉满

接上篇 上一篇用全开源组件(Whisper + Hermes + Edge-TTS)搭了个语音助手,能跑,但体验就是"能用"二字: * 中文识别只有 70 分,方言基本歇菜 * 英文唤醒词"Alexa"喊着别扭 * 说完到回复要等 4-8 秒 * 它说话的时候你插不了嘴 这些问题靠堆开源组件很难根治。于是我去试了火山引擎(字节跳动)的语音服务,结果直接换了条路。 这篇分两段:先讲怎么用火山引擎的 ASR/TTS 替换掉开源组件(小改),再讲怎么上端到端实时语音模型(大改)。 第一段:先把 ASR 和 TTS 换成火山引擎 为什么换 我用豆包输入法的时候发现它语音识别准得离谱。一查,豆包用的就是字节自家的火山引擎 Seed-ASR。开通后有免费额度(

By ladydd

折腾记(一):用全开源组件给家里搭一个语音助手,对接自己的 Hermes Agent

起因 事情是从一块 ESP32-S3 开发板开始的。 我手上有一块 Seeed Studio XIAO ESP32-S3 Sense,带摄像头和麦克风。最初的想法很美好:用这块板子做一个无线语音终端,对着它说话,连到我服务器上跑的 Hermes Agent(一个自托管的 AI agent),让它回答我。 但折腾到一半我突然意识到一件事:我的麦克风、音响、服务器全在家里,为什么要绕一圈用 ESP32?直接把麦克风和音响插到服务器上不就行了? ESP32 那条路(做无线拾音终端)当然也有价值,但那是"为了学嵌入式而学",不是解决问题的最短路径。于是这个项目就从"嵌入式项目"变成了"在服务器上拼一个语音助手"。这篇就记录后者。 教训零:先想清楚你要解决的是什么问题。很多时候最优解比你最初设想的简单得多。 目标

By ladydd

Kiro 的三种代理设置方法:本地、服务端、Remote

作为kiro的骨灰级用户,这篇是我自己折腾 Kiro / Kiro Remote / Ubuntu Server 代理问题后的复盘。 核心不是“怎么配一个代理”,而是先判断:到底是谁在访问外网? 谁访问外网,代理就要配给谁。 0. 先说结论 Kiro 相关代理大概分三类: 场景真正访问外网的进程在哪里代理应该配在哪里本地 KiroWindows / Mac 本机本机 Clash / Proxifier / 系统代理服务端 Kiro / CLIUbuntu Server 上的 shell、CLI、node、kiro 进程Ubuntu 的环境变量,比如 HTTP_PROXY / HTTPS_PROXYKiro Remote远程 Ubuntu 上的 ~/.kiro-server 和 extensionHost远程 Ubuntu 的 Kiro Server

By ladydd
陕公网安备61011302002223号 | 陕ICP备2025083092号