agent

pi-mono 学习 04｜pi-agent-core：为什么 tool calling 不等于 Agent

ladydd

01 Apr 2026 — 3 min read

这篇写什么

只讲一个关键点：为什么“模型会吐 tool call”不等于“系统是 agent”，以及 pi-agent-core 这一层到底补上了什么。

先说结论

pi-agent-core 的本质不是“再包一层模型调用”，而是：把一次模型调用变成一个可以持续推进任务的运行时闭环。

pi-ai 解决：怎么把不同模型统一接起来
pi-agent-core 解决：怎么让模型不只是回答，而是真正持续工作

为什么第一层还不够

如果系统只有模型抽象层，能力更接近：

把上下文发给模型
接收模型返回
把流式输出展示出来

即便模型支持 tool calling，这时也还没有“agent 感”。

因为“模型会吐出 tool call”不等于“系统能把任务做完”。

用户真正感知到的 agent 能力通常是：

它会自己去查信息
它会自己调用工具
它会根据结果继续下一步
它不是一轮问答，而是围绕任务持续推进

这些体验来自 runtime 闭环，而不是来自单次模型调用。

这一层到底解决什么问题

核心问题只有一个：

把模型、工具、上下文和外部反馈组织成一个持续运行的任务循环。

最短链路是：

用户提任务
-> 模型分析任务
-> 模型决定调用工具
-> 系统执行工具
-> 把工具结果回灌给模型
-> 模型继续分析和决策
-> 重复直到完成

只要这条链成立，系统才算 agent。

为什么叫 runtime

因为它更像一个持续运行的小系统（状态机），需要长期维护动态过程：

接收用户输入
发起模型调用
监听模型输出事件
识别工具调用
触发工具执行
接收工具结果
更新上下文状态
再次调用模型
判断是否结束

agent 的核心不是“会说”，而是“会闭环”

闭环意味着：

模型输出不是终点
工具结果也不是终点
每一轮输出都可能成为下一轮输入
系统一直运行，直到达到可停止状态

`pi-ai` 与 `pi-agent-core` 的边界

`pi-ai` 负责

统一模型调用
统一上下文表示
统一工具 schema 输入
统一流式事件输出
统一最终 assistant 消息
统一 usage / cost / stop reason

`pi-agent-core` 负责

决定什么时候调用模型
决定什么时候执行工具
决定工具结果如何进入后续上下文
决定什么时候继续下一轮
决定什么时候停止整个任务
暴露 agent 级事件流

小结

tool calling 是原料，tool loop 才是 agent。

pi-agent-core 的价值就在于：把模型的动作意图工程化成一个可持续推进任务的闭环运行时。

把 Codex CLI 的登录态"搬"到一台新服务器

场景:你在一台老机器上早就登录好了 Codex CLI,现在开了台新服务器、装好了 codex,但它没登录。你不想在新机上重新走一遍 OAuth 网页授权(有时候服务器上根本打不开浏览器),只想把老机器上那份"已经登录好的身份"复制过去。这篇讲的就是这个搬运动作的完整方法论——为什么能搬、怎么搬、有哪些坑。命令里所有隐私都用占位符,照着换成你自己的即可。一、先理解一件事:Codex 的登录就是一个文件这是整个操作的地基。Codex CLI(ChatGPT OAuth 登录模式下)的登录状态,不在什么系统钥匙串里,也不在环境变量里,就是家目录下一个单独的 JSON 文件: ~/.codex/auth.json 它长这样(字段名是真的,值我打码了): { "auth_mode": "

哨兵机制:让 Agent 一触即醒

0. 一句话点破本质 **让"等"发生在便宜的子进程里,让贵的 agent 只在有事时醒。**心跳解决"最迟多久必有人查岗",探针解决"事情一发生几乎立刻有人到场"——两个机制回答的是两个不同的问题,谁也替代不了谁。 1. 机制全貌:会自杀的轮询进程 + 宿主的"尸体通知" 我的实现只有两块积木: 积木一:一个有明确死法的后台循环 # 放行任务的同时,后台挂上(run_in_background) for i in $(seq 1 20); do 信号=$(ssh data "tmux capture-pane -t dna

Agent 心跳机制·设计与实现

0. 一句话点破本质 **心跳不是闹钟,是"带着完整世界快照的自我唤醒"。**闹钟只解决"什么时候醒";心跳真正要解决的是你点出的那个问题——醒来的那个瞬间,清楚自己是谁、任务到哪了、这一跳该干什么。我所有跑得好的心跳,提示词都写得像给一个失忆的陌生人看的;所有出过事的心跳,都是因为假设"我还记得"。 1. 第一性原理:为什么"醒来知道干啥"这么难一个长期任务里的 agent 面临三重失忆: 1. 上下文会被压缩——多轮之后早期细节只剩摘要,心跳打进来时,那条心跳提示词可能是上下文里唯一高保真的任务描述 2. 世界在你睡着时变了——下属可能干完了、卡死了、跑偏了,你脑子里的"进度"从睡着那刻就开始过期 3. 任务本身会变—

我没手动映射 3000，公网为什么还能访问？一次 UPnP 误开孔复盘

写在前面：标题里的“自己打开”只是当时的主观感受。路由器没有失控，也不存在神秘穿透。真正发生的是：排障自动化从局域网主动调用了 UPnP AddPortMapping，路由器按协议新增了公网映射。 1. 原本的设计边界家里的 Open WebUI 跑在一台 Ubuntu 主机的 Docker 中：内网主机 192.168.x.x:3000 路由器上手动配置的入口是：公网 TCP 13000 → 内网主机:3000 外部用户不直接访问家宽端口，而是先到云端 Caddy：用户浏览器 → https://ai.example.com （云端 Caddy） → http://home.example.com:13000 （DDNS → 家宽公网