卫少东博客

把 Codex CLI 的登录态"搬"到一台新服务器

场景:你在一台老机器上早就登录好了 Codex CLI,现在开了台新服务器、装好了 codex,但它没登录。你不想在新机上重新走一遍 OAuth 网页授权(有时候服务器上根本打不开浏览器),只想把老机器上那份"已经登录好的身份"复制过去。这篇讲的就是这个搬运动作的完整方法论——为什么能搬、怎么搬、有哪些坑。命令里所有隐私都用占位符,照着换成你自己的即可。一、先理解一件事:Codex 的登录就是一个文件这是整个操作的地基。Codex CLI(ChatGPT OAuth 登录模式下)的登录状态,不在什么系统钥匙串里,也不在环境变量里,就是家目录下一个单独的 JSON 文件: ~/.codex/auth.json 它长这样(字段名是真的,值我打码了): { "auth_mode": "

哨兵机制:让 Agent 一触即醒

0. 一句话点破本质 **让"等"发生在便宜的子进程里,让贵的 agent 只在有事时醒。**心跳解决"最迟多久必有人查岗",探针解决"事情一发生几乎立刻有人到场"——两个机制回答的是两个不同的问题,谁也替代不了谁。 1. 机制全貌:会自杀的轮询进程 + 宿主的"尸体通知" 我的实现只有两块积木: 积木一:一个有明确死法的后台循环 # 放行任务的同时,后台挂上(run_in_background) for i in $(seq 1 20); do 信号=$(ssh data "tmux capture-pane -t dna

Agent 心跳机制·设计与实现

0. 一句话点破本质 **心跳不是闹钟,是"带着完整世界快照的自我唤醒"。**闹钟只解决"什么时候醒";心跳真正要解决的是你点出的那个问题——醒来的那个瞬间,清楚自己是谁、任务到哪了、这一跳该干什么。我所有跑得好的心跳,提示词都写得像给一个失忆的陌生人看的;所有出过事的心跳,都是因为假设"我还记得"。 1. 第一性原理:为什么"醒来知道干啥"这么难一个长期任务里的 agent 面临三重失忆: 1. 上下文会被压缩——多轮之后早期细节只剩摘要,心跳打进来时,那条心跳提示词可能是上下文里唯一高保真的任务描述 2. 世界在你睡着时变了——下属可能干完了、卡死了、跑偏了,你脑子里的"进度"从睡着那刻就开始过期 3. 任务本身会变—

我没手动映射 3000，公网为什么还能访问？一次 UPnP 误开孔复盘

写在前面：标题里的“自己打开”只是当时的主观感受。路由器没有失控，也不存在神秘穿透。真正发生的是：排障自动化从局域网主动调用了 UPnP AddPortMapping，路由器按协议新增了公网映射。 1. 原本的设计边界家里的 Open WebUI 跑在一台 Ubuntu 主机的 Docker 中：内网主机 192.168.x.x:3000 路由器上手动配置的入口是：公网 TCP 13000 → 内网主机:3000 外部用户不直接访问家宽端口，而是先到云端 Caddy：用户浏览器 → https://ai.example.com （云端 Caddy） → http://home.example.com:13000 （DDNS → 家宽公网

公网一度只剩 18000：透明代理、Docker 与端口映射该怎么分锅

先说结案：“为什么当时只剩 18000”没有找到可以被证据确认的最终根因。故障形态在后续复测时已经消失，现场又缺少故障时刻的路由器配置快照、UPnP 表和双向抓包。本文记录的是已排除什么、还缺什么证据，而不是宣布一个并未证明的答案。 0. 三条结案结论结论一：AI 工具超时的根因已经确认 sing-box 当时是 enabled，但实际状态为 inactive。因此 Codex、grok、agy 等程序直连国外服务并超时。恢复 sing-box 后，三者单轮请求均成功。 sing-box 被停止 → AI/开发工具出站超时这条证据完整，已经结案。结论二：公网 3000 意外开放的根因也已经确认排障自动化误调用了路由器 UPnP AddPortMapping，临时创建了：公网 3000 → 内网 Open WebUI :3000

Mac 上 Skill CLI 无法执行的坑：最后其实一条命令就够了

我在做 Amazon skills 的过程中，逐步把本地 CLI 从 Python 脚本切到 Go 二进制。这样做的好处很明显：用户不用装 Python、不用配依赖，解压 skill 后直接运行。但在 macOS 上，我们反复遇到一个看起来很玄的问题：同一个二进制，在 Linux/Windows 上正常，在 Mac 上就是执行不了。当时遇到的现象常见报错大概有几类： * 双击或 agent 调用 CLI 时，系统提示文件来自未知开发者，无法打开。 * 终端里执行时提示 Permission denied。 * 已经 chmod +x 了，仍然被 macOS 拦截。 * Apple

当我把全世界人群的基因 PCA 跑出来后，看见了一个倒 L 型

最近我把之前学的一些分子人类学知识，终于真正落地了。不是停留在看论文、看别人画图、看别人解释“人群结构”这些概念，而是自己把数据处理完，自己跑 PCA，自己把全世界不同人群放到一张图上。然后那一刻，我真的被击中了。图上出现了一个非常漂亮的倒 L 型。一端是非洲，另一端逐渐拉向东亚，中间有中东、欧洲、南亚、欧亚大陆上的各种过渡人群。它不是那种随机散点图，而是有方向、有骨架、有历史感的结构。我第一眼看到的时候，脑子里直接冒出一句话：这不像是一张普通统计图，这像是人类迁徙史在二维空间里留下的影子。当然，后来我也提醒自己，PCA 不能被过度浪漫化。它不是地图，也不是时间轴，更不是“谁从哪里走到哪里”的直接证据。PCA 本质上是把高维基因差异压缩到几个主成分上，用最大方差方向把样本摊开。它可以帮助我们观察人群结构、相似性、分化和混合，但不能单独承担全部历史解释。PCA 在群体遗传学里常用于观察 population structure

吞吐与延迟:一个厨房比喻讲透性能压测

写于 2026-06-26。背景: MCP 服务跑在 3 台 ClickHouse(每台 16 核 / 64G,1 分片 3 副本)上。我们花了一整轮做公网压测,把这套系统的极限、天花板和杠杆全摸清了。这篇把"吞吐 / 延迟 / 排队"这三个最容易混的概念讲透,配我们自己的真实实测数据。一句话结论我们这套系统的吞吐天花板 ≈ 76 req/s。往里塞再多并发(100、200、300、500),每秒"做完"的还是大约 76 个,多出来的全在排队。系统不会崩,只会让每个人等得更久。天花板能不能抬?

四卡 3090 本地模型部署复盘：Ollama 跑通 35B，以及 GPU0 掉卡问题

这次做的是一轮真实的本地模型部署摸底。目标不是搭一个临时 Demo，而是把一台四卡 3090 GPU 机器接进自己的日常 AI 使用环境：本机跑 Open WebUI，负责账号、会话和前端配置；GPU 机器只负责模型推理。这样以后换模型、换推理框架、重启服务，都尽量不影响本机的使用入口。最后结论比较清楚：qwen3.5:35b 的 GGUF Q4_K_M 量化版已经通过 Ollama 跑通，本机 Open WebUI 可以接入，热加载后的聊天速度也能用；但 GPU0 存在明显稳定性问题，重启后能短暂恢复，跑过负载后又会掉到 NVML 异常状态。状态快照当前能用的部分： * 本机 Open WebUI 已部署，

面向 AI Agent 的 ClickHouse 集群调优实战:从病根定位到"近乎白捡"

我们最近把一套面向 AI agent 的分析型数据服务,从单机迁到了 ClickHouse 集群(1 分片 × 3 副本 + HAProxy 入口),并做了一轮系统的性能调优。这篇不止于"我们改了哪些参数",更想讲清楚背后的思路:怎么用数据定位病根、怎么在"空间/复杂度/收益"之间取舍、怎么做到改完能验证、出事能秒回滚、上线不断服务。如果你也在为高重复、只读、模板化的负载(AI agent、看板、报表 API)调 ClickHouse,这套方法可以直接借鉴。一条主线贯穿全文:先吃透流量特征,再分层优化,每一步都可验证、可回滚。一、起点:先吃透你的流量长什么样任何优化的第一步不是动手,

从密码后台到飞书扫码登录：一次多公司管理员登录改造复盘

这篇文章记录一次用户管理后台的登录改造：我们把原来依赖固定后台口令的登录方式，调整成基于飞书 OAuth 的管理员扫码登录。改造过程中还有一个很现实的问题：两个不同公司的飞书用户不能简单塞进同一个飞书应用里一起登录。最后我们采用了“一个后台入口 + 多个飞书应用 Provider + 各自白名单”的设计。文中的域名、公司名、应用 ID、应用 Secret、Open ID、Token 都做了脱敏。示例只展示结构，不展示真实生产配置。背景用户管理后台负责创建用户、充值、查看流水、配置倍率等操作。这些都是高权限能力，不能再靠一个可传来传去的固定口令保护。我们想要的目标很直接： 1. 管理员用飞书扫码登录。 2. 只有指定的飞书用户能进后台。 3. 登录系统不能影响已有客户 API Key、余额、流水和 MCP 调用。 4. 后续加管理员时，尽量只改白名单，不改代码。 5.

用阿里云 text-embedding-v4 搭一个便宜好用的语义召回层

很多系统一开始都靠关键词匹配。用户搜“车载腰靠”，数据库里有“汽车腰枕”“lumbar support pillow for car”，如果只做 LIKE 或倒排词，召回很容易断掉。Embedding 解决的是这个问题：把文本变成向量，让“意思接近”的内容在向量空间里靠近。阿里云百炼里的 text-embedding-v4 很适合做这件事。它接入简单，兼容 OpenAI 风格接口，价格也低，适合拿来做搜索召回、RAG 知识库、商品词聚类、类目匹配、相似标题推荐。本文只讲一件事：怎么把 text-embedding-v4 接进自己的系统。一句话结论如果你要给文本做语义召回，可以这样设计：业务文本 -> 清洗/去重 -> text-embedding-v4 -&

See all

Latest