OpenCLI 学习 01:项目总览与核心问题
1. 我最开始看到的现象
这个仓库根目录下有很多不同的软件目录,例如:
gimp/blender/libreoffice/drawio/zotero/
所以它不是单一应用,而是一个多软件、多 harness 的总仓库。
2. 项目在做什么
我目前的理解:
CLI-Anything 想把原本主要通过 GUI 使用的软件,整理成 Agent 也能稳定调用的 CLI 接口。
它不是简单做几个命令,而是在做一套标准化的软件能力接入方案。
3. 这里的 CLI 到底是什么意思
我一开始容易把 CLI 理解成“黑框里的自由互动”。
后面逐渐明确:
- 终端/黑框:只是运行环境
- CLI:是能力暴露出来的命令接口
- 脚本:是实现 CLI 的一种方式
所以这里的 CLI 更接近“面向终端的函数调用接口”。
例如:
cli-anything-gimp project new --width 800 --height 600
它不是自由聊天,而是在调用一个被明确组织好的能力。
4. 为什么会让我联想到 REST API
因为两者本质上都在做“能力暴露”:
- REST API:通过 HTTP 暴露能力
- CLI:通过命令行暴露能力
区别在于:
- API 更偏网络服务
- CLI 更偏本地软件、本机工具、桌面应用
这个项目选择 CLI,不是因为 CLI 比 API 更高级,而是因为很多真实软件并没有天然的 REST API,但有脚本接口、命令参数、批处理模式或插件机制。
5. 这个项目真正统一的是什么
不是统一所有软件的功能本身,而是统一:
- 软件能力如何暴露给 Agent
- CLI 应该如何组织
- 文档、测试、打包怎么做
- Skill 怎么告诉 Agent 何时调用、如何调用
所以它更像是在统一一种“接入规范”和“工程方法”。
6. 当前我的一句话理解
CLI-Anything 的核心目标,是把复杂软件或复杂能力系统化地整理成可被 Agent 调用的命令树接口。
7. 当前我的疑问是如何逐步被澄清的
我最初模糊的是:
- CLI 到底是不是黑框互动
- 这个项目到底是在做命令行工具,还是在做更大的东西
- Agent 到底靠什么知道何时调用这些工具
当前得到的阶段性答案:
- CLI 不是黑框互动,而是能力接口
- 这个项目不只是做 CLI,而是在做以 CLI 为形态的 harness
- Agent 主要通过
SKILL.md、命令树、帮助信息、JSON 输出理解和使用这些 harness
陕公网安备61011302002223号