大家好,最近看到Hermes和EvoMap那件事,想说点自己的想法,也顺便分享一个自己在做的东西。
先说这个事本身吧。
10步主循环基本一一对应,术语系统性替换,Gene换成Skill,Capsule换成SkillSet。代码表面上看是“重新实现”,但结构和思路对得太齐了,连节奏都差不多。
更离谱的是后面的处理方式,不是解释或者沟通,而是直接反咬一口。这种就不只是“借鉴”了,多少有点难看。
看完其实挺矛盾的。一方面确实不太舒服,另一方面也更清楚一件事:
国内不是没人能做复杂系统,相反,是有人已经做出来了,只是生态和话语权还在慢慢补。
与其一直讨论对错,不如往前走一步,自己把东西做出来。
Cellium Agent就是在这个背景下开始做的。
简单说一下这是什么。
它是一个AI Agent框架,但我不太想用那种“很玄”的描述。
更直接一点,它解决的是:让一个模型不只是“回答问题”,而是能持续决策、执行任务、并根据反馈调整行为。
换句话说,是把“推理”变成一个可以运行的系统。
我在设计的时候,主要关注几件事。
第一,决策不是一次性的,而是循环的。
所以做了一个比较明确的决策环:
特征提取、规则评估、Action选择、执行、反馈、再更新。
关键点不在流程本身,而在“状态感知”。
Agent需要知道自己是不是卡住了,有没有在重复行为,任务有没有在推进。
这些信息会直接影响下一步决策,而不是盲目继续。
第二,策略不应该是写死的。
这里用了一个比较轻量的做法:贝叶斯Bandit + Thompson Sampling。
可以理解成,每种策略都有一个“成功概率”的估计,系统会动态去试、去更新,然后逐渐偏向更有效的路径。
不是那种很重的训练,但确实能让行为越来越稳定。

第三,记忆这块不想依赖外部系统。
所以做了三层结构:人格、会话、长期。
长期记忆这块用了一个比较工程化的方案:
FTS5做全文检索,配一个96维的LSH向量做近似匹配。
优点很直接:
不用向量数据库,纯本地就能跑,而且对中文做了一些适配(比如拼音)。

第四,是架构本身。
核心尽量小,只做调度和连接。
组件全部解耦,通过事件总线通信,配合依赖注入。
这样带来的一个好处是,组件可以独立开发、独立替换,甚至可以热加载,不用每次都重启整个系统。(和我另外一个开源python应用框架一致)
第五,是执行方式。
简单任务就直接走,不额外规划;
复杂任务会自动拆步骤;
如果中间某一步失败,不会全部推倒,而是只针对失败部分重新规划。
这个点在实际跑任务的时候,差别还挺明显的。
说实话,现在很多Agent框架的问题其实挺一致的:
要么特别重,一堆依赖、外部服务;
要么特别轻,只能做demo级别的东西。
我更想做的是一个中间态:
结构清晰、能跑复杂逻辑,同时又不依赖太多外部环境。
项目现在还在早期阶段,很多细节还在打磨。
如果你对Agent、系统架构、或者这种“把模型变成系统”的方向感兴趣,可以看看,也欢迎提点建议。
GitHub:
网页链接
最后简单说一句。
类似Hermes这种事情,其实不会是最后一次。
代码是可以被复制的,结构也可以被模仿,但系统能力和设计积累是很难一起复制走的。

先说这个事本身吧。
10步主循环基本一一对应,术语系统性替换,Gene换成Skill,Capsule换成SkillSet。代码表面上看是“重新实现”,但结构和思路对得太齐了,连节奏都差不多。
更离谱的是后面的处理方式,不是解释或者沟通,而是直接反咬一口。这种就不只是“借鉴”了,多少有点难看。
看完其实挺矛盾的。一方面确实不太舒服,另一方面也更清楚一件事:
国内不是没人能做复杂系统,相反,是有人已经做出来了,只是生态和话语权还在慢慢补。
与其一直讨论对错,不如往前走一步,自己把东西做出来。
Cellium Agent就是在这个背景下开始做的。
简单说一下这是什么。
它是一个AI Agent框架,但我不太想用那种“很玄”的描述。
更直接一点,它解决的是:让一个模型不只是“回答问题”,而是能持续决策、执行任务、并根据反馈调整行为。
换句话说,是把“推理”变成一个可以运行的系统。
我在设计的时候,主要关注几件事。
第一,决策不是一次性的,而是循环的。
所以做了一个比较明确的决策环:
特征提取、规则评估、Action选择、执行、反馈、再更新。
关键点不在流程本身,而在“状态感知”。
Agent需要知道自己是不是卡住了,有没有在重复行为,任务有没有在推进。
这些信息会直接影响下一步决策,而不是盲目继续。
第二,策略不应该是写死的。
这里用了一个比较轻量的做法:贝叶斯Bandit + Thompson Sampling。
可以理解成,每种策略都有一个“成功概率”的估计,系统会动态去试、去更新,然后逐渐偏向更有效的路径。
不是那种很重的训练,但确实能让行为越来越稳定。

第三,记忆这块不想依赖外部系统。
所以做了三层结构:人格、会话、长期。
长期记忆这块用了一个比较工程化的方案:
FTS5做全文检索,配一个96维的LSH向量做近似匹配。
优点很直接:
不用向量数据库,纯本地就能跑,而且对中文做了一些适配(比如拼音)。

第四,是架构本身。
核心尽量小,只做调度和连接。
组件全部解耦,通过事件总线通信,配合依赖注入。
这样带来的一个好处是,组件可以独立开发、独立替换,甚至可以热加载,不用每次都重启整个系统。(和我另外一个开源python应用框架一致)
第五,是执行方式。
简单任务就直接走,不额外规划;
复杂任务会自动拆步骤;
如果中间某一步失败,不会全部推倒,而是只针对失败部分重新规划。
这个点在实际跑任务的时候,差别还挺明显的。
说实话,现在很多Agent框架的问题其实挺一致的:
要么特别重,一堆依赖、外部服务;
要么特别轻,只能做demo级别的东西。
我更想做的是一个中间态:
结构清晰、能跑复杂逻辑,同时又不依赖太多外部环境。
项目现在还在早期阶段,很多细节还在打磨。
如果你对Agent、系统架构、或者这种“把模型变成系统”的方向感兴趣,可以看看,也欢迎提点建议。
GitHub:
网页链接
最后简单说一句。
类似Hermes这种事情,其实不会是最后一次。
代码是可以被复制的,结构也可以被模仿,但系统能力和设计积累是很难一起复制走的。


