a2ron

Aaron Tsui's personal website.

我对AI的态度:AI 是一种强力的“认知与工程放大器”

12 January 2026

Coding agent

by Aaron Tsui

今天我们聊一聊coding agent。

通过对anthropic的claude code逐步的学习,我相信大家都能够感觉到AI coding在码农中间特别的火爆。我相信之所以这么火爆,可能有几个方面的原因。

首先,作为在单一场景,比如coding这个场景,它的上下语境比较简单。这个场景是比较固定的,相对于其他更常见的,翻译,写PPT,写文章等场景下?Coding的市场前景因为它能够直接产出最终的应用程序,也就是它最终产物是直接可复制的。相对来,它更能够更是独立可传播的个体。

第二,由于像claude这种公司背后是有像上一次的商业金主, 那所以他的目的应该会更加的明确,(相对于通通用ai的公司来),同时也看到在这个独特场景下也有更多的跟进者 。

那我们来看一看最近在claude上学习claude code文档的一些总结。首先写code这个事儿确实适合大模型。 因为编程语言也是一种语言,但是它也有自己的不断优化的地方。就像最开始的时候在claude 101上面我们看到,从最开始的聊天机器人,拓展了 Tooluse,后面还有agent的循环调用,这个是更加普适的模式。

集中到我关注到coding这个独特的领域,我们可以发现这些范式都有对应的结果。

这里插非常有意思的事情:创造力这个东西好像在一定的约束之下才会有更大的迸发,好像是悖论。

Cloud Code它里边有很多的组成部分。刚开始会让人觉得不知所措,像什么子代理sub agent,或者像这个自己定义的命令commands和外部工具mcp。 这些不同的不同的名词到底是做什么的?那我觉得我没有办法代替别人去理解事物,但我想一下这个直观的感受。

首先,在这个非常狭窄的编程领域,对生成的效果的要求肯定会要求更高,甚至需要能达到产品化。这时候,第矛盾:节省使用token(节省费用)。 如果我们用同agent的上下文去修改代码,就会产生一些污染的问题?也有可能造成上下文增长后效果变差。

那第二个矛盾,就是写代码,以前都是Ctrl C加Ctrl V,我们一定要在原来已有的这个知识架构上去再进行开发,而不是从零开始。那这就需要外部的工具,比如网络搜索,或者进一步的像github上的这个repo读取,与码农原来所存在的世界里东西的沟通这个东西就叫MCP MCP其实和那个大的概念是。

有了工具mcp,同时有了subagent的这种干净的上下文和足够的注意力以后会发现。 就像头脑清醒的人有了一堆好工具,但是他也要知道每个工具有怎么用的。这个时候就出现了skill,也就是最近出现的skill技能。这个东西我理解其实就像明书一样,核心的还是自然语言,但是他会。 就类似于agent的workflow的概念去控制在什么时候,用什么工具。

这是从上到下的维度基本上就可以去使用了。那我们再来扩展一下,它是有不确定性的,毕竟是他们有一句话叫:经典的扔骰子这种比喻,通过概率去做的。有没有一些事情是肯定要发生的?这首先就想到在传统的编程里经常会接触到的钩子这概念,我们在这个把代码写完之后是要要不要做review,或者要不要提交github,提交日志。这些就是一定要发生的,那会有这个hooks小小的概念。解决了这个问题之后基本上这个东西就可以用了,也省去了这个人为引入的一些错误。那我们从人体工程学的角度再去看,如果是一堆的这个subagent,skill还有mcp。

这明显人机工程学上不太合适。那也就是还有command支持的commands命令,命令是与人接触的这个人机交互界面,你可能十几个skill,你大概通过两三个command就可以暴露出人机接口。

tags: agent - notes