12 January 2026

Coding agent

by Aaron Tsui

今天我们聊一聊coding agent。

通过对anthropic的claude code逐步的学习，我相信大家都能够感觉到AI coding在码农中间特别的火爆。我相信之所以这么火爆，可能有几个方面的原因。

首先，作为在单一场景，比如coding这个场景，它的上下语境比较简单。这个场景是比较固定的，相对于其他更常见的，翻译，写PPT，写文章等场景下？Coding的市场前景因为它能够直接产出最终的应用程序，也就是它最终产物是直接可复制的。相对来，它更能够更是独立可传播的个体。

第二，由于像claude这种公司背后是有像上一次的商业金主，那所以他的目的应该会更加的明确，（相对于通通用ai的公司来），同时也看到在这个独特场景下也有更多的跟进者。

那我们来看一看最近在claude上学习claude code文档的一些总结。首先写code这个事儿确实适合大模型。因为编程语言也是一种语言，但是它也有自己的不断优化的地方。就像最开始的时候在claude 101上面我们看到，从最开始的聊天机器人，拓展了 Tooluse，后面还有agent的循环调用，这个是更加普适的模式。

集中到我关注到coding这个独特的领域，我们可以发现这些范式都有对应的结果。

这里插非常有意思的事情：创造力这个东西好像在一定的约束之下才会有更大的迸发，好像是悖论。

Cloud Code它里边有很多的组成部分。刚开始会让人觉得不知所措，像什么子代理sub agent，或者像这个自己定义的命令commands和外部工具mcp。这些不同的不同的名词到底是做什么的？那我觉得我没有办法代替别人去理解事物，但我想一下这个直观的感受。

首先，在这个非常狭窄的编程领域，对生成的效果的要求肯定会要求更高，甚至需要能达到产品化。这时候，第矛盾：节省使用token（节省费用）。如果我们用同agent的上下文去修改代码，就会产生一些污染的问题？也有可能造成上下文增长后效果变差。

那第二个矛盾，就是写代码，以前都是Ctrl C加Ctrl V，我们一定要在原来已有的这个知识架构上去再进行开发，而不是从零开始。那这就需要外部的工具，比如网络搜索，或者进一步的像github上的这个repo读取，与码农原来所存在的世界里东西的沟通这个东西就叫MCP MCP其实和那个大的概念是。

有了工具mcp，同时有了subagent的这种干净的上下文和足够的注意力以后会发现。就像头脑清醒的人有了一堆好工具，但是他也要知道每个工具有怎么用的。这个时候就出现了skill，也就是最近出现的skill技能。这个东西我理解其实就像明书一样，核心的还是自然语言，但是他会。就类似于agent的workflow的概念去控制在什么时候，用什么工具。

这是从上到下的维度基本上就可以去使用了。那我们再来扩展一下，它是有不确定性的，毕竟是他们有一句话叫：经典的扔骰子这种比喻，通过概率去做的。有没有一些事情是肯定要发生的？这首先就想到在传统的编程里经常会接触到的钩子这概念，我们在这个把代码写完之后是要要不要做review，或者要不要提交github，提交日志。这些就是一定要发生的，那会有这个hooks小小的概念。解决了这个问题之后基本上这个东西就可以用了，也省去了这个人为引入的一些错误。那我们从人体工程学的角度再去看，如果是一堆的这个subagent，skill还有mcp。

这明显人机工程学上不太合适。那也就是还有command支持的commands命令，命令是与人接触的这个人机交互界面，你可能十几个skill，你大概通过两三个command就可以暴露出人机接口。

tags: agent - notes

a2ron

Aaron Tsui's personal website.

Coding agent