AI Agent使用感受（202604）

type

Post

status

Published

date

Apr 9, 2026

slug

20260409

summary

大约半个月时间的AI Agent使用总结及感想

我体验前的状态

AI 的使用集中在 Chat 形式，主要是使用 Gemini pro 。AI Coding 方面在 Copilot 初期免费活动时期体验了一段时间，当时正好准备写一个小脚本工具，其中自动提示帮我省了不少力气，省力的点主要是在减少了编写模板代码的工作量。后续对 Vibe coding 的了解仅限于通过论坛讨论的摄入，所以当时对经常出现的内容有如下几点疑惑：

Vibe coding 真的可以一行代码都不看么

这些人在极短的时间内所谓的产出真的可能么（很多AI产品不仅仅局限于几个专有功能已经变成了比较完善的单体软件）

Token使用量的疑惑，普通的编码需要消耗那么多的Token么？不少人会去开通100或者200刀的顶级订阅甚者还同时开多个

养虾热虽然有炒作的嫌疑，但是能够火起来应该还是有什么基础导致的

简单总结就是渐渐不能跟上这些人的想法和行动路径。

我的体验路径

由于正好最近回归了普通的工作状态，我终于有一些事情可能要借助这些 AI 工具了。所以就萌生了体验现在市面上比较火的 AI Coding 类工具的想法，虽说工作上没有要求强制使用 AI 。

我本身是有 Gemini Pro 订阅的不过不管是使用 Antigravity 还是 Gemini cli 体验上都不是很好，本来的话应该尝试使用评价最好的 Claude Code 的但碍于不能免费体验只能上20刀的基础套餐，所以综合考虑下最后选择了 Codex ChatGPT plus 的套餐。这个套餐虽然同样是20刀，不过有一个月免费试用并且同时可以使用 ChatGPT 的会员功能，对比下来还是蛮实惠的。

我在具体使用上主要尝试了三件事情：

帮助我编写数据映射的 excel ，具体的工作是根据多个设计文档去得出对应的修改应该如何体现在 excel 上。这里没有设计代码编写工作，不过会涉及到代码的读取因为具体的判定是设计文档为主代码为辅的方式进行的，主要的产物是落 Skill 的方式。

根据基础设计文档去生成时序图和类图，编辑的时序图和类图是在一个叫ea的软件所使用的专用工程文件里。由于是一个特定格式的文件处理，所以额外的编写了一个工程去专门编辑这个文件，这样就可以将 AI 对文档的理解直接落到文件中，而我通过EA这个软件验收成果。

创建一个各个模型 API 或 AI Coding 订阅的比价网站，由于暂时没有工作上的事情，所以主要是为了尝试走一个常规 AI Agent 创建产品的逻辑链条。

结果上来说 AI 做的工作都算满意的，虽然不能说没有犯病的地方，但终归能按照我的指示向着正确的方向行进。还有一个比较惊艳的就是有的时候我的提示词说的并不好理解或者参杂了一些错别字，说实话这些提示词写完我自己再去理解都会有些困难，但是 AI 几乎都能无障碍的理解核心想表达的需求并正确执行。

Vibe Coding 对我的影响

最开始在进行第一个的时候我还是比较有耐心的，比如说开始的时候还很有耐心的调整文档规则，引导 AI 做各种规则设定。对于 AI 偏早的结束任务暂停询问以及出错都还是有耐心的进行引导，对 AI 的每次修改也都会进行检查。

当进行第二个的时候我感觉我的耐心在逐渐降低，AI出错的时候会变得忍不住暴粗口。比如 AI 特别喜欢做的事就是在我设定一个需求后，AI在做到一半的状态问我说“如果你同意的我就开始执行以下1,2,3的工作”，可是明明这个工作我开始就提了让它把这个需求执行到结束，但他非要做一半停下来让我打字告诉他“继续”。每次遇到这种情况情绪就会别的特别暴躁，另外就是代码也变成一行都不review了。

到第三个的时候，我已经有些不太能忍受 AI 去执行小于10分钟的命令了。这个时候我也发现可以通过设置 plan 的方式尽量让 Agent 把一次的工作时间变长，另外就是自己也开始不好好准备提示词，经常就非常没逻辑的说“你自己检查”之类的来推动Agent继续工作。

对现在 Agent 的评价

总体来说我觉得现在 Agent 的能力已经远远凌驾于程序员之上了，和程序员的水平无关它已经是另一个级别的存在。目前所谓 Agent 做不到的工作的说法，感觉主要在于 Agent 获得的权限或视野受到了限制，假设它能获得到足够的信息输入，那几乎不需要我去做很多的提示他自己就可以完成工作。我在使用的过程中所做的工作就是提供数据源并不断去收窄目标，让 Agent 能够知道哪些资料是有价值的和明确开发的目的这个工作。可以发现这个过程并不需要中途做，只要最开始的时候就将所有需要的信息确认好就可以一口气达到完成成品的目的。开头的这个过程也并不困难，Agent 本身就携带巨大的信息源，完全可以用它的知识量来配合自己完成一个优质的计划列表。

当然以上只是理想状态，实际 AI 的表现显的倾向于偷懒，它会尽量在表面满足你的要求，总是找到机会就会停下来向你询问。这可能和大模型的本质是针对对话训练的模型有关，所以这种尽量简短思考并尽快进行互动就是它的本性，不过随着 Agent 的继续发展这种问题也会慢慢得到解决。未来也不难想象，人类在这里的作用（提示词）也在不断变小，可能未来的某一天，真的只要说做个“淘宝”这样的提示语 AI 就能引导用户并完成交付的程度。

另外我也理解了 OpenClaw 为什么火热，当进行大量的 Vibe Coding 后对使用者自己的价值认知也在发生改变，大概会把自己定位在信息的搬运工以及点击同意的机器人。如果是这样的话，我为什么不把权限都给 Agent，Agent 你自己去找资料不就好了。如果一个 Agent 不想干活总是偷懒的话我就装多个 Agent 让你们互相对话（监督）来延长持续工作的时间。虽然这种行为很可能陷入 Agent 之间愚蠢的对话循环从而变成单纯浪费 Token 的行为（也是目前的大多数情况），但是 AI 强大的表现让人很难不去尝试下看看有没有成功的可能。

最后，手写代码大概或许可能确实要被淘汰了，体验了 Vibe Coding 后就回不到过去的自己了。

🦾AI Agent使用感受（202604）

我体验前的状态

我的体验路径

Vibe Coding 对我的影响

对现在 Agent 的评价