🦾AI Agent使用感受(202604)

2026-4-9|2026-4-9
AlphaBoom
AlphaBoom
type
Post
status
Published
date
Apr 9, 2026
slug
20260409
summary
大约半个月时间的AI Agent使用总结及感想
tags
杂谈
AI Agent
Vibe Coding
category
日常学习
icon
password
上次使用 AI Coding 还是在 Copilot 刚出来的时候,那段时间 AI 在代码的领域主要以提示补全为主。AI Agent 在这个时间节点大部分还偏向于玩具项目,虽然之后 AI Coding 也向着 Agent 模式发展不过大部分还是局限于广告营销程度,类似于一个产品经理一天写了个应用这样的软文。但是从去年开始就有了比较大的变化,Vibe coding 这个词在逐渐的流行,越来越多的人也在拥抱 Agent 模式的编码体验。特别今年开始还有所谓的养虾(OpenClaw)热,随着这段时间的体验我也能够理解这个世界的变化。

体验前的状态

AI的时候集中在Chat形式,主要是使用Gemini pro。AI Coding在Copilot初期免费活动体验了一段时间,当时正好准备写一个小脚本工具自动提示帮我省了不少力气,省力的点主要是在减少了编写模板代码的工作量。对 Vibe coding 的了解仅限于论坛讨论的摄入,所以当时有如下几点疑惑:
  • Vibe coding 真的可以一行代码不看么
  • 这些人在极短的时间内所谓的产出真的可能么(很多AI产品不仅仅局限于几个专有功能已经变成了比较完善的单体软件)
  • Token使用量的疑惑,普通的编码需要消耗那么多的Token么,不少人去开通100或者200刀的顶级订阅甚至是同时开多个
  • 养虾热虽然有炒作的嫌疑,但是能够火起来应该还是有什么基础导致的
简单总结就是渐渐不能理解这些人的想法和行动路径

我的体验路径

由于最近回归了普通的工作状态,我终于有一些事情可能要借助这些 AI 工具了。所以就萌生了开始使用现在市面上比较火的的 AI Coding 工具的想法,虽然工作没有强制使用 AI 工具。
我本身是有 Gemini Pro 不过不管是使用 Antigravity 还是 Gemini cli 都不是很好用,本来的话应该使用评价第一的 Claude Code 的但碍于不能免费体验加上20刀的基础套餐,综合考虑下最后选择了 Codex ChatGPT plus 的套餐。这个套餐虽然同样20刀,不过有一个月免费试用并且同时可以使用 ChatGPT ,对比下来还是蛮实惠的。
具体使用上主要做了三件事情:
  1. 帮助我编写数据映射的 excel ,具体的工作是根据多个设计文档去得出对应的修改应该如何体现在 excel 上。这里没有设计代码编写工作,不过会涉及到代码的读取因为具体的判定是设计文档为主代码为辅的方式进行的,主要的产物是落 Skill 的方式。
  1. 根据基础设计文档去生成时序图和类图,编辑的时序图和类图是在一个叫ea的软件所使用的专用工程文件里。由于是一个特定格式的文件处理,所以额外的编写了一个工程去专门编辑这个文件,这样就可以将 AI 对文档的理解直接落到文件中,而我通过EA这个软件验收成果。
  1. 创建一个各个模型 API 或 AI Coding 订阅的比价网站,由于暂时没有工作上的事情,所以主要是为了尝试走一个常规 AI Agent 创建产品的逻辑链条。
结果上来说AI做的工作都算满意的,虽然不能说没有犯病的地方,但总归能按照我的指示向着正确的方向行进。还有一个比较经验的就是有的时候我的提示词说的并不好理解或者参杂了一些错别字,说实话这种提示词写完我再去理解都会有些困难,但是 AI 几乎都能无障碍的理解核心想表达的需求并执行。

我的变化

最开始在进行1的时候我还是比较耐心的,比如开始的时候还耐心的调整文档规则,引导AI做各种规则设定。对于AI偏早的结束任务暂停询问,以及出错都还是比较耐心引导的,每次修改也都是认真检查的。
当进行第二个的时候我就逐渐降低耐心,在AI出错的时候忍不住暴粗口。比如AI特别喜欢做的事就是我设定一个需求,然后AI做一半然后说如果你同意的我就开始执行以下1,2,3的工作,可是明明这个工作我开始就提了让它进行这项任务,他非要做一半停下来让我打字。遇到这种情况情绪就会别的很暴躁,另外代码也是一行也不review的。
到第三个的时候,我已经有些不太能忍受AI执行小于10分钟的命令了,这个时候我也发现可以通过设置 plan 的方式尽量让 Agent 一次的工作变长,自己也不好好准备提示词经常就非常没逻辑的你自己检查之类的推动Agent继续工作。

对现在Agent的评价

我觉得现在Agent的能力已经远远凌驾于程序员之上了,和程序员的水平无关它已经是另一个级别的存在。目前所谓Agent做不到的工作,主要在于他的权限或视野受到了限制,假设它能获得到足够的信息摄入,那几乎不需要我去做什么提示他就可以完成工作。我在这个过程中所做的工作就是提供数据源,并且不断去收窄目标,让 Agent 慢慢知道哪些资料是有价值的以及明确开发的目的这个过程。可以发现这个过程并不需要中途做,只要开始的时候就将所有需要的信息确认好就可以一口气达到完成成品的过程。开头的这个过程也不困难,Agent 本身携带的巨大信息源完全可以用它的知识量来配合你完成一个优质的计划列表。
当然以上只是理想状态,实际 AI 的表现显的特别偷懒,它会尽量在表面满足你的提问,并且找到机会就会停下来和你对话。这可能和大模型的本质是一个对话模型有关,所以这种尽量简短以及进行互动就是它的本性,不过随着 Agent 的继续发展这种问题也可以慢慢的解决。随之也不难想象,人类在这里的作用在不断变小,大概未来发展下真的只要说做个“淘宝”这样的提示语就能完成的地步了。
另外我也理解了 OpenClaw 的火热,当大量的 Vibe Coding 之后对自己的价值认知大概只是信息的搬运工以及点击同意的机器人。如果这样的话,我为什么不把权限都给 Agent,你 Agent 自己去找资料。一个 Agent 不想干活的话我就装多个 Agent 让你们互相对话来延长工作时间。虽然这种行为很可能陷入 Agent 之间愚蠢的对话循环从而变成单纯浪费 Token 的行为(也是目前的大多数情况),但是 AI 强大的表现让人很难不去尝试下看看有没有成功的可能。
最后,手写代码大概或许可能确实要被淘汰了,体验了 Vibe Coding 就回不到过去的自己了。
博客迁移日记日本生活-启程篇
Loading...