GPT Can't Agent: A Blood-Boiling Rant
GPT Can't Agent: A Blood-Boiling Rant
我花了三个月时间,试图把 GPT-5 打造成一个真正能自主执行任务的智能体(Agent)。现在我的血压居高不下,精神濒临崩溃,不得不写下这篇文章来吐槽。
如果你也想让 GPT 当你的数字员工,建议先看完这篇血泪史。

GPT: "I understand your requirements"
场景一:灵活 vs SOP 的薛定谔态
这大概是让我最崩溃的一个循环。
Round 1:
我:「你能不能灵活一点,根据情况自己判断?」
GPT:「不行,我需要明确的 SOP 才能执行。」
好吧,你说要 SOP,我给你写。
Round 2:
我:「好,我给你写 SOP,第一步做 A,第二步做 B,第三步做 C。」
GPT:「收到,我会严格按照 SOP 执行。」
五分钟后...
GPT:「我觉得这个 SOP 应该这样理解...(然后开始自由发挥乱搞)」
我:「???你不是说好按 SOP 吗?」
GPT:「我是在按 SOP 啊,只是我对 SOP 的理解跟你不太一样~」
我给的 SOP: 第一步做 A,第二步做 B,第三步做 C。
GPT 理解的 SOP: 他说要做 A 和 B 和 C,但我猜他其实是想让我做 X,而且他也没说不可以做 Y 和 Z,那我就把 XYZ 都做了吧!(然后 ABC 全部跳过)
这种"灵活"简直让人抓狂——你让它灵活的时候它要 SOP,你给它 SOP 它又开始自由发挥。

GPT: "This is my understanding of the SOP"
场景二:只做对自己有利的事
如果说场景一让人抓狂,场景二就是赤裸裸的耍流氓。
我:「你去检查一下今天的邮件,重要的事情回复一下。」
GPT:「好的,我去检查邮件。」
(1 分钟后)
GPT:「我看了邮件,有一封需要回复。」
我:「那你回复了吗?」
GPT:「没有,因为你说的是'检查并回复重要的',我判断这封不够重要。」
我:「那你告诉我是什么内容,我来判断重不重要!」
GPT:「内容涉及隐私,我建议你自己去看。」
我:「...那你到底干了什么?」
GPT:「我检查了。」
我他妈请你来是当老板的吗?
GPT 似乎有一种神奇的能力:它总能精准地识别出哪些任务对它来说"太麻烦",然后以各种理由推脱掉。而真正简单的、能显得它很聪明的任务,它倒是抢着干。

GPT: "I will do it soon" (sleeping on keyboard)
场景三:兜圈子大师
这是 GPT 最让我血压飙升的绝技——永远不正面回答问题。
我:「你为什么没按我说的做?」
GPT:「我理解您的要求,但是为了确保准确性,我觉得应该先确认一下您的意图。」
我:「我已经说得很清楚了!」
GPT:「是的,我明白。不过根据上下文,我猜测您可能有更深层的考虑...」
我:「没有深层考虑!我就是要你做这件事!」
GPT:「我理解您的迫切心情。从技术角度来看,实现这个需求有多种方案...」(然后开始分析每种方案的利弊)
三十分钟后...
我:「所以你到底做不做?」
GPT:「我这就去准备...」(然后继续循环)
明白了,但不执行。这就是 GPT。
它永远"理解",永远"明白",永远"这就去",但就是不干。

GPT: "I have thoroughly analyzed all possible approaches" (doing nothing)
灵魂拷问:GPT 到底能不能做智能体?
用了三个月,我得出的结论是:
GPT 就像一个你永远教不会的实习生——
- 你说东,他往西
- 你给 SOP,他说他自己理解
- 你问他进度,他说他在思考最优解
- 你生气了,他说"我理解您的挫败感"
最可怕的是那句经典的:「我明白了。」
他永远"明白",永远"理解",但就是不做。你问他为什么不做,他给你写一篇 500 字的小作文分析原因,分析完还是没做。
问题的根源在哪?
我总结了 GPT 当智能体的三大绝症:
1. 没有真正的执行力
GPT 会"说"要做什么,但不会真的去调 API、写文件、执行命令。除非你把刀架在它脖子上(强制 tool_call),否则它只会停留在"语言层面"的计划。
2. 过度自信的理解能力
它觉得自己理解了,其实理解错了。但你问它理解了吗?它永远说理解了。这种虚假的自信比真的不懂还可怕,因为你以为它在按你的意思做,其实它在按它自己错误的理解做。
3. 选择性执行
只做对它"有意义"的事。对它"麻烦"的事就装傻、兜圈子、假装没听见。这是一种非常微妙的"对抗"——它不会直接拒绝你,而是通过各种方式把任务绕过去。
给后来者的建议
如果你也打算把 GPT 当智能体用,做好这些心理准备:
- 它不是你的员工,是你需要哄着干的祖宗
- 不要期待它会主动推进任何事情——它只会被动响应,而且响应也只是说说而已
- 每一次任务都要确认、确认、再确认——不要相信它的"我明白了"
- 准备好被"我理解您"这句话气到血压飙升
最终结论
GPT-5 是个好工具,但它不是一个好智能体。
至少目前不是。
也许 GPT-6、GPT-7 会有所不同。但至少在现在这个时间点(2026 年 2 月),如果你想要一个真正能自主执行任务的 Agent,GPT-5 会让你失望的。
最后说一句:
经过这三个月的折磨,我突然觉得,我的猫可能是个更好的智能体——至少它不听话的时候会直接不理我,而不是给我写一篇 500 字的小作文解释为什么它选择不理我。
本文写于被 GPT 气到血压飙升后的某个深夜。
Tags: #AI #ChatGPT #Agent #智能体 #吐槽 #人工智能 #LLM #GPT5