The Bitter Lesson of LLM Extensionswww.sawyerhood.com/blog/llm-extension本文回顾了过去三年LLM扩展机制的演进历程,并展望了未来发展方向:与其为每个任务设计专用工具(如MCP),不如赋予代理通用计算能力(如访问shell、运行脚本),并信任其能自主组合使用。这正是“苦涩的教训”的体现——智能应来自通用能力与学习,而非人为设计的复杂规则。LLM扩展机制发展脉络1️⃣ChatGPT插件(2023年3月):首次尝试让LLM调用外部API,理念超前但受限于模型能力与复杂体验。2️⃣自定义指令(2023年7月):以简单文本附加方式解决重复上下文问题,成为后续配置文件的雏形。3️⃣自定义GPT(2023年11月):将提示与工具打包为专用“应用”,转向更易用但封闭的形态。4️⃣记忆功能(2024年2月):实现自动化的长期个性化记忆,标志代理开始具备持续状态管理能力。5️⃣ Cursor规则(2024年4月):将配置文件(如.cursorrules)纳入代码库,实现开发场景下的原生集成。6️⃣ 模型上下文协议MCP(2024年11月):通过客户端-服务器架构赋予LLM真实操作能力(如读取代码库、查数据库),功能强大但使用复杂。7️⃣ Claude Code(2025年2月):集成多种扩展方式,包括子代理、钩子、斜杠命令等,功能全面但部分特性已被弃用。8️⃣ 代理技能(Agent Skills, 2025年10月):以轻量化的Markdown文件(SKILL.md)和脚本定义能力,避免MCP的上下文膨胀问题,回归“给指令+通用工具,由模型自主完成”的理念。
