译> 我的 AI 应用之路

09 Feb, 2026

本文翻译自 My AI Adoption Journey，作者 Mitchell Hashimoto

译文由 AI 翻译，rokcso 修正

我的经验是，任何有意义的工具，都要经历三个阶段方能掌握：（1）低效适应期（2）基本应用期（3）革新蜕变期。

由于已有得心应手的工作流，我往往要逼着自己突破前两个阶段。尝试新工具总像额外负担，虽心有不甘，但为成为全面发展的多面手，我总会坚持投入。

这是我探索 AI 工具价值的历程，以及正在探索的新可能。在当下众声喧哗的 AI 热潮中，我希望能以这份审慎从容的思考，记录自己对 AI 认知的演进轨迹。

本文全程手写，字字皆出己思。在此强调似乎多余，但鉴于主题特殊性，特此说明。

第一步：告别聊天机器人

请立即停止试图通过聊天机器人（如 ChatGPT、网页版的 Gemini 等）完成实质性工作。这类工具确有价值，也是我日常 AI 工作流的一部分，但它们在编程领域的效用极其有限，因为你本质上是在赌训练数据能恰好生成正确结果，而纠错过程更需人工反复指正，效率低下。

我相信多数人的 AI 初体验都始于聊天界面，编程初尝试也是让聊天机器人代写代码。

在我仍是 AI 怀疑论者时，曾将 Zed 编辑器命令面板的截图粘贴至 Gemini，要求其用 SwiftUI 复刻，当它在数秒内交出近乎完美的成品时，确实令我震撼。如今 Ghostty for macOS 的默认命令面板，正是在 Gemini 生成的代码基础之上微调而成。

但当我试图在其他任务中复现这种成功时，结果往往令人失望。尤其在已有项目中，聊天机器人频繁输出低质结果，让我陷入复制粘贴代码和命令输出的繁琐循环。这种模式效率之低下，明显不如亲自动手。

要真正释放价值，必须转向使用智能体。这是行业公认的术语，指具备循环交互能力并能触发外部行为的 LLM 系统¹。一个合格的智能体至少应具备：文件读取、程序执行和 HTTP 请求发起能力。

第二步：复刻你的工作流程

我接下来的尝试是使用 Claude Code。长话短说：初期体验并不惊艳。产出质量不尽人意，总觉得需要逐行修改，耗时甚至超过亲手完成。尽管研读了技术博客、观看演示视频，仍未见其精妙之处。

但我没有放弃，而是强制自己用智能体复现所有手动提交的代码。字面意思地将同一项工作重复完成两次。先手动实现，再引导智能体产出功能与质量完全相同的结果（当然不会让它参考我的手写代码）。

这个过程堪称煎熬，因为它违背了「高效完成」的基本诉求。但多年使用非 AI 工具的经验告诉我，磨合期的阵痛在所难免，唯有全力尝试后才能得出经得起推敲的结论。

正是在这种刻意练习中，专业认知逐渐形成。我很快从第一性原理出发，验证了他人已提出的观点，而亲身体验带来的理解更为深刻：

任务拆解：将复杂任务拆分为清晰可行的子任务，避免试图「一步登天」
规划分离：模糊需求应先进行规划，再执行实施
自检机制：赋予智能体验证自身工作的能力，它往往能自主修正错误并防止倒退

更重要的是，我摸清了当时智能体的能力边界：擅长什么、不擅长什么，以及如何在其优势领域达成目标。

这一切带来显著的效率提升，以至于我开始自然而然地使用智能体，虽然尚未感觉更快（因为多数时间仍在监督执行），但至少不再迟滞。

特别需要强调的是：效率提升部分源于懂得何时不使用智能体。明知会失败仍强行调用纯属浪费时间，而具备这种避坑意识本身就是一种节约时间²。

至此，智能体已足够好用，我乐意将其纳入工作流，虽未实现净效率增益，但作为工具已令我满意。

第三步：日结智能体

为了进一步提升效率，我开始尝试新模式：每天留出最后 30 分钟，启动一个或多个智能体任务。我的假设是：如果智能体能在我无法工作的时间段取得进展，或许能实现效率增益。本质上是将生产力从「拥有的时间」延伸到「本不工作的时间」。

与上一阶段类似，初期尝试既无成效又令人烦躁。但我很快发现了适合此模式的三大场景：

深度调研任务：让智能体系统梳理某个技术领域，例如检索特定语言中符合某许可证类型的所有库，并为每个库生成多页评估报告，涵盖优劣分析、开发活跃度、社区反馈等。
并行探索概念：同时启动多个智能体验证不同设想。我不期望它们直接产出可交付成果，但能为次日工作揭示潜在盲区。
Issue 与 PR 分类：智能体擅长使用 GitHub CLI 工具，我编写脚本批量启动并行任务进行分类。仅允许生成报告而非直接回复，次日可根据报告优先处理高价值或低耗时任务。

需要说明的是，我并未像某些实践者那样让智能体整夜循环运行。多数任务能在半小时内完成。但关键在于：工作日下午的我通常处于精力低谷，效率低下，此时转为启动智能体任务，反而能为次日早晨提供「热启动」，让我更快进入工作状态。

至此，我开始感受到 AI 带来了超越以往的产能提升，尽管幅度尚微，但已足够令人欣喜。

第四步：外包「稳赢」任务

此时，我已经非常清楚 AI 擅长和不擅长哪些任务。对于某些特定任务，我能高度确信 AI 能给出基本正确的解决方案。因此，我旅程的下一步是：在我处理其他任务的同时，让智能体包揽所有那些它擅长的工作。

更具体地说，我每天会先查看前一夜分类智能体的结果，手动筛选出那些智能体几乎肯定能完美解决的 Issue，然后让它们在后台运行（一次一个，不并行处理）。

与此同时，我会去处理别的事情。我不会去刷社交媒体（和使用 AI 之前一样），也不会看视频等等。我会进入自己惯有的、AI 出现之前的深度思考模式，去处理我想做或必须做的任务。

这个阶段非常重要的一点是：关闭智能体的桌面通知。上下文切换的成本非常高。为了保持效率，我发现我的职责是掌控何时去打断智能体，而不是反过来被它打断。不要让智能体通知你。在你工作的自然间隙，切换标签页去检查它的进度，然后继续你的工作。

重要的是，我认为「处理其他任务」这一点有助于抵消广为人知的 Anthropic 关于技能形成的论文中提到的影响。这其实是一种权衡：你将任务委托给智能体，可能会影响你在这些任务上的技能形成，但同时你通过继续手动处理的任务，技能仍在自然地形成。

到了这个阶段，我已经坚定地处于「绝不可能再回到过去」的状态了。我感觉效率更高了，但即便没有，我最喜欢的一点是，我现在可以将编码和思考的精力集中在我真正热爱的任务上，同时又能妥善完成那些我不太喜欢的任务。

第五步：设计约束框架

有一点可能显而易见：当智能体首次就能产出正确结果，或者最差也只需极少修改时，其效率会大幅提升。实现这一目标最可靠的方法是，为智能体提供快速、高质量的工具，使其能自动判断对错。

我不知道业界对此是否有广泛接受的术语，但我逐渐称之为「约束框架」。其核心思想是：每当你发现智能体犯错时，就花时间设计一种解决方案，确保该智能体永不再犯同样的错误。这里我不需要创造新术语；如果已有其他术语，我很乐意采纳。

这主要体现在两种形式中：

改进隐式提示（AGENTS.md）。针对简单问题，比如智能体反复运行错误命令或使用错误 API，更新 AGENTS.md（或类似文件）。这里有一个 Ghostty 的示例。该文件中每一行都基于一次智能体的不当行为，而它几乎完全解决了所有这些问题。
实际的程序化工具。例如，用于截图、运行筛选测试等的脚本。这通常与 AGENTS.md 的更改配合使用，以让智能体知晓这些现有工具。

这就是我目前的状态。每当看到智能体做出不当行为时，我都会认真投入努力以防止它再次犯错。或者反过来，我正努力让智能体能够自我验证其行为是否正确。

第六步：保持智能体持续运行

在与第五步同步推进的同时，我还设定了一个目标：始终保持至少一个智能体在运行。如果没有智能体在运行，我会问自己：「现在有什么事情可以让智能体替我处理吗？」

我特别喜欢将这个目标与 Amp 的深度模式这类速度较慢但更善于思考的模型结合使用（该模式基本上就是 GPT-5.2-Codex），它可能需要超过 30 分钟来完成一些小改动。但好处是，它往往能产出非常出色的结果。

我（目前？）还没有运行多个智能体，也暂时不打算这样做。我发现，现阶段只运行一个智能体，对于我平衡两方面需求很合适：既能进行我喜欢的深度手动工作，又能照看我那位有点「笨拙」却又莫名高效的神秘机器人伙伴。

「始终保持智能体运行」这个目标目前仍然只是一个目标。可以说，目前在一个正常的工作日里，我大概能有 10% 到 20% 的时间有效地让一个智能体在后台运行。但我正在积极努力提升这个比例。

我不想为了运行智能体而运行智能体。我只在认为某项任务真正对我有帮助时才会启动它们。这个目标的部分挑战在于，需要改进我自己的工作流和工具，以便能持续产生高质量的、可以委托出去的任务。这一点，即使没有 AI，也同样重要！

当下

这就是我目前的处境。

通过这段旅程，我个人在使用现代 AI 工具方面已经取得了一些成功，并且我相信我正以一种基于现实的、审慎的态度来对待它。我其实并不太在意 AI 是否会永久存在³，我是一个软件工匠，仅仅因为热爱这份事业而想要创造东西。

整个领域发展如此之快，我敢肯定我很快就会回头看这篇文章，并嘲笑自己的天真。但是，正如人们所说，如果你不为过去的自己感到尴尬，那你可能并没有在成长。我只希望自己能朝着正确的方向成长！

我在这方面并无既得利益⁴，而且不使用 AI 当然也有其他合理的理由。我完全尊重任何人的个人决定。我写这些并不是为了说服你！我只是想和那些感兴趣的人分享一下我个人使用这些新工具的方法，并大致展示我通常是如何对待新工具的，无论是否与 AI 相关。

相较于对话模型，像 Opus 和 Codex 这样的现代编程模型在训练时就被专门设计为更倾向于使用工具。 ↩︎
由于模型迭代速度极快，我必须持续修正自己对此的原有认知。 ↩︎
但最让我深感忧虑的是，这对基础不扎实的初级开发者可能造成的技能养成缺陷。 ↩︎
我不受雇于任何 AI 公司，也未进行相关投资或提供咨询服务。 ↩︎

#Translation