当前位置：首页 - 技术 - 正文

Enjoy life！

思维链（CoT）揭秘：让AI一步步思考，效果炸裂

2026-07-19 | 技术 | sun | 330 次阅读

A⁺ A^-

先看效果：一句话让AI智商翻倍

你试过让AI算数学题吗？比如：
问：一个篮子里有3个苹果，又放进去5个，然后吃掉2个，还剩几个？
直接问，GPT-3.5可能答：6个（正确）。但如果你问复杂点的：
问：小明有5个苹果，小红比他多3个，小刚的苹果是小明和小红总数的一半，小刚有几个？
直接输出：小明5，小红8，总数13，一半是6.5，所以小刚有6.5个？不对，苹果不能半个，所以是6个？——混乱。

但如果你在问题后面加上让我们一步步思考（Let's think step by step），AI会输出：
1. 小明有5个苹果 2. 小红比小明多3个，所以小红有5+3=8个 3. 小明和小红共有5+8=13个 4. 小刚的苹果是总数的一半，即13/2=6.5个 5. 因为苹果是整数，所以小刚有6个（或7个？题目没说取整，所以答案是6.5）
看，它把推理过程写出来了，你还能检查哪步错了。这就是思维链（Chain of Thought, CoT）的本质：让AI把思考过程说出来，而不是直接给答案。

CoT是什么？别被术语吓到

思维链（Chain of Thought）是一种提示工程技术，由Google在2022年提出。简单说，就是在提问时，要求模型输出中间推理步骤。就像你解数学题时，老师让你写"解：因为……所以……"一样。

为什么有效？因为大语言模型（LLM）本质上是"下一个词预测器"，直接输出答案可能跳步出错。但引导它一步步推理，就相当于给了它一个"思考框架"，减少了随机性，提高了正确率。而且，步骤透明，你能看到它哪里想错了，方便调试。

实战：加与不加，效果天差地别

我测试了几个典型场景，结果如下：

场景1：数学应用题

不加CoT：
Q: 一个农场有12只鸡，鸭子是鸡的3倍，鹅比鸭子少5只，鹅有几只？ A: 31（错误，实际是31？等等，我算一下：12*3=36，36-5=31，正确啊？但AI直接输出31，如果它算错呢？）

加CoT：
Q: 一个农场有12只鸡，鸭子是鸡的3倍，鹅比鸭子少5只，鹅有几只？让我们一步步思考。 A: 第一步：鸭子=鸡*3=12*3=36；第二步：鹅=鸭子-5=36-5=31；所以答案是31。——步骤清晰，即使答案错也能定位。

场景2：逻辑推理

Q: 所有的A都是B，所有的B都是C，那么A是C吗？
不加CoT：是的（正确，但太简单）。
加CoT：如果所有的A都是B，那么A属于B；所有的B都是C，那么B属于C；因此A属于C，所以A是C。是的。——对于复杂逻辑，CoT能避免偷懒。

场景3：常识问答

Q: 太阳从哪边升起？
不加CoT：东边（正确，无需步骤）。
加CoT：太阳从东边升起，因为地球自西向东自转。——虽然正确，但略显啰嗦。

什么时候用CoT？什么时候别用？

根据我的经验，CoT最适合以下场景：

多步推理题：数学、逻辑、编程算法等需要多步计算或推理的问题。
复杂决策：比如"如果明天下雨，我就带伞；如果带伞，我就不能骑自行车；那么明天我该……"——需要一步步分析。
需要可解释性的场景：比如医疗诊断、法律咨询，你需要知道AI为什么得出这个结论。

不适合的场景：

简单事实问答：比如"中国首都是哪？"——直接回答更快。
创意写作：写诗、写故事时，步骤会破坏流畅性。
超长上下文：CoT会增加输出token数，如果上下文窗口有限，可能截断。

进阶技巧：少样本CoT

除了在问题后加"让我们一步步思考"，你还可以给AI一个例子（few-shot），让它模仿。比如：

Q: 2+3=？ 5
Q: 5+7=？ 12
Q: 12+15=？ 让我们一步步思考。
A: 12+15=27

这样AI会学会在复杂问题时自动用CoT。更高级的是"自我一致性"（self-consistency）：让AI多次推理并投票，选出最一致的答案，能进一步提升准确率。

总结

思维链（CoT）是提示工程中的"瑞士军刀"，简单却强大。它让AI从"黑盒答案机"变成"透明推理者"。下次遇到复杂问题，记得加上"让我们一步步思考"，你会看到AI智商瞬间提升。当然，别滥用，简单问题就让它直接答吧。

想深入？推荐阅读原始论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》（Wei et al., 2022）。

本文来源：一江山水的随笔

本文地址：https://298.name/post/211.html

主要内容：思维链（CoT）揭秘：让AI一步步思考，效果炸裂

标签：思维链 Chain of Thought 提示工程 AI推理

上一篇

国产大模型实测：DeepSeek、豆包、通义谁更强？

下一篇

手机本地AI实测：骁龙8 Elite/天玑9400跑7B模型，离线可用吗？

想找什么搜索会更快哦！

站点信息

文章总数:171
页面总数:1
分类总数:4
标签总数:170
评论总数:61
浏览总数:1643341

控制面板

您好，欢迎到访网站！
查看权限