"Chain of Thought"(CoT,思維鏈)是一種改進的提示策略,用於提高大型語言模型在複雜推理任務中的性能,如算術推理、常識推理和符號推理¹²。思維鏈結合了中間推理步驟,並把推理步驟輸出,構成更豐富的 "上文",從而提升 "下文" 正確的概率,獲得更優質的輸出¹²。
例如,對於一個數學問題,如果我們直接問大型語言模型,它可能無法給出正確的答案。但是,如果我們使用思維鏈(CoT)技法,並在提示中提供解題的思路,那麼模型就能按照這樣的思路去解題,從而提高其解題的準確率²。
此外,研究還發現,當模型規模增大時,使用思維鏈(CoT)的效果會更好²。這意味著,對於那些需要精確的、分步驟計算的複雜問題,大型語言模型也有可能給出正確的答案¹²。因此,思維鏈(CoT)在提升大型語言模型的推理能力方面,扮演了重要的角色¹²。
來源: 與 Bing 的交談, 2024/3/4
(1) undefined. https://bing.com/search?q=.
(2) 提示工程(Prompt Engineering):Prompt 進階技法 chain-of-thought (CoT) - iT 邦幫忙. https://ithelp.ithome.com.tw/articles/10323223.
(3) 大模型思维链(Chain-of-Thought)技术原理 - 知乎. https://zhuanlan.zhihu.com/p/629087587.
(4) 思維鏈 - MBA智库百科. https://bing.com/search?q=Chain+of+Thought+%28COT%29+%e6%98%af%e4%bb%80%e9%ba%bc%e6%84%8f%e6%80%9d.
(5) 思維鏈 - MBA智库百科. https://wiki.mbalib.com/zh-tw/%E6%80%9D%E7%BB%B4%E9%93%BE.
(6) 思维链 - MBA智库百科. https://wiki.mbalib.com/wiki/%E6%80%9D%E7%BB%B4%E9%93%BE.
(7) undefined. https://arxiv.org/pdf/2201.11903.pdf.
(8) undefined. https://arxiv.org/pdf/2201.11903.pdf%29.
(9) undefined. https://arxiv.org/pdf/2205.11916.pdf%29.
(10) undefined. https://arxiv.org/pdf/2205.11916.pdf.
(11) undefined. https://www.tenlong.com.tw/products/9786263335189.
(12) undefined. https://medium.com/@ianchen_27500.