大模型写代码能力突飞猛进,北大团队提出结构化思维链SCoT
任何简单或复杂的算法都可以由顺序结构、选择结构和循环结构这三种基本结构组合而成。
大型语言模型(下文称为:大模型)在代码生成上表现出了强大的能力。大模型依赖于 prompt 作为输入,思维链是目前用于设计 prompt 的主流方法,在代码生成上取得了目前最好的准确率。但大模型的准确率依旧较低,无法用于实际生产环境。
北京大学李戈、金芝教授团队提出了一种结构化的思维链,显著地提升了大模型在代码生成上的准确率。结构化的思维链约束大模型使用程序结构(例如:顺序、分支和循环结构)去组织思维过程,引导大模型从程序语言的角度去思考如何解决需求。实验结果表明:结构化的思维链稳定地超越了之前的工作(例如:标准的思维链),进一步提升了大模型在代码生成上的性能。
论文链接:arxiv.org/pdf/2305.06599.pdf
大型语言模型(下文称为:大模型)在代码生成上表现出了强大的能力。用户的输入是一条 prompt,其中包括若干个演示样例(需求 – 代码)和一个新的需求。大模型基于 prompt 自动地为新需求生成源代码。
现有研究发现:prompt 的设计对于大模型的性能影响较大。因此,如何设计有效的 prompt 来提升大模型在代码生成上的准确率是软件工程和人工智能领域的一个研究热点。
Chain-of-Thought Prompting (下文称:CoT prompting)是一种用于设计 prompt 的新兴方法,在代码生成上取得了目前最好的准确率网页链接
版权声明: 发表于 2023-09-10 9:19:10。
转载请注明:大模型写代码能力突飞猛进,北大团队提出结构化思维链SCoT任何简单或复杂的算法都可以由顺序结构、选择结构和循环结构这三种基本结构组合而成。大型语言模型(下... | AI 時.空 | AiTime.Space
转载请注明:大模型写代码能力突飞猛进,北大团队提出结构化思维链SCoT任何简单或复杂的算法都可以由顺序结构、选择结构和循环结构这三种基本结构组合而成。大型语言模型(下... | AI 時.空 | AiTime.Space
暂无评论...