数学能力超过ChatGPT!上海交大计算大模型登开源榜首国产数学大模型,能力已经超过了ChatGPT!最新榜单中,上海交大GAIR实验室出品的Abel专有大模型:准确率高达...
数学能力超过ChatGPT!上海交大计算大模型登开源榜首
国产数学大模型,能力已经超过了ChatGPT!
最新榜单中,上海交大GAIR实验室出品的Abel专有大模型:
准确率高达83.6%,在开源模型中位列第一。
据团队介绍,该模型是用挪威数学家尼尔斯·阿贝尔(Niels Abel)的名字命名的,以此向阿贝尔在代数和分析方面的开创性工作致敬。
在GSM8k数据集上,70B参数量的Abel碾压所有开源模型,还超过了ChatGPT。
甚至在新数据集TALSCQ-EN上,Abel的表现比GPT-4还要强。
而实现这样效果的Abel,成分可以说是十分“单纯”:
没有使用工具
没有使用数学领域的大规模预训练数据
没有使用奖励模型
没有使用RLHF
仅使用有监督精调(Supervised Fine-tuning,SFT)
那么Abel的效果究竟怎么样呢?
成绩超越开源模型SOTA
这里我们选择同样是开源的Llama-2来和Abel对比。
首先来看下这个鸡兔同笼问题的变体:
Brown由牛和鸡一共60只,鸡的数量是牛的两倍,一共有多少条腿?
这道题Llama-2出师不利,而且不是计算错误,是逻辑上就有问题:
Abel则成功地解决了这个问题。网页链接
版权声明: 发表于 2023-09-23 10:15:34。
转载请注明:数学能力超过ChatGPT!上海交大计算大模型登开源榜首国产数学大模型,能力已经超过了ChatGPT!最新榜单中,上海交大GAIR实验室出品的Abel专有大模型:准确率高达... | AI 時.空 | AiTime.Space
转载请注明:数学能力超过ChatGPT!上海交大计算大模型登开源榜首国产数学大模型,能力已经超过了ChatGPT!最新榜单中,上海交大GAIR实验室出品的Abel专有大模型:准确率高达... | AI 時.空 | AiTime.Space
暂无评论...