12项性能位居第一,中国最接近GPT-4的大模型来了!现已全面开放服务!
中国何时会有一个大模型,能以极强的泛化能力,创建各种智能体、成为人类真正的助手?
在各大科技公司卷了半年的生成式AI热潮趋于冷静期的当下,这是一个极其值得思考的问题。
很多人会说,目前可能只有被称为业界标杆的GPT-4才能胜任,甚至对它加以“唯一”这样的头衔。
而与此同时,着眼于国内,即使这半年来各个大模型玩家争先恐后抢着落地,但“需要两到三年才能追赶GPT-4”的声音也是甚上尘嚣。
然而就在最近,一个名为InternLM-123B的国产预训练大语言模型,似乎将这种差距感极大地给拉近了一些。
因为在一场顶尖大模型“同台竞技”中,它的表现实属有些亮眼:
• 12项成绩排名第一。
• 综合实力全球第二,部分成绩超越GPT-4。
• 绝大部分性能超越ChatGPT和LLaMa-2-70B。
据了解,这个评测是在全球51个知名评测集(包括MMLU、AGIEval、ARC、CEval、Race、GSM8K等)、共计30万道问题集合上测试所得到的结果。
而细看评测内容,不难发现在所有的阅读理解、绝大部分推理和常识问答方面,InternLM-123B拿到了绝对的风头。
那么这个国产大模型到底是什么来头?网页链接
版权声明: 发表于 2023-09-01 9:13:45。
转载请注明:12项性能位居第一,中国最接近GPT-4的大模型来了!现已全面开放服务!中国何时会有一个大模型,能以极强的泛化能力,创建各种智能体、成为人类真正的助手?在各... | AI 時.空 | AiTime.Space
转载请注明:12项性能位居第一,中国最接近GPT-4的大模型来了!现已全面开放服务!中国何时会有一个大模型,能以极强的泛化能力,创建各种智能体、成为人类真正的助手?在各... | AI 時.空 | AiTime.Space
暂无评论...