阿里140亿大模型开源!10项任务超340亿Llama 2,Demo在线可玩阿里又开源大模型了!这次是纯粹的大语言模型,相比上一次的70亿,新模型的参数量来到了140亿。它名...

贴文 2个月前
1.1K 0

阿里140亿大模型开源!10项任务超340亿Llama 2,Demo在线可玩

阿里又开源大模型了!

这次是纯粹的大语言模型,相比上一次的70亿,新模型的参数量来到了140亿。

它名叫Qwen-14B,一上来就在一系列任务榜单中全部取得了第一,直接超过了Meta的340亿参数Llama 2版本。

Qwen-14B的训练数据达到3万亿tokens,不仅中英文都来得,序列长度也达到了8192。

用法也是老样子,完全开源,而且免费可用,目前在魔搭社区上已经可以试玩到Demo版本。

看起来,阿里的Qwen颇有点对标Meta的Llama,要搞出一整套“国内大模型开源全系列”那味了。

那么,Qwen-14B的效果究竟怎么样呢?我们这就试一试。

10个榜单超越340亿Llama 2
先来看看Qwen-14B的整体表现如何。

虽然Llama 2取得了一系列不错的“战绩”,不过至少官方提供的版本中,还不太具备说中文的能力。

因此,我们先来看看Qwen-14B的中文能力如何,然后再试试它在其他学科上的水平网页链接

暂无评论

暂无评论...