性能全面超越LLaMA2,0门槛商用,这个国产大模型要改变开源竞争格局了开源大模型领域的进化节奏,越来越快。今年 7 月,Meta 开源了 LLaMA2,以强大的性能和免费...

贴文 1个月前
1.4K 0

性能全面超越LLaMA2,0门槛商用,这个国产大模型要改变开源竞争格局了

开源大模型领域的进化节奏,越来越快。
今年 7 月,Meta 开源了 LLaMA2,以强大的性能和免费商用的特质,受到了开发者和众多企业的拥护。基于 LLaMA2 各个版本微调的落地成果不断涌现,大模型领域的竞争格局迅速发生变化。
业界普遍认为,在开源大模型的攻势下,一部分闭源大模型厂商的「护城河」将慢慢瓦解。难以负担大模型 API 高昂调用成本的中小企业和开发者,有了另一条更具性价比的出路。
与此同时,国产大模型开源力量也在技术上不断追赶加速。
近日,一项重磅开源吸引了领域内的高度关注:昆仑万维大语言模型「天工」Skywork-13B 系列正式宣布开源。
之所以说是「重磅」,是因为 Skywork-13B 不仅在 C-Eval,MMLU 等基准测试上全面超越了 LLaMA2-13B,而且这次开源范围包括了 Skywork-13B-Base 模型、Skywork-13B-Math 模型以及每个模型的量化版模型。此外,昆仑万维还同时开源了 600GB、150B Tokens 的高质量中文语料数据集「Skypile/Chinese-Web-Text-150B」。昆仑万维还宣布,Skywork-13B 系列大模型将全面开放商用 —— 开发者无需申请,0 门槛商用。

Skywork-13B 下载地址(Model Scope):modelscope.cn/organization/skywork
Skywork-13B 下载地址(Github):github.com/SkyworkAI/Skywork
技术报告地址:arxiv.org/pdf/2310.19341.pdf

昆仑万维董事长兼 CEO 方汉在云栖大会 AI 大模型新势力分论坛现场分享 Skywork-13B 系列大模型开源与 AI 场景应用落地
国产开源大模型全面赶超之路
这次 Skywork-13B 系列的发布,可以说是国产开源大模型的又一力作。
Skywork-13B-Base 模型基于高质量清洗过滤的 3.2 万亿个多语言(主要是中文和英文)和代码数据的训练,在多种评测和各种基准测试上全面超越了 LLaMA2-13B 等开源大模型,在同等参数规模下为最优水平 网页链接

暂无评论

暂无评论...