过去的一年,开源大模型真的比闭源的大模型取得了更多的进展和成就么?闭源大模型的成功带动了开源大模型的繁荣,至少过去这一年是这样。如果没有ChatGPT(GPT-3...

贴文 2个月前
610 0

过去的一年,开源大模型真的比闭源的大模型取得了更多的进展和成就么?

闭源大模型的成功带动了开源大模型的繁荣,至少过去这一年是这样。

如果没有ChatGPT(GPT-3.5/GPT-4)的横空出世,就不会突然有这么多科技公司加入研发大模型的赛道,更不会形成后来“百模大战”的行业形态。

现在不论国内国外,Top级的大模型都是闭源的,比如OpenAI的GPT-4,谷歌的PaLM/Gemini,Anthropic的Claude;国内百度的文心一言、讯飞、阿里等各大厂的能力最强的大模型也都是闭源的。

开源模型虽然也取得了很多进展,比如Llama系列、前不久的Mixstral-8x7B,国内开源的Qwen系列、Baichuan系列等等也都有可圈可点之处,但是综合能力距离目前最强的GPT-4还有一定的差距。

所以不管是从模型能力的角度看,还是从应用/产品化影响力的角度看,事实就是开源的没有干过闭源的。

而从技术发展的方面看就很难说了,毕竟人家都闭源了,就是不想告诉行业他们用了哪些技术和方法,所以也没法比较。

当然,开源模型和闭源模型走的不是一条路,两者其实也不太适合从单一的维度进行比较。

1、闭源模型主要是以产品的形态提供给普通用户(个人/企业)使用的。

大模型的研发耗费包括人力、时间和资金等在内的巨大成本,而现在市场对大模型的需求正是最大的时候,一个成功的模型可以直接能转化为收益,所以企业把能力强的模型攥在自己手里也无可厚非,它是企业给留给自己的后路。

2、开源模型更多的是面向科研人员、社区开发者或小的研发团队的。

从开发者的角度来说。开源模型让那些没有足够资源自己train大模型的个人用户、中小企业、以及大多数科研人可以基于此做进一步的研发和理论研究,开发者或企业可以使用开源模型开发下游应用,普通用户感兴趣也可以在线或本地部署,不用担心使用闭源模型产品或API带来的数据泄露风险。

从行业的角度来说。开源模型繁荣了整个行业生态,模型提供方和使用方共同促进、交流,这是一个不断正反馈的过程。

总之,开源的精神和开源大模型对社区的贡献毫无疑问是值得肯定的。

相比之下,现在的OpenAI确实对不起它的这个名字了。

暂无评论

暂无评论...