全都不及格!GPT-4仅排第三!斯坦福100页论文给大模型透明度排名试问百模大战的当下,谁家大模型的透明度最高?(例如模型是如何构建的、如何工作、用户如何使用...

贴文 1个月前
1.2K 0

全都不及格!GPT-4仅排第三!斯坦福100页论文给大模型透明度排名

试问百模大战的当下,谁家大模型的透明度最高?

(例如模型是如何构建的、如何工作、用户如何使用它们的相关信息。)

现在,这个问题终于有解了。

因为斯坦福大学HAI等研究机构最新共同发布了一项研究——

专门设计了一个名为基础模型透明度指标(The Foundation Model Transparency Index)的评分系统。

它从100个维度对国外10家主流的大模型做了排名,并在透明度这一层面上做了全面的评估。

结果可谓是大跌眼镜!

若是以60分作为及格线,那么“参赛”的大模型们可以说是全军覆没,没有一个及格的……

来感受下这个feel:

排名第一的Llama 2,分数仅为54;紧随其后的便是BLOOMZ,得分53。

而GPT-4分数仅仅为48,排名第三;来自亚马逊的Titan Text成绩垫底,仅取得12分。

不仅如此,在斯坦福HAI官方的博客中,负责人Rishi Bommasani直言不讳地把OpenAI单拎出来说道:

基础模型领域的公司变得越来越不透明。

例如名字带“open”的OpenAI曾明确表示,与GPT-4相关的大多数信息将不会公开。

总而言之,团队认为大模型发展到现阶段,它们的透明度是一个非常重要的关键点,直接与是否可信挂钩。

而且更深层次的,他们认为这也从侧面反映了人工智能行业从根本上缺乏透明度。

100多页论文研究模型透明度
那么这个排名到底是怎么来的?网页链接

暂无评论

暂无评论...