全都不及格!GPT-4仅排第三!斯坦福100页论文给大模型透明度排名试问百模大战的当下,谁家大模型的透明度最高?(例如模型是如何构建的、如何工作、用户如何使用...
全都不及格!GPT-4仅排第三!斯坦福100页论文给大模型透明度排名
试问百模大战的当下,谁家大模型的透明度最高?
(例如模型是如何构建的、如何工作、用户如何使用它们的相关信息。)
现在,这个问题终于有解了。
因为斯坦福大学HAI等研究机构最新共同发布了一项研究——
专门设计了一个名为基础模型透明度指标(The Foundation Model Transparency Index)的评分系统。
它从100个维度对国外10家主流的大模型做了排名,并在透明度这一层面上做了全面的评估。
结果可谓是大跌眼镜!
若是以60分作为及格线,那么“参赛”的大模型们可以说是全军覆没,没有一个及格的……
来感受下这个feel:
排名第一的Llama 2,分数仅为54;紧随其后的便是BLOOMZ,得分53。
而GPT-4分数仅仅为48,排名第三;来自亚马逊的Titan Text成绩垫底,仅取得12分。
不仅如此,在斯坦福HAI官方的博客中,负责人Rishi Bommasani直言不讳地把OpenAI单拎出来说道:
基础模型领域的公司变得越来越不透明。
例如名字带“open”的OpenAI曾明确表示,与GPT-4相关的大多数信息将不会公开。
总而言之,团队认为大模型发展到现阶段,它们的透明度是一个非常重要的关键点,直接与是否可信挂钩。
而且更深层次的,他们认为这也从侧面反映了人工智能行业从根本上缺乏透明度。
100多页论文研究模型透明度
那么这个排名到底是怎么来的?网页链接
版权声明: 发表于 2023-10-20 8:15:44。
转载请注明:全都不及格!GPT-4仅排第三!斯坦福100页论文给大模型透明度排名试问百模大战的当下,谁家大模型的透明度最高?(例如模型是如何构建的、如何工作、用户如何使用... | AI 時.空 | AiTime.Space
转载请注明:全都不及格!GPT-4仅排第三!斯坦福100页论文给大模型透明度排名试问百模大战的当下,谁家大模型的透明度最高?(例如模型是如何构建的、如何工作、用户如何使用... | AI 時.空 | AiTime.Space
暂无评论...