10人俩月搞出大模型!一年16篇顶会论文:市面上做得好的都没开源一家今年5月份成立在深圳的公司,团队至今不到10人。他们要做的却不是小事:挑战AGI。底气在哪?...
10人俩月搞出大模型!一年16篇顶会论文:市面上做得好的都没开源
一家今年5月份成立在深圳的公司,团队至今不到10人。
他们要做的却不是小事:挑战AGI。
底气在哪?一看过往履历,二看现在赛道的成绩。
这几个人近一年中,累计在CVPR、ICML、ECCV等顶会上发表16篇大模型相关论文,其中一篇还拿下了顶会ACL 2023的最佳论文提名。
创业后的成绩如何?成立两个月后,所训模型杀入C-Eval榜单前三,中文能力击败ChatGPT和Claude-v1.3。
这就是共生矩阵拿出的成绩。
并且旗下模型GS-LLM七月末首次上榜至今,在C-Eval榜单65个上榜选手中,一直处于第一梯队。
那么,共生矩阵是谁?
10个人挑战AGI
共生矩阵,目标立足自研AGI技术,打造行业数据精炼工厂。
团队所依托的主要是自研大模型GS-LLM。
模型参数规模从7B-130B不等,能根据用户的实际需求量体裁衣。
在C-Eval上占据一席之地的有基于GS-LLM的两个版本,一个是百亿参数版本的GS-LLM-Beta,另一个是不足百亿规模的mini版本GS-LLM-Beta-Mini。
推出mini版本的原因是发现不少使用者,原有的运作环境(甚至云端环境)不足以支撑大体量的本地部署。
测试结果发现,几十亿版本的GS-LLM-Beta就可以发挥不错的性能,在C-Eval上最好排名达到第6。
能够常驻C-Eval榜单前列的原因之一,是共生矩阵搭建了一套完全独立的训练框架,对整个训练构成比较完备的技术支撑网页链接
版权声明: 发表于 2023-09-14 8:16:01。
转载请注明:10人俩月搞出大模型!一年16篇顶会论文:市面上做得好的都没开源一家今年5月份成立在深圳的公司,团队至今不到10人。他们要做的却不是小事:挑战AGI。底气在哪?... | AI 時.空 | AiTime.Space
转载请注明:10人俩月搞出大模型!一年16篇顶会论文:市面上做得好的都没开源一家今年5月份成立在深圳的公司,团队至今不到10人。他们要做的却不是小事:挑战AGI。底气在哪?... | AI 時.空 | AiTime.Space
暂无评论...