谷歌Gemini技术报告出炉,作者多达900余人备受期待的谷歌 Gemini 技术报告完整版,今天终于出炉了。两周前,人们兴奋于谷歌提出的「原生多模态大模型」Gemini,...

贴文 2个月前
3.3K 22

谷歌Gemini技术报告出炉,作者多达900余人

备受期待的谷歌 Gemini 技术报告完整版,今天终于出炉了。

两周前,人们兴奋于谷歌提出的「原生多模态大模型」Gemini,其宣称超越 GPT-4 的强大性能,以及对于图像、视频等领域的理解能力让人们似乎看到了未来。不过由于谷歌演示的 demo 涉嫌夸大效果,Gemini 又很快陷入了争议。

但作为生成式 AI 领域最近的重要进展,人们对于 Gemini 的期待越来越高,有团队很快进行研究发了测试论文。今天发布的 64 页技术报告,或许可以为我们的许多疑惑进行更加直观的解释。

这篇技术报告《Gemini: A Family of Highly Capable Multimodal Models》作者包括 Jeff Dean、Oriol Vinyals、Koray Kavukcuoglu、Demis Hassabis 等一众谷歌研究大佬,另外还有谢尔盖・布林这样的公司联合创始人。

论文链接:arxiv.org/abs/2312.11805

另外,该文章的作者数量也夺人眼球 ——941 个人,搞得 arXiv 网页都有点卡:

一页显示不过来。

从文章第 35 页起,谷歌开始罗列所有「贡献者」,从 Team Leader 到主要贡献者,再到贡献者分门别类写到了第 45 页,看起来之前各路媒体说谷歌在 Gemini 上投入了大量工程师,的确是没说错。

谷歌表示,在每个任务方向上,人们对 Gemini 所做的贡献是同等重要的,名字按随机顺序列出。Gemini 是一项跨谷歌内部多团队的工作,成员来自 Google DeepMind、Google Research、Knowledge and Information、Core ML、Cloud、Labs 等部门 网页链接

22 条评论