AI天才杨植麟交卷大模型产品,特点:长长长长长
千亿参数大模型,支持输入的长文本首次达20万x字!
在任何规模的大模型产品化队伍中,这个长度堪称目前的全球最长。
用数据说话:目前Claude支持最大长文本为100k(约8万字),而GPT-4则是32k(约2.5万字)。20万字,分别是它们的2.5倍和8倍。
这便是清华叉院助理教授杨植麟,创业大模型后拿出的第一份成绩单。
就在10月9日下午,杨植麟创业AI公司月之暗面(Moonshot AI)推出了首款大模型产品智能助手Kimi Chat。
核心被强调的亮点是:其背后虽是体量为千亿参数的“庞然大物”,但却可以hold住输入20万汉字,不管是《三体》还是《马斯克传》都能随便读。
据介绍,拓展上下文窗口长度,只是月之暗面“登月计划”的第一步;这一步的落实,实则是为下一步落子多模态提供基础——该公司预计在明年对外开放多模态版本产品。
而公司的最终目标,是在大模型领域做To C超级应用。
杨植麟身上的光环很多。
除了是清华叉院助理教授外,还有FAIR、Google Brain的工作履历,是Transformer-XL和XLNet工作一作,发明的算法曾在30多项AI标准任务取得SOTA,师从苹果公司AI负责人Ruslan Salakhutdinov、清华唐杰……
种种光环加持下,3月被曝创业后,月之暗面就自带一层神秘面纱。而后,红杉孵化式支持,循序完成两轮共计近20亿元融资,更是让公司获得了格外多的注目。
如今,这家公司首次公开亮相,回应了更多外界的议论。
“参数和上下文窗口长度共同决定模型效果”
现场演示时,量子位关注到,由于支持20万字长文本,月之暗面智能助手Kimi Chat有几点新花样网页链接
版权声明: 发表于 2023-10-11 8:17:22。
转载请注明:AI天才杨植麟交卷大模型产品,特点:长长长长长千亿参数大模型,支持输入的长文本首次达20万x字!在任何规模的大模型产品化队伍中,这个长度堪称目前的全球最长... | AI 時.空 | AiTime.Space
转载请注明:AI天才杨植麟交卷大模型产品,特点:长长长长长千亿参数大模型,支持输入的长文本首次达20万x字!在任何规模的大模型产品化队伍中,这个长度堪称目前的全球最长... | AI 時.空 | AiTime.Space
暂无评论...